Vous êtes sur la page 1sur 99

Messaggi e informazione

Non è facile definire esattamente cosa sia l’informazione pura, noi conosciamo
principalmente l’informazione codificata in un messaggio che viene trasmesso in un
canale di comunicazione tra un emittente ed un ricevente.
Siamo ormai abituati al computer e alle linee di trasmissione dati in cui
l'informazione è codificata in stringhe di bit, una successione di si e di no, tale per cui
è possibile interpretare un messaggio trasmesso o memorizzato come parole di un
testo o come una immagine o come un suono.
Il messaggio viene codificato e trasmesso tra un emettitore ed un ricevitore in un
canale di trasmissione alla massima velocità possibile; un aspetto spesso ignorato ma
determinante riguarda il sincronismo tra chi invia il messaggio e chi lo riceve, infatti
è prassi usuale accordarsi preventivamente sulla velocità di trasmissione del
messaggio, un messaggio che arriva troppo velocemente non consente al ricevente di
decodificarlo con sufficiente rapidità e questo provoca un blocco nella trasmissione
dei dati. Esiste un aspetto di sincronicità nelle trasmissione dei messaggi.
Spesso l'informazione assume aspetti strutturali come per esempio nei puzzle,
l'immagine completa finale visibile al termine del lavoro di incastro dei vari pezzi
componenti è già presente fin dall'inizio ma solo dopo un paziente lavoro di selezione
e controllo delle corrispondenze contenute nella forma frammentata dei singoli pezzi
è possibile contemplare l'informazione finale. Il disegno nel puzzle si forma
lentamente incastro dopo incastro analizzando le singole parti e le relative relazioni,
occorre una analisi combinatoriale delle singole possibilità consentite dai pezzi.
Chi compone un puzzle utilizza semplici manipolazioni di simboli ma non conosce il
risultato finale se non alla fine del processo, la composizione procede analizzando le
caratteristiche di ciascun pezzo contenente una frazione dell'informazione globale e
utilizzando le relazioni spaziali e di continuità che di volta in volta è possibile
rintracciare nei singoli pezzi e nella parte di disegno che si va completando.
Possiamo costruire un sistema di comunicazione composto da un trasmettitore un
canale di trasmissione e un ricevitore; tutti i messaggi trasmessi sono codificati e
decodificati ma supponiamo che ad un certo punto vengano trasmessi messaggi non
interpretabili dal ricevitore, in tal caso tutto l'apparato non funziona, il sistema
diventa inutilizzabile. L'informazione trasmessa deve in una certa misura essere già
nota al ricevitore, questo sembra essere un vero e proprio paradosso!
Immaginiamo di costruire, con ingenti investimenti e risorse, un programma di
risoluzione generale di problemi; questo programma sarebbe in grado di decidere in
merito a complessi problemi che gli vengano posti; ma nel caso in cui noi ponessimo
un problema indecidibile ci troveremmo di nuovo nel caso di insolubilità del
problema e il programma girerebbe a vuoto per l'intera eternità con grande spreco di
risorse e delusione per gli ideatori.

1
Gödel ha dimostrato che esiste sempre, per ogni sistema formale, una proposizione
che è vera ma non dimostrabile.
Le conseguenze di questa circostanza dovrebbero metterci in guardia nel tentativo di
costruire sistemi onnicomprensivi del tipo del risolutori di problemi generali.
In un sistema di comunicazione ciò che viene trasmesso non è altro che un insieme di
simboli selezionati da un certo repertorio definito a priori.
Tutto ciò che può essere comunicato risiede in nuce nelle possibilità combinatoriali
concesse dai simboli del repertorio predefinito.
La comunicazione risiede in sostanza nel processo di selezione di una informazione
tra quelle possibili e il messaggio più improbabile è anche il più significativo.
Bisogna dire che il numero dei messaggi comunicabili può essere veramente notevole
ed inoltre il processo di interpretazione può svilupparsi a diversi livelli di significato.
Mentre parliamo codifichiamo i nostri messaggi in parole.
Le parole che adoperiamo si adattano alle nostre necessità quotidiane.
Non è possibile, infatti, assegnare un termine ad ogni oggetto o evento diverso; se
così fosse, dovremmo continuamente coniare nuove parole e le comunicazioni
diventerebbero praticamente impossibili. Per l'esistenza stessa di una lingua, occorre
indicare con una unica parola una molteplicità di cose o di eventi. Viene spontaneo
dire che l'uomo e il cavallo corrono e fa comodo parlare di una corsa in banca, della
corsa di uno stantuffo o di una corsa ciclistica.
I termini adoperati nelle descrizioni scientifiche sono sovente presi dal linguaggio
corrente. In fisica si utilizzano termini come forza, massa, velocità e attrazione.
Adoperati nella scienza, tuttavia, tali termini acquistano un significato particolare,
ristretto e spesso nuovo. Non possiamo usare i termini della scienza liberamente
come facciamo invece nel linguaggio quotidiano, tali termini si riferiscono a concetti
ben precisi. Nella matematica grande cura e notevole sforzo vengono profusi nel
tentativo di definire rigorosamente i termini utilizzati.
La teoria delle comunicazioni, così come è stata sviluppata a partire dalle
comunicazioni elettriche, è essenzialmente matematica e assai generale, essa affronta
i problemi in maniera astratta. Essa fornisce, col bit, una misura universale di quantità
di informazione in termini di scelta o indeterminazione: quando si specifica, o si
conosce, la scelta tra due alternative equiprobabili, che potrebbero essere messaggi o
numeri da trasmettere, si implica un bit di informazione. La teoria delle
comunicazioni ci dice quanti bit al secondo si possono inviare in certi canali di
comunicazione, sulla scorta di descrizioni piuttosto astratte delle loro proprietà. Da
essa apprendiamo come misurare la velocità con la quale una sorgente di messaggi,
per esempio un individuo che parla o che scrive, genera informazioni; come
rappresentare, o codificare, i messaggi provenienti da una data sorgente al fine di
ottenere la migliore trasmissione in un particolare tipo di canale, quale è un circuito
elettrico, e infine come evitare errori di trasmissione.
Molte delle scoperte più generali e potenti della scienza sono derivate non dallo
studio dei fenomeni come si manifestano in natura, bensì dallo studio dei fenomeni
nei dispositivi creati dall'uomo o in altri termini nei prodotti della tecnologia. Ciò è
dovuto al fatto che i fenomeni che si producono nelle macchine dell'uomo sono più
2
semplici e ordinati di quelli che si hanno in natura e sono questi fenomeni
semplificati che l'uomo comprende più agevolmente. Per esempio la conoscenza
dell'elettricità deriva dallo studio dei manufatti dell'uomo piuttosto che dallo studio
dei fulmini. Analogamente la teoria delle comunicazioni affonda le sue radici nei
fenomeni semplificati e in apparenza facilmente intelligibili della telegrafia.
Nella teoria delle comunicazioni noi consideriamo una sorgente di messaggi che può
produrre, in una data occasione, uno qualsiasi di molti messaggi possibili. La quantità
di informazione trasmessa dal messaggio aumenta con l'aumentare dell'incertezza sul
messaggio prodotto. Un messaggio scelto fra dieci possibili trasmette una quantità di
informazione minore di quella trasmessa da un messaggio scelto fra un milione di
messaggi possibili. L'entropia della teoria delle comunicazioni è una misura di questa
incertezza e l'incertezza, o entropia, è assunta come misura della quantità di
informazione trasmessa con un messaggio da una sorgente. Tanto maggiore è la
nostra conoscenza sul messaggio che sarà prodotto dalla sorgente, tanto minore sarà
l'incertezza, minore l'entropia e, di conseguenza, minore l'informazione trasmessa.
Il concetto di entropia in fisica è del tutto diverso anche se possiede una equivalente
formulazione matematica.
In fisica, l'entropia è legata alla possibilità di trasformare l'energia termica in energia
meccanica. Se durante un processo l'entropia non varia, il processo è reversibile; se
invece aumenta, l'energia disponibile diminuisce. La meccanica statistica interpreta
un aumento di entropia come una diminuzione di ordine o, sotto una certa
interpretazione, come una diminuzione della nostra conoscenza.
A causa di questa doppia definizione di entropia viene da associare all'informazione
due concetti distinti, il concetto di "conoscenza" di uno stato fisico e il concetto di
"incertezza", o soluzione dell'incertezza, di un messaggio trasmesso.
Quando si parla di teoria delle comunicazioni si fa riferimento al contributo di
Shannon. Il nome di Shannon è legato alla ricerca di una codificazione dei messaggi,
scelti da un insieme noto, che permetta di trasmetterli con precisione e uniformità in
presenza di rumore. Nel problema trattato da Shannon possiamo scegliere il modo in
cui rappresentiamo il messaggio, tipicamente un segnale elettrico, ad esempio il
numero dei valori di corrente e il loro ritmo di trasmissione. Il problema non è quindi
come trattare un segnale e un rumore per ottenere la migliore "comprensione" del
segnale, bensì quale specie di segnale occorre inviare in modo da convogliare meglio
i messaggi di un dato tipo su un circuito disturbato di tipo particolare.
Il problema di una codificazione efficiente e le sue conseguenze costituiscono il
centro della teoria dell'informazione.
Il modello matematico usato da Shannon per rappresentare una sorgente di messaggi
è la sorgente ergodica.
Per capire che cosa si intende per sorgente ergodica vediamo anzitutto che cosa è una
sorgente stazionaria.
Consideriamo una sorgente che produca sequenze di messaggi tali che la probabilità
del messaggio sia la stessa indipendentemente dall'insieme di messaggi considerato
nella sequenza, una tale sorgente è stazionaria.
La stazionarietà di una sorgente esclude qualsiasi variazione col tempo.
3
Consideriamo ora un infinito insieme di sequenze.
Se alle varie condizioni iniziali, usate nel formare l'insieme delle sequenze di
messaggi prodotti dalla sorgente, possiamo assegnare delle probabilità tali che
qualsiasi rilevazione statistica ottenuta facendo una media dell'insieme sia
indipendente dall'intervallo in cui è stata fatta la media stessa, allora diremo che la
sorgente è stazionaria.
Abbiamo pertanto una media di insieme eseguita sull'insieme delle sequenze e una
media temporale eseguita su una unica sequenza.
I valori della media temporale e della media di insieme possono differire.
Quando una sorgente è stazionaria e ogni possibile media di insieme è uguale alla
media temporale corrispondente, allora si dice che la sorgente è ergodica.
I teoremi della teoria dell'informazione si applicano alle sorgenti ergodiche e le loro
dimostrazioni poggiano sull'ipotesi che la sorgente dei messaggi sia ergodica.
Una sorgente ergodica è un tipo particolarmente semplice di sorgente probabilistica o
stocastica di messaggi e i processi semplici sono più facili da trattare
matematicamente di quanto non siano i processi complessi. La semplicità di per sé
non basta e la sorgente egodica non avrebbe interesse nella teoria delle
comunicazioni se, oltre ad essere semplice, non fosse anche ragionevolmente pratica
e di utilizzo generale.
Un essere umano non può essere considerato come una macchina ipotetica con un
comportamento prevedibile e matematicamente definito.
Inoltre le probabilità calcolate su un testo inglese risultano diverse da quelle calcolate
su un testo francese; pertanto un inglese ed un francese considerati congiuntamente
non costituirebbero una sorgente ergodica.
La parola e lo scritto come sorgenti ergodiche non si identificano completamente col
mondo reale; tuttavia vi si avvicinano sufficientemente da poter essere trattate nella
teoria dell'informazione in una modalità che può essere utile.
La differenza tra una sorgente esattamente ergodica prevista nella teoria matematica
delle comunicazioni e le sorgenti di messaggi solo approssimativamente ergodiche
del mondo reale deve essere tenuta presente, specie quando si tratta di applicare le
conclusioni della teoria matematica ai problemi reali.
Nel mondo reale l'uomo sperimenta e percepisce i messaggi in una modalità molto
vasta e multiforme.
Esiste certamente una regolarità, un ripresentarsi e stabilizzarsi dello stimolo, ma a
volte l'informazione giunge in una maniera inattesa ed assolutamente insolita.
Un piccolo indizio con probabilità quasi nulle può portare una notevole quantità di
informazione. La mente consciamente ed anche inconsciamente riesce a cogliere e ad
interpretare questi messaggi che giungono al soggetto in maniera apparentemente
casuale. L'elaborazione e la comprensione dei messaggi coinvolge il soggetto nelle
sue facoltà più recondite del processo di comunicazione.
L'informazione può codificarsi in una maniera assolutamente originale, dal punto di
vista della teoria dell'informazione un tale messaggio risulterebbe incomprensibile,
eppure la mente sembra essere in grado di comprendere messaggi ti questo tipo.
Per comprendere un messaggio occorre uno schema interpretativo.
4
Nella teoria dell'informazione lo schema è dato a priori, il messaggio trasmesso deve
appartenere ad un ben determinato insieme di messaggi possibili predefiniti.
La mente riesce invece ad ampliare il proprio schema interpretativo sulla base
dell'esperienza e della logica.
Se non ho mai visto una mela non potrò comprendere il messaggio "dammi una
mela", ma esiste la possibilità, usando un canale trasmissivo per esempio la vista, di
definire e interpretare la parola "mela", da quel momento in poi la frase detta diviene
significativa e comprensibile.
I messaggi nel mondo reale appartengono quindi ad un insieme in evoluzione, che
dispone di enormi potenzialità di ampliamento.
Esiste inoltre un aspetto di sincronicità tra i diversi canali sensoriali di cui
disponiamo che ci consente di correlare le parole e gli atti linguistici in genere a
esperienze, sensazioni, emozioni, oggetti e idee sperimentate dalla mente.
Il cervello tiene in gran conto le sincronicità e a volte queste si verificano anche nel
mondo esterno, anche se ovviamente è sempre la mente che le interpreta come tali.
Il fatto che certi eventi siano così significativi potrebbe dipendere da una reale legge
di natura. Dal punto di vista dell'informazione trasmessa certamente tali eventi sono
carichi di significato, un significato che non è possibile misurare ma che tuttavia può
influenzare profondamente il comportamento delle persone.
Nelle relazioni umane i messaggi trasmessi dipendono anche dal contesto e dal tono
con cui sono scambiati. Per esempio una parola può avere un senso opposto a quello
usuale quando viene proferita con particolare enfasi o carica emotiva.
Da un certo punto di vista il significato di un messaggio risiede nella correlazione con
una costellazione di informazioni ad esso associate.
Sono le relazioni tra termini quelle che noi cogliamo quando interpretiamo un
messaggio, e se è vero che solo quando il messaggio arriva alla coscienza possiamo
dire di aver attribuito ad esso un significato, dal punto di vista di una macchina la
risposta che essa fornisce ad un messaggio può essere intesa come una
interpretazione, ovvero una attribuzione di significato.
Per l'uomo il significato di un messaggio può coinvolgere un numero enorme di
eventi ed oggetti del mondo reale, per una macchina il significato non può essere
altro che un insieme di regole e correlazioni presenti nella propria struttura.
Una sorgente di informazione può essere costituita da un testo inglese, da una
persona che parla, dal suono di un'orchestra, da fotografie, da pellicole
cinematografiche o dalle scene su cui si può puntare una telecamera. La teoria
dell'informazione attribuisce alle sorgenti le proprietà di sorgenti ergodiche di lettere,
numeri, caratteri o segnali elettrici. La teoria della informazione si prefigge
principalmente di studiare in che modo tali sequenze di caratteri e tali segnali possano
essere più efficacemente codificati per la trasmissione, che avviene di norma con
mezzi elettrici.
Il primo passo nel problema della trasmissione di un messaggio risiede nella sua
codifica tramite un repertorio di simboli definiti.
I codici servono per trasportare il messaggio a tutti coloro a cui è destinato.

5
In un tipo di codice denominato cifrario, le lettere del messaggio possono essere
sostituite con lettere o numeri scelti in base a uno schema convenzionale segreto.
L'idea della codificazione, dell'esatta rappresentazione di una cosa mediante un'altra,
compare in molteplici contesti per esempio in alcuni settori della scienza.
I genetisti ritengono che l'intero schema di sviluppo del corpo umano sia tracciato nei
cromosomi delle cellule germinali. Alcuni asseriscono che il testo cifrato consta di
una disposizione lineare ordinata di quattro diverse "lettere" o "basi", nel DNA (acido
desossiribonucleico) costituente il cromosoma. Attraverso il DNA e RNA vengono
sintetizzate le proteine che sono costituite da catene di amminoacidi di una ventina di
specie. Il messaggio cifrato a quattro lettere viene tradotto in un messaggio decifrato
a venti lettere della proteina.
I genetisti ritengono che nel DNA sia contenuta tutta l'informazione sufficiente a
produrre un organismo completamente sviluppato.
I genetisti sono stati portati a tali considerazioni dall'esistenza della teoria
dell'informazione che fornisce una inquadratura generale dei problemi della
codificazione.
Le correnti elettriche che percorrono i circuiti telefonici sono una codificazione della
parola e le onde sonore della parola sono esse stesse una codificazione dei movimenti
dell'apparato vocale che le produce.
Una modalità di codifica molto potente si basa sul codice binario, il bit.
Un bit di informazione corrisponde ad una scelta tra un si e un no, uno 0 e 1, presenza
o assenza di segnale.
Teoricamente combinando stringhe di bit è possibile codificare qualsiasi
informazione.
Anche un segnale continuo, tramite la tecnica del campionamento, può essere
trasformato in una successione di bit.
La forma, una immagine, un suono tutto può essere codificato in questo modo.
Si potrebbe essere indotti a credere che, per la codificazione dei messaggi di una data
sorgente, esista in linea di principio un qualche sistema "ottimo", che richiederà in
media un numero di cifre binarie minore di quello richiesto da qualunque altro
sistema. Se questo è vero è possibile usare il numero medio di cifre binarie necessarie
alla codificazione del segnale come misura della quantità di informazione della
sorgente che ha prodotto il segnale.
Questo è proprio quello che si fa nella teoria dell'informazione.
La codificazione consiste in un senso molto generale nell'operazione di rappresentare
un segnale con un altro; questo implica che possiamo codificare solo una
informazione presente su un supporto fisico dato, il supporto fisico consente
all'informazione di essere trasportata da un punto all'altro nello spazio: questo è
quello che conosciamo e che sappiamo manipolare.
L'ipotesi che si presenta a questo punto è che l'informazione possa essere comunicata
in assenza di qualsiasi supporto fisico.
Nel caso di due particelle elementari accoppiate sembra che lo stato di una di esse
influenzi istantaneamente lo stato della compagna, e questo senza che nessun segnale
sia trasmesso tra una particella e l'altra.
6
Nel caso della forza gravitazionale due corpi dotati di massa "conoscono" la loro
reciproca presenza e si attraggono l'uno con l'altro.
In un certo senso la presenza di un campo gravitazionale contiene l'informazione
sufficiente a far sì che un corpo solido ne sia influenzato.
In alcune teorie fisiche si prospetta l'idea che una tale informazione possa essere
trasportata da particelle particolari chiamate gravitoni, peraltro non ancora rivelati
sperimentalmente.
L'informazione così come viene trattata nella teoria dell'informazione presuppone una
sorgente e un ricevente. La sorgente emette i messaggi e il ricevente li interpreta.
In questo schema si delinea un aspetto psicologico particolare che riguarda
l'esperienza umana: l'informazione deve essere compresa da un essere cosciente.
Due dispositivi possono scambiarsi dei messaggi senza che vi sia alcuna
comprensione dei messaggi stessi, ma per quello che riguarda la comune esperienza
umana due persone che si parlano comprendono ciò che si dicono solo in quanto i
messaggi giungono alle reciproche coscienze.
Consideriamo una sorgente ergodica di messaggi e poniamoci il problema di misurare
la quantità di informazione emessa.
Una prima idea è quella di misurare la quantità di informazione in base al numero di
messaggi trasmessi, ma con quattro linee possiamo inviare, in un dato tempo, un
numero quadruplo di cifre che non in una sola linea. Sembra ragionevole supporre
che con quattro linee dovremmo essere in grado di inviare una quantità di
informazione quattro volte maggiore. Ne consegue che dovremmo misurare
l'informazione in base al numero delle cifre binarie componenti il cifrario piuttosto
che in base al numero dei diversi messaggi che le cifre binarie possono formare.
In altri termini la quantità di informazione andrebbe misurata non in base al numero
dei messaggi possibili, ma in base al logaritmo di questo numero.
La teoria delle comunicazioni introduce una misura per la quantità di informazione
basata proprio su tale criterio.
Questa misura è denominata entropia.
L'entropia della teoria delle comunicazioni è misurata in bit.
L'entropia di una sorgente è di tanti bit per messaggio e, in particolare, se la sorgente
produce i simboli ad un ritmo costante, possiamo dire che essa ha una entropia di
tanti bit al secondo.
L'entropia aumenta col crescere del numero dei messaggi tra cui la sorgente può
scegliere. Essa aumenta anche con la libertà di scelta o con l'incertezza per il
destinatario, e decresce a misura che la libertà di scelta e l'incertezza diventano
minori. Per esempio, una restrizione che imponga di inviare molto frequentemente o
molto raramente certi messaggi fa diminuire la possibilità di scelta per la sorgente e
l'incertezza per il destinatario, sicché tale restrizione deve far diminuire l'entropia.
Per ogni sorgente ergodica è possibile definire una entropia corrispondente.
La massima entropia trasmissibile nel canale è chiamata capacità di canale, ed è
misurata in bit per secondo.

7
Una sorgente di entropia H può essere codificata in H cifre binarie per secondo, e un
generico canale discreto di capacità C può essere usato per trasmettere C bit per
secondo.
Un teorema fondamentale di Shannon è il teorema del canale privo di rumore: una
sorgente abbia l'entropia H bit per simbolo e un canale abbia una capacità di
trasmettere C bit per secondo, è possibile codificare il segnale di uscita della sorgente
in modo da trasmettere nel canale al ritmo medio di (C/H)-ε simboli per secondo,
essendo ε arbitrariamente piccolo, e non è possibile trasmettere ad un ritmo medio
maggiore di C/H.
Nella teoria delle comunicazioni, l'entropia di una sorgente di segnali in bit per
simbolo o per secondo dà il numero medio di cifre binarie, per simbolo o per
secondo, che sono necessarie a codificare i messaggi prodotti.
L'entropia della sorgente non è altro che una misura della quantità di scelta,
precisamente della scelta che la sorgente fa al momento di decidere il particolare
messaggio da trasmettere.
Il destinatario, prima dell'arrivo del messaggio, va considerato come una persona che
è incerta su quale tra i molti messaggi possibili la sorgente produrrà e trasmetterà.
Così facendo, pensiamo all'entropia della sorgente come ad una misura dell'incertezza
del destinatario sul messaggio che egli sta per ricevere, incertezza che sarà risolta al
momento dell'arrivo del messaggio.
Se il messaggio è uno tra n simboli o messaggi equiprobabili, l'entropia è log n,
poiché se abbiamo log n cifre binarie possiamo adoperarle per scrivere n numeri
binari diversi, ognuno dei quali può essere usato per individuare uno degli n
messaggi.
Le grandi conquiste della teoria dell'informazione sono l'aver stabilito la capacità di
canale e, in particolare, il numero delle cifre binarie necessarie a trasmettere
l'informazione da una particolare sorgente e l'aver mostrato che un canale disturbato
ha un ritmo di informazione in bit per messaggio o per secondo al di sotto del quale è
possibile una trasmissione senza errori nonostante la presenza del rumore.
Sarebbe opportuno considerare una lingua significante come una specie di codice
delle comunicazioni; essa non è certamente un semplice codice in cui si sostituisce
meccanicamente una parola al posto di un fatto, essa è più simile ai codici della
crittografia, in cui per ogni lettera o parola comune sono elencate molte parole
alternative di codice, ma nel linguaggio gli elenchi possono sovrapporsi.
Inoltre il cifrario personale di un individuo può differire da quello di un altro, ciò è
certamente causa di confusione.
Se consideriamo il linguaggio come un codice imperfetto di comunicazione,
dobbiamo finire per rapportare il significato all'intenzione di chi lo usa.
Chi usa il linguaggio vuole comunicare qualcosa ed è a questo qualcosa che noi
siamo principalmente interessati.
L'analisi grammaticale di un testo non è sufficiente a svelarne il significato.
Si potrebbero perdere giorni e giorni ad esaminare le possibili motivazioni nella
scelta delle parole, ma si ritornerebbe di continuo al problema del significato.

8
Nel parlare con qualcuno o nell'ascoltare ciò che uno dice si ha l'impressione che chi
formula una proposizione non abbia mai in testa un modello già elaborato ma che egli
venga elaborando il modello a misura che il discorso procede.
La suddivisione delle parole in categorie grammaticali, come i nomi, gli aggettivi e i
verbi, non è la nostra sola guida quando impieghiamo le parole nella produzione di un
testo; il poeta desidererà comporre parole che, attraverso il suono e il senso, evochino
nel lettore o nell'ascoltatore determinate emozioni o impressioni.
Le proposizioni grammaticali, tuttavia, indipendentemente dall'intenzione, hanno ciò
che si potrebbe chiamare un significato formale.
A partire da una grammatica soddisfacente, una macchina dovrebbe poter stabilire le
relazioni tra le parole di una proposizione, indicando il soggetto, il verbo, l'oggetto e
le proposizioni secondarie corrispondenti alle varie parole. Il problema successivo
nella ricerca di tale significato formale delle proposizioni è quello di associare le
parole con gli oggetti, le qualità, le azioni o le relazioni nel mondo che ci circonda,
incluso il mondo della società umana e della sua conoscenza organizzata.
Negli studi di classificazione l'oggetto ideale è notevole proprio per la sua totale
assenza come criterio effettivo e utile di identificazione. Al suo posto abbiamo
elenchi di qualità, alcune delle quali sono decisive e altre semplicemente indicative.
Il valore di questa osservazione è stato pienamente convalidato da recenti ricerche
intese a mettere le macchine in grado di svolgere un lavoro di riconoscimento o di
classificazione.
Prendere sul serio la teoria delle comunicazioni significa dischiudere enormi
possibilità teoriche per la comprensione dei meccanismi di interscambio delle
informazioni tra gli esseri umani. La teoria delle comunicazioni deve dimostrare di
possedere una reale e durevole consistenza fatta di comprensione e potenza; questa
consistenza andrebbe cercata nella trasmissione efficiente e precisa della
informazione; come abbiamo visto un problema fondamentale messo in luce dalla
teoria dell'informazione consiste nella codificazione efficiente.
L'entropia di un messaggio orale è alquanto maggiore, per parola, dell'entropia di un
messaggio scritto, come si è capito analizzando le rispettive possibilità di codifica e
di trasmissione su un opportuno canale, e ancora maggiore è l'entropia di un
messaggio visivo: la vista è intrinsecamente più discriminatoria dell'udito.
Nel caso di un canale disturbato Shannon dimostrò il seguente teorema fondamentale.
Consideriamo un canale discreto di capacità C e una sorgente discreta di entropia H
per secondo. Se H < C esiste un sistema di codificazione tale che il segnale di uscita
della sorgente può essere trasmesso nel canale con una frequenza di errori
arbitrariamente piccola. Se H > C è possibile codificare la sorgente in modo che gli
errori siano minori di H - C + ε, in cui ε è arbitrariamente piccolo. Non vi è alcun
metodo di codificazione che dia una frequenza di errori minore di H - C.
Il risultato sorprendente è che è possibile trasmettere un segnale su un canale
disturbato con una precisione quasi perfetta.
Man mano che gli errori nella trasmissione diventano più probabili, ossia ricorrono
con maggiore frequenza, la capacità del canale diminuisce gradualmente.

9
Per ottenere la trasmissione col minor numero prevedibile di errori, dobbiamo ridurre
il ritmo di trasmissione in modo che sia non maggiore della capacità del canale.
Il problema di una codificazione efficiente ed esente da errori in un canale disturbato
si riduce essenzialmente a questo: eliminare dai messaggi la ridondanza superflua e
aggiungervi quel tipo di ridondanza che è adatto a consentire la correzione degli
errori che vengono fatti in trasmissione.
Esiste una relazione tra la fisica e la teoria dell'informazione: occorre energia per
poter trasmettere un bit di informazione.
Questa relazione è illustrata molto bene dal personaggio immaginario denominato
diavoletto di Maxwell.
Il diavoletto, che abita in una scatola divisa in due da un diaframma, ha il compito di
manovrare uno sportello, che mette in comunicazione i due vani: appena scorge
nell'altro vano una molecola veloce diretta verso lo sportello, esso apre lo sportello e
la lascia entrare. Se invece scorge nel proprio vano una molecola lenta diretta verso lo
sportello, la lascia uscire. In tal modo esso impedisce alle molecole lente di entrare
nel proprio vano e alle molecole veloci di uscirne. Ben presto nella sua camera non vi
sarà altro che gas composto da molecole veloci. Questo è caldo, contrariamente al gas
nell'altra camera, che è formato di molecole lente e quindi è freddo. Il diavoletto di
Maxwell, in sostanza, fa passare il calore dalla camera fredda a quella calda in
contraddizione col secondo principio della termodinamica.
Purtroppo la conoscenza relativa alla velocità di una molecola comporta la
trasmissione di informazione e tale trasmissione presuppone l'utilizzo di una
corrispondente energia. Il diavoletto di Maxwell consuma tutta l'energia che riesce a
ricavare nel compito di discriminare quali molecole far passare e quali no.
Nessun dispositivo meccanico può essere utilizzato per violare il secondo principio
della termodinamica.
Una macchina che cerchi di estrarre energia utilizzando la conoscenza degli stati di
un sistema fisico consumerà tutta la potenza della macchina per trasmettere
l'informazione necessaria a far funzionare la macchina stessa.
La trasmissione dell'informazione può consentirci di trasformare l'energia termica in
energia meccanica. Il bit, che misura la quantità di informazione usata, è l'unità di
misura dell'entropia di una sorgente di messaggi nella teoria delle comunicazioni.
L'entropia della termodinamica determina quale parte dell'energia termica esistente
può essere trasformata in lavoro meccanico. Sembra quindi naturale cercare di
collegare l'entropia della termodinamica e della meccanica statistica all'entropia della
teoria delle comunicazioni.
L'entropia della teoria delle comunicazioni è una misura del grado di incertezza
riguardo a quale messaggio, tra molti possibili, verrà effettivamente prodotto da una
data sorgente in una certa occasione.
L'entropia della meccanica statistica è l'incertezza riguardo allo stato in cui si trova
un sistema fisico.
In entrambi i casi si potrebbe parlare di "conoscenza" di un sistema o di un
messaggio, in particolare di "informazione".

10
Il messaggio trasmesso riduce la nostra incertezza riguardo allo stato in cui si trova il
sistema fisico, riducendo così l'entropia della meccanica statistica del sistema, la
riduzione dell'entropia fa aumentare l'energia libera del sistema, ma l'incremento
dell'energia libera è uguale all'energia minima necessaria a trasmettere il messaggio
che ha condotto a tale incremento, energia che è proporzionale all'entropia della
teoria delle comunicazioni.
La teoria della comunicazione analizza come l'informazione possa essere codificata,
la cibernetica e la scienza dei calcolatori studiano come l'informazione possa essere
elaborata e come possa essere utilizzata per produrre dei comportamenti intelligenti.
Il tipico apparato studiato dalla cibernetica utilizza il principio di retroazione
negativa, grazie al quale è possibile realizzare servomeccanismi in grado di
raggiungere uno stato stabile in presenza di rumore e dati incerti.
Il comportamento di una macchina che utilizza la retroazione negativa è
caratterizzato per esempio dalla capacità di inseguire un bersaglio che si muova in
maniera imprevedibile, l'informazione sulla posizione del bersaglio di momento in
momento ritorna al sistema di controllo che la utilizza per correggere il proprio
comportamento. Utilizzando i principi della cibernetica è possibile costruire degli
automi che mostrano un comportamento intelligente ovvero interpretabili in una
maniera antropomorfa come se fossero dettati da stati mentali.
Immaginiamo un certo numero di segnali possibili; per esempio le possibili parole
che un uomo può pronunziare in un ambiente rumoroso.
Come possiamo valutare se il segnale che riceviamo è corretto?
Abbiamo bisogno di qualche conoscenza statistica del segnale, per esempio la
conoscenza delle parole più comuni e la loro probabilità di ricorrenza legata alle
parole precedenti: un criterio di conformità.
L'informazione non solo viene trasmessa ma anche controllata e verificata sulla base
di criteri di verosimiglianza: la parola viene compresa in base al contesto.
In cibernetica l'informazione viene utilizzata per controllare il comportamento di
automi, calcolatori elettronici e analoghi dispositivi complessi.
I calcolatori elettronici sono lo strumento più sofisticato conosciuto in grado di
elaborare l'informazione.
In linea di principio un calcolatore può essere programmato per fare qualunque cosa
che il programmatore comprende in ogni particolare.
L'elaboratore elettronico manipola informazione codificata, in particolare le
informazioni sono memorizzate in stringhe di bit.
Nel colloquio che intercorre tra due persone le informazioni sono codificate in parole,
anche se sussistono segnali extralinguistici che possono essere molto significativi e
che le persone normalmente si scambiano.
Una parola può influenzare in maniera considerevole il comportamento di una
persona, l'informazione scambiata può essere determinante rispetto agli scopi che una
persona si potrebbe prefiggere.
In un servomeccanismo l'informazione retroattiva controlla e determina la
corrispondente stabilità di comportamento, per esempio la corretta rilevazione di un
velivolo sullo schermo radar.
11
I casi più interessanti di retroazione negativa sono quelli non lineari, i casi non lineari
sono quelli che si presentano con maggiore frequenza nel mondo reale.
La non linearità rende estremamente complesso un trattamento rigorosamente
matematico del fenomeno in esame, la non linearità produce comportamenti di
enorme complessità, in particolare una variazione infinitesima può produrre un
effetto catastrofico sul sistema stesso.
Si potrebbe immaginare di costruire degli automi che, sulla base dei principi della
cibernetica, manifestino dei comportamenti intelligenti ed imprevedibili.
In un automa l'informazione potrebbe essere elaborata tramite connessioni di fili
elettrici e sensori in maniera tale da produrre comportamenti del tipo attrazione o
repulsione rispetto ad eventi che si verificano nell'ambiente circostante.
In effetti sarebbe pensabile attribuire a tali automi caratteristiche tipiche di
comportamenti che presuppongono stati mentali.
Si potrebbe dotare tali macchine di scopi a partire da fattori elementari come per
esempio la ricerca di cibo o di energia.
Effettivamente è possibile costruire automi che mostrano un comportamento
imprevedibile agli occhi di un normale osservatore anche se tutti i processi fisici ed
elettrici che avvengono al suo interno sono assolutamente deterministici.
Certi tentativi di applicare la teoria dell'informazione alla psicologia sperimentale
hanno un solido fondamento logico. Essi hanno condotto a esperimenti da cui sono
stati ottenuti risultati validi, imponenti e certi anche se da essi non è ancora possibile
trarre conclusioni generali.
Siccome l'entropia è una misura meravigliosa ed universale della quantità di
informazione e siccome gli esseri umani fanno uso della informazione, la difficoltà
offerta da un compito, ad esempio il tempo che l'uomo impiega ad eseguire un dato
lavoro, deve essere in qualche modo proporzionale alla quantità di informazione
implicata. Un esperimento di questo tipo è il seguente. Davanti al soggetto fu posto
un certo numero di luci. Ogni luce era contrassegnata con un monosillabo che il
soggetto imparava. Dopo un segnale di avvertimento, si accendeva improvvisamente
una tra le diverse luci e il soggetto pronunziava quindi, appena possibile, il
monosillabo corrispondente alla luce. Veniva misurato l'intervallo trascorso tra
l'accensione della luce e il proferimento del monosillabo. Il tempo medio di risposta o
latenza, tra l'accensione della luce e l'istante in cui era proferito il monosillabo
mostrava una diretta proporzionalità rispetto all'entropia dell'informazione trasmessa.
Da questi studi emerge che non si può usare un unico ritmo di informazione per
descrivere le prestazioni di un essere umano. Egli può trasmettere l'informazione in
alcune circostanze meglio che in altre. L'essere umano, considerato come un
dispositivo di manipolazione di informazione, è molto elastico e può manovrare
l'informazione in una sorprendente varietà di forme; anche se le manovra meglio se
l'informazione è convenientemente codificata e adatta alle sue capacità.
Nell'usare il linguaggio, gli esseri umani scelgono le parole in modo da trasmettere la
maggior quantità possibile di informazione al minimo costo.

12
Alcuni lavori nel campo della psicologia sperimentale suggeriscono che l'uso della
parola venga regolato dall'economia di sforzo necessario e che a sua volta
quest'ultima possa essere misurata come economia di tempo.
Vien da chiedersi se questo è il risultato di una capacità acquisita per far fronte alle
difficoltà del linguaggio oppure se è il linguaggio stesso che in qualche modo si
adatta alle capacità mentali delle persone.
Probabilmente tutti i linguaggi tendono ad assumere una grandezza fondamentale di
dizionario dettata dalle capacità e dall'organizzazione del cervello umano, piuttosto
che dall'apparente complessità dell'ambiente.
La varietà e la distribuzione di probabilità delle parole è quasi identica per molte
lingue scritte, se non per tutte. Probabilmente le lingue si adattano ad un modello
dettato dalle capacità mentali umane, nonché dalla conformazione e
dall'organizzazione del cervello. Sembrerebbe che tutte le lingue si adattino in modo
da ridurre al minimo lo sforzo implicito nella comunicazione umana.
La nostra capacità di ricevere e di manipolare l'informazione è influenzata dalle
restrizioni intrinseche del nostro sistema nervoso.
Nel linguaggio musicale sembra che certi limiti nel ritmo di trasmissione
dell'informazione possano essere superati, la musica infatti consente di esprimere,
nella sua varietà di forme e di combinazioni, una informazione molto maggiore di
quella che l'essere umano sembra poter recepire nell'unità di tempo.
L'elasticità e la libertà offerte a un musicista per comporre un brano come sequenza
di ampiezze campione sono di gran lunga superiori a quella che sembra essere la
capacità di ricezione del cervello.
Un musicista è in grado di produrre un mucchio di composizioni che per qualsiasi
uditorio umano risulterebbero indistinte.
Dal lato matematico, il rumore bianco gaussiano, che contiene in egual misura tutte le
frequenze, è il compendio del vario e dell'inaspettato. Esso è il meno prevedibile e il
più originale dei suoni. Tuttavia per un essere umano tutto il rumore bianco gaussiano
è completamente indifferenziato. Le sue finezze sfuggono all'orecchio dell'ascoltatore
ed egli avverte soltanto un suono sordo e monotono.
Per essere distinguibili, i suoni debbono essere in certa misura familiari.

13
Rappresentazione e realtà
Dal punto di vista dell'elaborazione dell'informazione il modo in cui vengono
rappresentati i dati è fondamentale per la risoluzione dei problemi di significato ad
essi associati. Il significato di un dato risiede nella fitta rete di correlazioni con altri
dati contestualmente memorizzati.
Una parola è un segno, una informazione codificata, che denota un particolare
significato, ma tale significato è dinamico, ovvero dipende dalla storia dei concetti
associati a quella particolare parola. Prendiamo ad esempio la parola "elettrone" che
quale termine usato dai fisici dovrebbe avere una precisa definizione, ebbene in realtà
essa ha subito notevoli cambiamenti di significato in corrispondenza con le proprietà
dell'elettrone che man mano sono state scoperte. All'inizio l'elettrone aveva una
estensione ed una traettoria ora non possiede né l'una né l'altra. Dell'elettrone si
poteva determinare posizione e quantità di moto ora queste due grandezze sono
complementari e non si possono misurare contemporaneamente con precisione
assoluta. All'inizio l'elettrone era un corpuscolo ora è anche un'onda di probabilità.
Il significato della parola elettrone si è evoluta nel tempo con l'evolversi delle
conoscenze della fisica delle particelle.
La frase: la corrente elettrica è dovuta al moto degli elettroni in un metallo, se da una
parte ha lo stesso significato che ad essa si dava in passato, ad una analisi critica alla
luce delle moderne conoscenze di fisica essa non ha più lo stesso significato.
La parola è un iceberg che spunta come un picco in superficie ma sovrasta una
enorme mole di dati e informazioni che ne costituiscono la base sommersa.
Il significato di una parola è olistico, ovvero globale, e non si può esaurire nel mero
elenco dei sinonimi e dei contrari o in definizioni costituite da altre parole come è uso
fare nei dizionari. Il significato di una parola non è il semplice elenco di possibili
riferimenti ad oggetti del mondo reale, anche se questo è il massimo che si può fare
per definire un termine in uso nel linguaggio. Prendiamo ad esempio la parola
"rosso", non esiste nessun colore rosso, ma si tratta di una intera gamma di frequenze,
e non esiste alcuna percezione del rosso in termini di riferimenti fisici, ogni
percezione contiene delle sfumature distinguibili, sia in termini di esperienza
puntuale che contestuale. Al sorgere del sole vedo che il sole rosso ma vedo anche
che il mio stesso sangue è rosso; queste due esperienze sono incommensurabili
sebbene si utilizzi la stessa parola e lo stesso concetto per descriverle.
La grammatica non serve a cogliere il senso delle parole anche se una frase che non
rispetti la grammatica non ha (salvo rari e anomali casi) senso alcuno.
Il tentativo di definire tutti i termini descrittivi dotati di significato del nostro
linguaggio tramite termini di un vocabolario più fondamentale che consista di parole
che stanno per nozioni epistemologicamente più primitive è destinato a fallire.
Anche se ci riferiamo ad un vocabolario in cui i termini sono sensoriali, ovvero per
ciò che si pensa che sia "osservabile", non riusciremo mai a coprire tutti i casi in cui
un termine può essere utilizzato o un enunciato è asseribile.

14
Nello stesso tempo i cambiamenti nelle procedure adottate da una comunità nell'uso
di un certo elemento lessicale non equivalgono in generale a un cambiamento di
significato. Le rappresentazioni mentali corrispondenti a un certo elemento lessicale
del linguaggio pubblico possono variare nel tempo. Inoltre parole di differenti
parlanti che hanno forme sintattiche differenti e sono associate a differenti procedure,
possono avere lo stesso significato e denotazione.
Se le rappresentazioni semantiche nel cervello sono sviluppate dall'esperienza,
esattamente come lo sono le parole del linguaggio pubblico, invece che essere
composte da un insieme innato di primitive semantiche, allora non c'è alcuna ragione
per pensare che una data rappresentazione descritta sintatticamente non possa avere
significati differenti per differenti gruppi di esseri umani.
Il significato di una parola è interattivo, vale a dire il modo in cui il significato
dipende non solo da quello che è nella nostra testa, ma anche da ciò che si trova nel
nostro ambiente e da come noi interagiamo col nostro ambiente.
Ciò che rende plausibile che la mente o il cervello pensi o computi usando
rappresentazioni è che tutte le forme di pensiero di cui sappiamo qualcosa utilizzano
rappresentazioni. Ma nessuno dei metodi di rappresentazione conosciuta - la parola,
la scrittura, la pittura, la scultura, ecc. - possiede la magica proprietà che rende
impossibile che vi siano rappresentazioni differenti con lo stesso significato. Nessuno
dei metodi di rappresentazione che noi conosciamo è tale che le sue rappresentazioni
si riferiscano intrinsecamente a qualcosa. Tutte le rappresentazioni che conosciamo
sono associate ai loro riferimenti in un modo contingente e passibile di essere
cambiato mentre la cultura cambia o cambia il mondo. Ciò dovrebbe essere
sufficiente a renderci estremamente dubbiosi nei riguardi di teorie che postulano un
regno di rappresentazioni dotate delle seguenti proprietà:
1. Ogni parola utilizzata dal parlante è associata nella sua mente a una certa
rappresentazione mentale.
2. Due parole hanno lo stesso significato, sono due sinonimi, proprio nel caso in cui
sono associate dai parlanti che le usano alla stessa rappresentazione mentale.
3. La rappresentazione mentale determina ciò a cui la parola si riferisce, nel caso in
cui esista un riferimento.
Una rappresentazione non ha lo stesso contenuto quando i parlanti sono cresciuti in
ambienti completamente diversi: il riferimento è sempre un fenomeno sociale.
Dire che il significato completo di una parola è conosciuto solo da un gruppo di
esperti e dire che gli altri ne conoscono solo una parte, non è accettabile per un
mentalista; perché tutto lo scopo del mentalismo consiste nell'identificare il
significato di una parola con qualcosa che è nella mente di ogni parlante che sappia
come usare quella parola. Per le teorie del significato mentaliste il significato deve
essere pubblico: il significato non può essere una proprietà privata.
L'uomo della strada è autorizzato ad usare le parole anche se non è a conoscenza di
tutti i diversi criteri con cui gli esperti discernono le parole stesse.
Non è corretto uguagliare fin dall'inizio la rappresentazione mentale col relativo
significato, in tal caso daremo per garantito che il significato di un segno deve
simultaneamente essere qualcosa di mentale e agganciarsi al mondo reale.
15
Il linguaggio è una forma di attività cooperativa, non un'attività essenzialmente
individualistica.
Il problema di come il linguaggio si aggancia al mondo reale è stato analizzato da
vari filosofi. La capacità che ha un concetto della mia mente di riferirsi a qualcosa di
esterno alla mente è, secondo Searle, spiegata dalla chimica del cervello.
Ma vi sono considerazioni molto convincenti contro la possibilità di ridurre il
riferimento a relazioni computazionali e fisiche e anche, a maggior ragione, contro la
possibilità di una diretta riduzione del riferimento alla chimica.
Nelle traduzioni da una lingua ad un'altra non si conservano solo le rappresentazioni
mentali e le rappresentazioni mentali non sono sufficienti a fissare i riferimenti.
Conoscere il significato di una parola può significare:
a. sapere come tradurla
b. sapere a che cosa si riferisce, nel senso che si è in grado di affermare
esplicitamente quale è la sua denotazione
c. avere una conoscenza non esplicita del suo significato, nel senso di essere in grado
di usarla in un discorso.
L'unico senso in cui il parlante medio conosce il significato della maggior parte delle
parole è c. Conoscere il significato in questo senso non vuol dire affatto conoscere
qualche fatto del mondo reale.
Due persone possono avere presumibilmente la stessa rappresentazione mentale
eppure avere riferimenti diversi nel mondo reale.
L'ambiente gioca un ruolo nel determinare a che cosa si riferiscono le parole di un
parlante o di una comunità.
Il fatto che l'ambiente contribuisce a fissare i riferimenti è anche una delle ragioni per
le quali l'operativismo ingenuo e il verificazionismo ingenuo sono scorretti come
spiegazione del significato dei termini di generi naturali.
I tradizionali resoconti mentalisti del significato e del riferimento falliscono in due
modi diversi. Da un lato ignorano la divisione del lavoro linguistico, dall'altro
ignorano il modo in cui i paradigmi forniti dal nostro ambiente contribuiscono a
fissare il riferimento. A causa di queste omissioni il teorico tradizionalista non è in
grado di capire come due parlanti o due comunità possano associare proprio le stesse
rappresentazioni mentali a certi termini e usare questi termini per riferirsi a differenti
oggetti del mondo reale. Ciò non significa che le descrizioni, comprese le descrizioni
nelle nostre menti, non contribuiscano a fissare il riferimento. Le descrizioni ci
aiutano a fissare il riferimento dei nostri termini, ma non comprendono tutto ciò che
intendiamo quando utilizziamo i termini corrispondenti.
Occorre separare la questione di come il riferimento dei termini è fissato da quella del
loro contenuto concettuale.
Ad una prima superficiale analisi le rappresentazioni mentali non differiscono molto
dalle rappresentazioni formulate per mezzo di parole, scritti, o altri segni.
Le parole possono essere scritte, pronunciate o pensate.
La nozione che il pensiero non espresso sia formato da parole rappresenta un primo
rudimentale approccio che ha una sua ragione di essere.

16
Ma queste rappresentazioni di superficie non possono essere le rappresentazioni
mentali a cui ci si riferisce nel mentalismo. Tali rappresentazioni sono pensate come
entità che determinano il significato delle parole e non la loro forma.
Il contenuto mentale di un concetto potrebbe essere una formula di tipo algoritmico,
ovvero un meccanismo di riconoscimento automatico di pattern.
Le formule nel sistema di rappresentazione cerebrale sarebbero associate a qualcosa
di non linguistico, anche se in molti casi questo qualcosa non determina il riferimento
dei nostri termini in maniera completa.
Queste formule sono tali da contenere informazioni sulle proprietà osservabili di un
referente senza contenere abbastanza informazioni da permettere di identificare il
referente stesso, per esempio un meccanismo di riconoscimento di pattern nel sistema
visivo potrebbe essere in grado di riconoscere qualunque cosa dalla forma di un cane
senza possedere il concetto di cane.
Le formule così concepite sarebbero delle funzioni delle proprietà osservabili e
starebbero alla base del processo di riconoscimento degli oggetti reali.
Quando usiamo le parole facciamo uso di prototipi percettivi, tali prototipi
riassumono in un unico concetto un intero corpo di esperienze legate alle parole.
I prototipi percettivi sono molto importanti dal punto di vista psicologico, essi
consentono di identificare le parole ed associare ad esse immagini mentali
significative, tuttavia i prototipi percettivi non esauriscono il significato delle parole.
Si potrebbe definire il ruolo concettuale di una parola considerando la totalità delle
credenze e delle inferenze che un parlante considera importanti o centrali in
connessione con l'argomento che costituisce il significato di una parola, tuttavia nella
pratica solo un piccolo numero fra le credenze che abbiamo in un certo momento
contribuisce a fissare il significato di un termine. Questa circostanza ci impedisce di
identificare nel ruolo concettuale l'essenza del significato delle parole.
Qualunque teoria del significato deve fare i conti col fatto che certe credenze, anche
se non analitiche o addirittura false, contribuiscono a fissare il significato più di altre,
e che identificare queste credenze non è un compito semplice.
Queste considerazioni pongono in serio dubbio la possibilità di formulazione di una
teoria del significato che pretenda di dare una relazione scientificamente descrivibile
di uguaglianza e differenza di significato.
Il ruolo concettuale di una parola è qualcosa che possiamo descrivere interamente in
termini sintattici, tutto quello che ci serve sapere sono le proprietà sintattiche delle
rappresentazioni mentali interne al cervello, e i processi di inferenza descritti in
termini computazionali che operano su quelle rappresentazioni, tuttavia anche se
fossimo in grado di descrivere formalmente questo processo non riusciremmo a
cogliere l'essenza del significato di una parola.
Identificare il significato con il ruolo concettuale equivale a cambiare completamente
argomento, non si tratta più di una spiegazione del significato.
La semantica del ruolo concettuale è stata storicamente presentata come una difesa
della tesi che sia possibile una psicologia computazionale, vale a dire la tesi secondo
la quale si può dare un'analisi computazionale di relazioni come l'uguaglianza di
significato.
17
In realtà ci si è resi conto del fatto che i significati rimangono invariati anche dopo
enormi cambiamenti di ruolo concettuale.
Il significato di un simbolo non può essere un altro simbolo, anche se si tratta di un
simbolo nella scrittura cerebrale e non può nemmeno identificarsi con le proprietà
osservabili associate al simbolo.
Quine sostiene che sarebbe un errore pensare ai significati come se fossero oggetti
nella nostra testa, che la nozione di sinonimia è irrimediabilmente vaga, in particolare
per le idee teoriche, e che perfino il riferimento è imperscrutabile, come si evince nei
casi di traduzione da una lingua ad un'altra.
Dal punto di vista formale ogni domanda sull'uguaglianza del riferimento si riduce
semplicemente alla corrispondente domanda espressa nel linguaggio logico del primo
ordine, ma questa è una semplificazione che non raggiunge l'obiettivo desiderato.
All'obiezione che la traduzione in una notazione sistematizzata presuppone una
qualche nozione di uguaglianza di significato, Quine risponde che una traduzione del
genere è una libera creazione, non la scoperta di un contenuto pre-esistente.
Quine concepisce il linguaggio naturale non sistematizzato come un insieme di suoni
e attribuisce ad esso la funzione di aiutarci ad anticipare gli stimoli delle nostre
terminazioni nervose, ma pensa che non sia possibile applicare al linguaggio naturale
una nozione scientificamente seria di riferimento o di verità.
All'obiezione che ogni teoria degli atteggiamenti proposizionali presuppone che si
possano comparare espressioni di differenti linguaggi per quello che riguarda
l'uguaglianza e la differenza di significato, Quine risponde che gli atteggiamenti
proposizionali appartengono alla psicologia popolare, non alla scienza.
Secondo Quine dovremmo accettare il comportamentismo.
Si può pensare al linguaggio come ad un sistema di pratiche governato da regole.
Se cerco di descrivere gli oggetti che si trovano in questa stanza, le mie asserzioni
possono avere successo o possono non averlo; e ciò che conta come successo è
determinato da convenzioni ritenute valide da una certa comunità, non da quello che
succede nella mia testa. Per dire che una descrizione ha successo in questo senso
normativo, si usano normalmente parole come vero, corretto o giusto, ma vero non è
una proprietà normativa.
É incoerente rifiutare gli atteggiamenti proposizionali perché non possono essere
ridotti a proprietà fisiche/computazionali e nello stesso tempo mantenere la nozione
di riferimento e di verità.
Quello che si dovrebbe abbandonare non è il realismo scientifico in quanto tale ma
piuttosto la richiesta che tutte le nozioni che prendiamo in seria considerazione
debbano essere riducibili al vocabolario e all'apparato concettuale delle scienze
esatte.
É stata una intuizione profonda del funzionalismo che i differenti stati fisici in cui
una mente si può trovare mentre crede ad una determinata proposizione del
linguaggio non hanno necessariamente qualcosa in comune che possa essere
specificato in termini fisico-chimici.

18
Inoltre i differenti stati computazionali che possono sussistere in una mente mentre
crede ad una proposizione del linguaggio non hanno necessariamente qualcosa in
comune che possa essere specificato in termini computazionali.
L'errore che commettiamo è che pensiamo agli atteggiamenti proposizionali come
dotati di una realtà fenomenologica che emerge dalla possibilità di chiedersi se
abbiamo veramente compreso un'altra persona o un testo, cerchiamo una riduzione
degli atteggiamenti proposizionali a qualcosa che viene ritenuto più fondamentale in
un certo sistema di metafisica scientifica.
Un problema irrisolto è certamente quello dell’interazione fra i diversi linguaggi:
(testo, voce, immagini) e dell’eventuale surplus di carattere informativo, cognitivo e
didattico, apportato da questa integrazione. A questo proposito è fondamentale
riferirsi al problema del rapporto fra i linguaggi visivi, e generalmente le
rappresentazioni iconiche (quelle che spesso vengono chiamate rappresentazioni
mentali) e il linguaggio (sia verbale che scritto).
Questo è uno dei grandi temi della filosofia e della psicologia cognitiva: da almeno
vent’anni si assiste al dibattito circa l’effettiva possibilità di conferire alle
rappresentazioni mentali, generalmente ai linguaggi iconici (visivi), una autonomia,
concettuale e cognitiva, rispetto al linguaggio verbale (proposizionale). In particolare,
all’interno della psicologia cognitiva vi è un confronto molto acceso tra i cosiddetti
proposizionalisti e i pittorialisti. I primi negano la completa autonomia del formato
rappresentazioni iconiche - linguaggio visivo rispetto al formato proposizione,
essendo convinti che il pensiero operi soprattutto sulla base di una struttura sintattica
proposizionale, che ricalca quindi le modalità di fruizione, uso e produzione del
linguaggio verbale e del linguaggio scritto. All’interno di questo tipo di linguaggio,
dunque, i segni sono convenzionali, cioè il loro rapporto con ciò che viene da essi
denotato è di tipo arbitrario (l’arbitrarietà del segno è una delle principali conquiste
dell’idea di linguaggio proposizionale) e non invece costruito sulla base di analogie,
di somiglianze, come appunto si ipotizza all’interno del riferimento delle
rappresentazioni mentali. Questo impone innanzitutto che sotto il profilo cognitivo
sono fondamentali solo le modalità di produzione e comprensione del linguaggio
proposizionale mentre tutte le altre sono forme derivate, e in secondo luogo che la
modalità fondamentale di approccio, qualunque sia il formato di presentazione, è la
lettura. In quest’ottica anche la percezione visiva sarebbe in qualche modo una forma
di lettura ove sono cruciali le modalità di interpretazione del testo e quindi di quel che
viene percepito. Tutto ciò nega qualunque differenza significativa tra i processi
primari, quelli di percezione mirata e diretta e quelli secondari, cioè quelli di
concettualizzazione, in cui entrano con una importanza determinante i processi di
categorizzazione e di costruzione di categorie concettuali. La risposta dei pittorialisti
è invece che se assumiamo questa idea, in sostanza finiamo in una circolarità di tipo
linguistico perché diciamo sostanzialmente che la percezione non è autonoma ma
dipende dalla interpretazione, l’interpretazione è a sua volta guidata dal linguaggio e
allora è difficile capire quale sia la base e il fondamento della relazione che sussiste
tra le parole e il mondo.

19
In questa diatriba è particolarmente importante il tentativo di sintesi che viene cercato
e in qualche modo operato da Roland Barthes in una serie di testi in cui
sostanzialmente si mette a confronto il processo della lettura e il processo della
visione per dire che in realtà non è vero che sussista questo iato così netto fra i due
processi, nel senso che innanzitutto non è vero che il processo di lettura avvenga
sequenzialmente ma attraverso appunto la costruzione di serie di sensi, che si
rinforzano progressivamente a differenza del processo di visione che invece è basato
su un’attività di preventiva identificazione di un qualcosa che poi viene ulteriormente
arricchito e corredato di significati.
Secondo Barthes anche la lettura procede per quelli che vengono chiamati "inneschi
di senso", cioè quando abbiamo a che fare con un testo particolarmente difficile
spesso la lettura procede senza trovare un aggancio, senza riuscire in qualche modo a
far presa sul significato del testo, fino a quando non arriviamo a riconoscere qualcosa
di familiare al quale appunto ci aggrappiamo, e che funziona come "innesco di
senso", a partire dal quale ricostruiamo anche ripercorrendo all’indietro il testo fino a
quel momento percorso, ricostruiamo i significati e riusciamo a conferire senso a
produzioni e frasi che fino a quel momento non eravamo riusciti in nessun modo a
interpretare e agganciare. Anche qui abbiamo una identificazione di un qualcosa che
ci è familiare, a partire dalla quale poi siamo in grado di ricostruire.
Anche la lettura in realtà che procede non in modo lineare e sequenziale ma per
cesure, per ricostruzioni successive, per arricchimenti successivi, sulla base di alcuni
elementi che vengono identificati. E a partire da questo Barthes propone una teoria
generale delle enunciazioni, in cui possano rientrare sia i processi di percezione e di
uso delle rappresentazioni mentali, sia invece i processi di lettura quindi di fruizione,
sia in termini di comprensione che di produzione, del linguaggio verbale o scritto.
L'organizzazione funzionale non può essere esattamente la stessa per tutti i membri di
una determinata specie. Il numero di neuroni può variare da persona a persona, e i
neurologi ci insegnano che non ci sono due cervelli strutturati nello stesso modo.
La struttura cerebrale dipende dalla maturazione e dagli stimoli ambientali di ogni
singolo cervello.
Alcuni pensatori suppongono che possa esistere un modello del cervello umano a cui
si approssimano tutti i cervelli realmente esistenti, questo modello determinerebbe lo
spazio degli stati computazionali che possono essere attribuiti agli esseri umani.
Tale ipotetico modello è comunque una astrazione in cui gli stati mentali che in esso
possono aver luogo non sono affatto reali né verificabili sperimentalmente.
Occorre abbandonare l'assunzione che gli organismi reali siano razionali nel senso
della teoria delle decisioni: gli esseri umani non sono razionali in quel senso.
I comportamenti irrazionali di specie diverse fisicamente possibili dipendono dalla
storia contingente della specie medesima e dall'ambiente particolare a cui si è adattata
quella specie.
Non solo è falso che esseri umani differenti sono nello stesso stato computazionale
quando credono per esempio in una determinata proposizione, ma membri di specie
differenti fisicamente possibili che sono sufficientemente simili nel loro
comportamento linguistico in un certo numero di ambienti da permetterci di tradurre
20
alcune delle loro espressioni come significanti, possono avere stati computazionali
che si trovano in uno spazio incomparabile di stati computazionali. Anche se il loro
modo di ragionare è, in alcune situazioni, molto simile, ciò non implica che gli stati e
gli algoritmi siano gli stessi.
Gli esseri senzienti fisicamente possibili possono essere progettati in modi troppo
diversi, parlando in termini fisici e computazionali, perché possa essere vero un
funzionalismo che preveda uno stato computazionale per ogni atteggiamento
proposizionale.
Anche se non è possibile richiedere il requisito che gli stati dei parlanti aventi lo
stesso riferimento siano identici, si potrebbe ipotizzare che siano equivalenti in base a
una certa relazione di equivalenza essa stessa computabile, o almeno definibile nel
linguaggio della teoria computazionale più il linguaggio della scienza fisica.
Per interpretare un linguaggio occorre, in generale, avere una qualche idea delle
teorie e degli schemi inferenziali comuni nella comunità che parla il linguaggio.
É falsa l'assunzione secondo la quale in linea di principio si può dire a che cosa si
riferisce un certo termine usato in un certo ambiente basandoci su una descrizione
sufficientemente completa di quell'ambiente formulata in termini di un insieme,
standardizzato di parametri fisici e computazionali, a meno che non si allarghi la
nozione di ambiente del parlante fino ad includere l'intero universo fisico.
Una teoria che voglia definire la coreferenzialità e la sinonimia deve, in qualche
modo, prendere in considerazione tutte le teorie possibili.
Il calcolo dei predicati è a volte trattato dai filosofi come se fosse il linguaggio
universale in cui siano esprimibili tutte le teorie possibili; ma per mettere le credenze
espresse nel linguaggio naturale nella forma del calcolo dei predicati è necessario
interpretarle, ovvero attribuire un senso a ciascun predicato, e questo è proprio il
problema che stiamo analizzando e che non è possibile risolvere formalmente.
L'idea di cercare una relazione di equivalenza computabile, o anche solo ben definita,
fra stati funzionali che corrisponda alla relazione di equivalenza che viene usata
implicitamente nella pratica delle buone interpretazioni, va incontro a una difficoltà
insuperabile che consiste nella inesauribile apertura senza limiti della totalità degli
schemi concettuali che devono, in linea di principio, essere interpretati.
Non abbiamo ragioni per credere alla tesi secondo la quale c'è qualcosa che tutti i casi
di interpretazione corretta hanno in comune, e che sia specificabile in termini finiti.
Le proprietà computazionali non sembrano proprio essere ciò che hanno in comune
fra loro sistemi intenzionali con lo stesso atteggiamento proposizionale.
La pratica interpretativa reale è aperta e praticamente estendibile all'infinito, a nuove
culture, nuove tecnologie, addirittura nuove specie, almeno potenzialmente.
L'unico appiglio che abbiamo per la nozione di uguale credenza è la pratica
interpretativa, ma non c'è assolutamente nessuna ragione per credere che vi sia un
solo stato computazionale in cui devono trovarsi tutti i possibili esseri umani quando
pensano ad una determinata proposizione. E se non c'è uno stato computazionale nel
quale devono trovarsi tutti, allora non è nemmeno molto probabile che vi sia uno
stato neurochimico rilevante nel quale devono trovarsi tutti.

21
Non c'è ragione per pensare che vi sia una relazione di equivalenza definibile fra gli
stati computazionali che possa dare classi di equivalenza corrispondenti a
atteggiamenti proposizionali nel caso di arbitrari sistemi intenzionali fisicamente
possibili.
Il tentativo di fornire una ricognizione del significato e del riferimento fallisce
esattamente per la stessa ragione per la quale fallisce il tentativo di fornire una
ricognizione della ragione: la ragione può trascendere qualsiasi cosa possa essere
oggetto di ricognizione della ragione stessa.
Esattamente come nessun sistema formale della matematica può definire che cosa sia
una dimostrazione matematica, e come nessun sistema formale di logica induttiva
può definire che cosa sia l'essere confermato, così nessun programma per
l'interpretazione delle espressioni del linguaggio naturale può definire che cosa sia la
sinonimia, o anche la coreferenzialità, fra espressioni.
Non si vede come si possa fornire una completa caratterizzazione computazionale di
dimostrazione, conferma, sinonimia.
Le difficoltà cui vanno incontro i programmi mentalisti, funzionalisti, fisicalisti ecc.,
sono di due generi dal punto di vista del realista scientifico. Per un realista scientifico
c'è una marcata separazione fra questioni epistemologiche e questioni ontologiche, e
il realismo scientifico deve far fronte a difficoltà sia ontologiche che
epistemologiche.
La connessione fra questioni epistemologiche e le questioni sul riferimento e il
significato è assicurata dalla verità dell'olismo del significato.
Il riferimento non è solo una questione di connessioni causali; è una questione di
interpretazione. E l'interpretazione è essenzialmente olistica.
Sapere che cosa significano le parole di un linguaggio vuol dire cogliere il modo in
cui sono usate da un parlante. Ma l'uso è olistico; perché sapere come le parole sono
usate comporta la conoscenza di come vengono fissate le credenze che contengono
quelle parole, e la fissazione delle credenze è olistica.
Il tentativo di caratterizzare il riferimento come una relazione funzionale fra
rappresentazioni usate da organismi e cose che possono essere sia interne che esterne
a questi organismi, poggia su un notevole presupposto ontologico: in particolare si
assume fin dall'inizio che vi sia un singolo sistema, gli organismi e il loro ambiente
fisico, che contiene tutti gli oggetti a cui ci si può riferire.

22
Il cervello e le idee
L'informazione, che scaturisce e scorre dappertutto nel mondo che ci circonda, che
pervade tutto l'esistente fenomenologico, è contenuta nelle differenze: differenze di
forma, di colore, di intensità, che si propagano sotto forme diverse in
quell'innumerevole rete di comunicazione che è l'universo. E in questo universo
ciascun essere vivente può considerarsi il fulcro privilegiato.
Ogni cervello è esattamente al centro dell'universo della comunicazione e
dell'informazione, vero punto di vista unico ed irripetibile.
Ma non c'è informazione senza supporto materiale, l'informazione ha bisogno del
mondo fisico, ha bisogno di una materia per esplicarsi nelle differenze spaziali tra le
diverse parti del supporto, oppure nelle differenze temporali tra i suoi stati successivi.
Eppure l'informazione non è il supporto, l'informazione risiede nelle differenze.
Queste differenze, codificate, ovvero trasformate in vari modi, si propagano da un
estremo all'altro dei vari canali di comunicazione, giungono agli organi di senso e
quindi dopo essere state filtrate e selezionate entrano nel misterioso laboratorio del
cervello; sono riconosciute come differenze, sono messe in relazione con altre
differenze e acquistano un significato all'interno di quella vasta struttura cerebrale che
realizza l'esperienza filogenetica, cioè specifica, e ontogenetica, cioè individuale.
Le informazioni sono sfruttate come punti di riferimento per agire sul mondo, e
dunque per accrescere o ridurre le differenze. I sistemi sintattici di segni, vuoti,
divengono così sistemi semantici e sistemi pragmatici.
Ogni essere umano costituisce un ponte fra questi due universi, un ponte attraverso il
quale l'universo fisico si rovescia nel mentale e vi si contempla.
Nel cervello, con parole e segni condizionati o creati, sboccia e si dispiega un mondo
che riproduce una parte, sia pur piccola, del mondo esterno.
Il mondo che entra nel cervello è filtrato dagli organi di senso: l'occhio non può
vedere tutte le differenze, e non tutte quelle rilevate dall'occhio vengono trasmesse al
cervello. Solo le differenze che superano una certa soglia provocano eventi: ovvero
informazione. Le informazioni vengono sottoposte ad elaborazioni che ne
comportano sempre una qualche perdita irreversibile: quelle che sopravvivono
corrispondono al nostro universo cognitivo.
Si usa parlare con disinvoltura di elaborazione di informazioni nei sistemi biologici,
come se fosse davvero chiaro cos'è l'informazione che vi è elaborata, e di cosa stiamo
parlando quando parliamo di sistemi biologici.
L'informazione costituisce una parte vitale nei sistemi biologici.
Gli esseri umani sono uno schema dinamico e non un mucchio di atomi disposti alla
rinfusa, ogni organismo è evidentemente qualcosa di molto astratto, in particolare
contiene informazione: l'informazione che sarebbe necessaria per ricostruirlo
esattamente.

23
Non solo dal punto di vista fisico, ma sarebbe compresa anche l'informazione che
costituisce l'esperienza del soggetto, che si rintraccerebbe a sua volta in qualche
modo nel cervello e che dovrebbe essere trasmessa nell'allestimento della copia, ove
questo fosse possibile.
Gli esseri viventi consistono in misura essenziale di informazione, e hanno la capacità
di plasmare materia in base alla loro specifica informazione, accogliendola e
inserendola per un certo tempo nella loro struttura.
Per poter parlare di informazione occorre un essere capace di percezioni, un essere la
cui vita interiore sia influenzata o plasmata dai segni che ravvisa e che riconosce.
Il concetto di informazione presuppone esseri viventi e se omettiamo questi esseri
viventi il concetto di informazione non può essere ricondotto semplicemente al
concetto di entropia: l'informazione deve essere dotata di senso.
Analogamente ai calcolatori elettronici, l'informazione perviene al cervello attraverso
una quantità di singoli filamenti, ciascuno in grado, indipendentemente dagli altri, di
trasmettere segnali. Solo che nel cervello i segnali sono fisicamente molto più
complessi dei semplici impulsi che nell'elettronica sono inviati attraverso fili
metallici. I segnali si diffondono nel cervello anche molto più lentamente che
nell'elettronica. Comunque, i segnali sono segnali e, nei cervelli come nei calcolatori,
hanno una cosa in comune: il fatto di essere ben distinti l'uno rispetto all'altro,
d'essere numerabili, di essere discreti come si suol dire. Nella trasmissione di impulsi
discreti le distorsioni del segnale non costituisce quasi un problema, perché, pur
distorto, un impulso può essere comunque ancora riconosciuto come tale dal
ricevente. L'impulso serve per così dire da simbolo di ciò che è trasmesso, e come per
altri simboli la forma esatta non ha rilevanza finché il simbolo in quanto tale sia
ancora riconoscibile.
Tali considerazioni ci portano a pensare al cervello come un apparecchio
d'elaborazione di simboli, e dal carattere simbolico del suo modo di funzionare nel
riconoscere i segnali si può rintracciare una delle radici del concetto di informazione.
Il cervello procede per simboli non solo di fronte a lettere e a suoni, bensì, più in
generale, nel modo che ha di cogliere le cose dell'ambiente esterno.
La distinzione di singoli eventi dal flusso continuo di ciò che è percepito attraverso i
sensi avviene mediante il confronto di queste cose con particolari simboli dell'attività
cerebrale, ovvero mediante la traduzione del mondo esterno nel linguaggio interno
del cervello. Non si conoscono i particolari di questo processo di codificazione
interna, ma la più recente neurofisiologia ha fornito molte indicazioni significative.
In questo contesto non è ancora chiaro se siano impulsi in singoli elementi del
cervello a fungere da simboli interni, oppure se sono salve di impulsi dirette verso
schiere di elementi complessi.
É facile convincersi che il cervello mostra una notevole plasticità nell'adattare il
proprio linguaggio interiore, ovvero la propria provvista di simboli, alle circostanze
che si danno nel mondo esterno.
In ogni caso non si può cogliere tutto, riconoscere tutto, reagire a tutto.
Avviene sempre una preselezione degli stimoli mediante meccanismi di
riconoscimento innati che fanno parte della fisiologia propria dell'organismo.
24
Per tutta la vita impariamo a distinguere figure, a riconoscere situazioni importanti, a
raffinare reazioni particolari. Nel cervello tutto questo corrisponde a una continua
ristrutturazione delle connessioni interne, nel senso che le immagini di cose connesse
fra di loro nel mondo esterno sono collegate insieme nel cervello, e se ne stabiliscono
le sequenze. Questo processo è plastico e multiforme e segue un paradigma olistico di
un tipo tale che non è possibile ricostruirlo tramite computer.
Per i neurologi sembra ormai accertato che parti diverse del cervello provvedono a
distinte incombenze, dunque non tutto il cervello entra in attività quando, nella
formulazione di una frase complessa, vengono usate desinenze e tempi dei verbi in
modo corretto, bensì solo una piccola parte sufficientemente localizzata.
Sono state fatte molte osservazioni, interessanti sia per i neurologi che per gli
psicologi, sulla possibilità di localizzare nelle zone neocorticali specifiche funzioni
mentali; ove si trovasse conferma che per esempio l'intenzionalità fosse
effettivamente connessa con specifiche parti del cervello, allora si disporrebbe di
qualcosa come una naturale anatomia della psiche, una articolazione delle funzioni
spirituali in singole parti costitutive.
Nel cervello i segnali sono inoltrati attraverso fasci di fibre preformati per ben precise
utilizzazioni. Un raggio di luce che colpisca l'occhio da una certa direzione scatena
dei segnali che sono inoltrati al cervello e, più precisamente, lungo sistemi diversi di
fibre verso parti diverse del cervello. In una parte si calcolano i movimenti dei
muscoli dell'occhio per determinare l'orientamento dello sguardo verso l'oggetto
luminoso, in un'altra parte è calcolata l'apertura ottimale della pupilla, in una terza
struttura, più grande, l'immagine trasmessa da un occhio è comparata con quella
trasmessa dall'altro, al fine di instaurare la visione stereoscopica. In una struttura
ancora più complessa si stabilisce infine cosa si è in concreto visto, e il risultato è
inoltrato verso altri settori del cervello per decidere cosa a questo punto occorre fare.
Le cellule nervose dei cervelli viventi, i cosiddetti neuroni, si possono trovare in due
condizioni completamente diverse, e cioè nello stato di quiete o in quello di attività.
L'attività dura ogni volta solo per un tempo breve, circa un millesimo di secondo. Fra
due fasi successive di attività di un neurone possono trascorrere secondi, minuti o
addirittura ore, oppure può anche capitare che il neurone si attivi in rapida
successione anche alcune centinaia di volte al secondo. Quest'attivarsi del neurone è
l'autentico segnale che trasmette il flusso di informazioni all'interno del cervello.
É stato dimostrato che in una rete di neuroni collegati fra loro si possono realizzare
tutte le operazioni logiche che sono alla base del funzionamento del calcolatore
digitale, e che le reti di neuroni sono quindi, almeno in linea di principio, in grado di
svolgere gli stessi compiti. Dal momento che è stato anche dimostrato che un
calcolatore, purché fosse sufficientemente grande, può risolvere ogni compito che
fosse formulato in modo abbastanza esatto, si è comprensibilmente desunto che le
possibilità di elaborazione di un cervello vivente debbono essere veramente notevoli.
Nel paragonare il cervello al computer occorre però tenere presenti delle differenze
fondamentali di funzionamento.
L'informazione nel computer è essenzialmente una configurazione temporale, nel
cervello invece è più che altro una configurazione spaziale. Il segnale tipico che entra
25
nel calcolatore e che percorre in ogni senso la macchina è una successione di impulsi
elettrici con precisi intervalli di tempo fra i singoli impulsi. Il tutto si svolge lungo un
filo o lungo pochi fili. Nel cervello invece il segnale tipico consiste in una
distribuzione di attività su enormi schiere di cellule nervose. L'ulteriore diffusione
non avviene lungo singole fibre, bensì lungo ampi fasci di fibre, un milione di fibre
per esempio fra l'occhio e il cervello.
I computer operano secondo schemi temporali precisi, il cervello no. Tutto quello che
avviene nel computer è rigidamente cadenzato: passo dopo passo si modifica durante
il calcolo la condizione interna del computer, nessuna parte componente deve
ritardare perché non ne sia sconvolto il piano secondo cui il calcolo avviene.
Nel cervello la cadenza temporale è molto più indolente; nel cervello ogni singolo
neurone è un elemento, da un certo punto di vista, alquanto inaffidabile, quali sono
appunto le cellule di un organismo: ognuna un po’ diversa dall'altra, con occasionali
manchevolezze, dipendenti da ogni immaginabile e possibile circostanza.
Paradossalmente, nel cervello, il funzionamento globale è migliore e più affidabile
del funzionamento delle singole parti prese separatamente.
Nel computer logica e memoria sono nettamente separate, nel cervello esse si
compenetrano nella stessa struttura.
Nel cervello si ha l'impressione che la memoria sia ovunque, l'esperienza interviene
ovunque, in misura maggiore o minore, a modificare i collegamenti fra neuroni, tanto
che il cervello in seguito funziona diversamente sulla base delle nuove esperienze.
Gli psicologi e, prima di loro, i filosofi hanno riflettuto a lungo sui principi in base ai
quali è possibile apprendere dall'esperienza. Il principio più importante e gravido di
conseguenze che sia stato proposto è quello dell'apprendimento mediante
associazioni. Eventi che si verifichino spesso insieme o in immediata successione,
sono collegati all'interno del cervello in modo tale che il manifestarsi del primo
evento evochi l'immagine dell'altro. É quindi mediante l'esperienza che si raffigura
all'interno del cervello la connessione tra le cose del mondo esterno: in essenza una
pratica d'uso che è in grado di estrarre le regolarità presenti nel mondo fisico.
All'interno del cervello in un qualche modo è rappresentato il mondo esterno, coi
neuroni che fungono da protagonisti e i collegamenti fra di loro da combinazioni
drammatiche in cui il grande mondo si riflette.
La legge di modificazione presenta un aspetto abbastanza semplice già intuito dai
filosofi: i neuroni che sono stati spesso attivi insieme sono più strettamente connessi
fra di loro. I neuroni paiono riconoscere, fra le molte fibre tra cui sono collocati,
quelle che sono spesso contemporaneamente attive, e pare che stabiliscano con queste
collegamenti particolarmente forti.
Nell'esperienza umana la singolarità della percezione del proprio io, nelle sue
funzioni cognitive e volitive, è l'esperienza primaria, fondamentale, irrevocabile, di
fronte alla quale ogni esperienza del mondo esterno non ha che un valore relativo.
I fisici hanno sempre cercato di ancorare le loro teorie in quello che sembra il
fondamento più insospettabile, il cosiddetto osservabile, vale a dire ciò che entra
nella sfera del soggettivo come materia prima, non ancora trasformata
dall'elaborazione teorica.
26
Dal punto di vista della scienza del cervello, la sfera della soggettività svanisce,
diventa inconciliabile con l'oggettività delle osservazioni sperimentali, l'io deve
essere trattato come un curioso epifenomeno che può essere trascurato ai fini della
coerenza del discorso neurologico.
La scienza del cervello è però anche sotto un altro profilo scienza dello spirito, e cioè
quello di una scienza che si occupa dello spirito nella sua più concreta
condensazione.
Ma lo spirito studiato dalle scienze del cervello è di un genere che non è compreso da
molti scienziati: è cioè matematico.
Parlare di spirito nelle scienze naturali può generare imbarazzo: occorre rispettare i
confini delle singole discipline scientifiche.
É certamente legittimo integrare carenze di conoscenza con ipotesi non verificabili,
ma ci si limita ad ambiti ristretti, perché poi emerge abbastanza rapidamente che in
settori contigui la propria ignoranza è invece oggetto delle ricerche specialistiche
altrui. La scienza si è frantumata in settori. Tuttavia l'articolazione accademica non
corrisponde a una delimitazione pratica di ambiti di interesse e di ricerca.
Tra tante una spaccatura è particolarmente significativa, quella tra la biofisica, la
logica e la cibernetica.
Molte enunciazioni su materie biologiche, particolarmente nell'ambito della biologia
comportamentale, sono di una specie tale da non essere riconducibili ai principi logici
e cibernetici, pertanto molti praticanti di scienze naturali si appellano nelle loro
spiegazioni a qualcosa che richiama l'usuale concetto di spirito.
Per esempio la forma di una penna maestra nell'ala di un uccello trova una
convincente spiegazione facendo riferimento alla funzionalità di questa forma in
relazione all'aerodinamica del volo.
Si può procedere così anche nell'analisi del cervello.
Certe connessioni di fibre fra cellule nervose si possono intendere in senso funzionale
quando si constati che un accorto ingegnere avrebbe disposto similmente i fili
elettrici di una macchina elaboratrice di dati.
Per i fisici simili spiegazioni, teleologiche, sono un orrore.
I fisici auspicherebbero una spiegazione fondata su processi causali e concatenati
determinati a partire da certi dati oggettivi soggetti a leggi naturali.
Un testo particolare non si può spiegare partendo dalle lettere di cui è composto,
perché con quelle stesse lettere si possono scrivere anche altri testi. Per la spiegazione
occorre addurre un contesto di ordine superiore, per esempio gli interessi comuni fra
chi ha scritto il testo e il lettore al quale è destinato.
Quando entra in gioco l'informazione diviene inevitabile far riferimento ad una mente
che possa interpretarla.
Dal momento che le peculiarità che emergono dalla connessione di molti elementi,
per esempio di molte cellule nervose nel cervello, non si possono dedurre
semplicemente dalle peculiarità degli elementi costituenti, e divengono talora chiare
solo a un più elevato livello di analisi, anche le costruzioni teoriche debbono divenire
alquanto complesse prima che valga la pena di compararle con la realtà: questa

27
circostanza fa sì che nella scienza del cervello si speculi in maniera maggiore di
quanto si fa di solito nelle scienze naturali.
Alcuni non vedono di buon occhio questa circostanza.
Esperimenti fatti con grandi calcolatori, in particolare nel campo dell'intelligenza
artificiale, non sono accettati come valido contributo alla neurologia da parte di
coloro che sono impostati in termini biofisici.
Il patrimonio concettuale della teoria dell'informazione e della tecnica delle
comunicazioni, offre un linguaggio certamente adeguato per la teoria cerebrale, solo
che i sistemi studiati nel cervello sono spesso così aggrovigliati e difficilmente
analizzabili che si possono usare i concetti tecnici solo nel loro senso filosofico, non
come elementi costitutivi di una teoria matematica.
Nel caso dell'occhio della rana si può individuare uno schema riconducibile alla
teoria dell'informazione. Ma il linguaggio dell'ambiente è oltre modo ridondante
rispetto al poco cui la rana deve reagire. Si comprende come sia ragionevole
codificare già nell'organo di senso in termini di un alfabeto che meglio corrisponda
alle esigenze vitali di una rana: per esempio riconoscere una mosca che si muove.
Ma un tecnico delle comunicazioni prova a questo punto un senso di disagio.
Egli si chiede: dov'è la sorgente di informazione? Nell'ambiente circostante oppure
nell'occhio? E dov'è il ricevitore? Nella rana o nel nervo ottico?
Comunque sarebbe sciocco rinunciare ai concetti chiarificatori come energia o
informazione solo perché la biologia non è ancora in grado di misurarli esattamente.
Il concetto di informazione, definito dai tecnici per situazioni decisamente artificiali,
può acquistare profondità solo quando mostriamo come si applica ai sistemi
biologici, e in particolare al cervello, che è in fondo il suo luogo di origine.
Potrebbe essere una rappresentazione adeguata ai processi che avvengono nel
cervello, se si considerano le attività degli organi di senso come proposizioni
sull'ambiente circostante, e le attività dei neuroni nel cervello, che sono influenzate
dagli organi di senso, come proposizioni complesse, le cui parti costituenti sono le
proposizioni elementari sensoriali. Le regole secondo cui, con proposizioni
elementari, si costruiscono proposizioni complesse e che consentono di trarre dalla
esattezza o dalla erroneità delle proposizioni elementari conclusioni sulla esattezza o
sulla erroneità di quelle complesse, sono definite nel calcolo logico. I connettivi del
calcolo dovrebbero allora, nell'applicazione al cervello, corrispondere alle
connessioni funzionali di cellule nervose all'interno del cervello o di cellule sensoriali
con cellule nervose.
Curiosamente, i tre modi di collegamento di neuroni fra loro, accertati mediante
analisi elettrofisiologiche, sono proprio quelli che corrispondono ai tre connettivi
logici più importanti: congiunzione, disgiunzione e negazione.
Quando si osserva per la prima volta una scena sconosciuta e non familiare la prima
impressione è quella di una confusa raccolta di segni incomprensibili. La visione
risulta disperante ma la calma osservazione delle strutture porta ogni volta,
lentamente, a un chiarimento. Il processo è sempre lo stesso, i suoi gradi rispecchiano
probabilmente le leggi generali di elaborazione delle informazioni. In un primo
momento la memoria visiva assorbe immagini senza isolare sistematicamente o
28
identificare addirittura i dettagli. Poi, ripetendo l'osservazione e particolarmente
osservando più volte diversi esemplari dello stesso tipo, emergono elementi la cui
denominazione diviene il punto di partenza per una concezione verbale, linguistica
della situazione. I pezzi del discorso possono essere elementi diversi, a seconda del
tenore della storia in cui si pensa di inserirli. E la storia acquista forma solo quando
gli elementi emergono dall'iniziale confusione. Il senso condiziona i segni, e l'insieme
dei segni produce il senso. La reciprocità è importante e del tutto generale: la si può
osservare anche nell'ambito del linguaggio. Quando un testo è comunicato in modo
poco chiaro o disturbato i singoli fonemi si riconoscono appena, però nel loro insieme
si colgono parole intere, e queste percepite come se i fonemi di cui consistono fossero
stati ascoltati con chiarezza. Nella percezione del linguaggio il reciproco
condizionamento di senso e di segno vale anche al livello immediatamente superiore:
singole parole sono riconosciute se si compongono in frasi e intere frasi sono
comprese se ne risulta un senso logico.
Il morfema corregge i fonemi, la frase corregge i morfemi, il racconto corregge la
frase: i vari livelli di senso di giustificano a vicenda.
Mentre parliamo o scriviamo, leggiamo o ascoltiamo, si muove nella nostra mente
insieme alle parole, un complicatissimo congegno fatto di immagini e concetti che,
mediante i reciproci rapporti associativi, determinano la scelta delle parole e, in chi
ascolta o legge, la loro interpretazione.
Le parole si apprendono, senza nemmeno comprenderle bene, unitamente allo
scenario del loro primo impiego.
Il percorso che va dalla parola pronunciata al concetto da essa evocata è lungo e
tortuoso e passa attraverso i processi di percezione.
Una prima idea che è stata sviluppata consiste nel realismo percettivo, ovvero in un
rapporto immediato tra lo stimolo e la sua rappresentazione mentale.
Il modello del realismo percettivo, proprio in quanto considera che il cervello abbia la
sola funzione di raddrizzare le immagini già descritte nella retina dell'occhio, è
certamente obsoleto. Non è neppure proporzionato al bisogno di rinnovamento
cognitivo nei riguardi della percezione, spostare il modello percettivo limitato alla
visione oculare, ammettendo che la visione del mondo esterno viene elaborata dalle
sezioni degli emisferi cerebrali occipitali, in quanto sappiamo che neppure l'area
neuronale occipitale, responsabile della rilevazione ed elaborazione dei dati sensoriali
percettivi è di per se capace di vedere; ciò in quanto il sistema nervoso tende ad
operare come un sistema di integrazione unitario. Infatti la percezione deve essere
significata tramite sistemi attenzionali di focalizzazione visiva, per effettuare un
riconoscimento mnemonico ed emozionale dei dati sensoriali; ciò comporta lo
sviluppo di una capacità di integrazione della azione di varie aree cerebrali, che
complessivamente ci rendono coscienti della nostra percezione visiva.
Nel quadro dell'avanzamento delle concezioni neurologiche moderne, il
riduzionismo del "realismo percettivo" rappresenta pertanto una approssimazione,
che rende difficile accordare l'occhio con una mente coscientemente creativa,
proprio in quanto l'uomo facendo riferimento ad un tale modello cognitivo
antiquato, tende facilmente a confondere le immagini virtuali, come realtà; per di
29
più assumendo lo stesso modello cognitivo riduzionista, come base per le
attuare rappresentazioni multimediale di una realtà immaginaria; ne consegue
che il confronto tra reale ed immaginario subisce un anomalo e costante
appiattimento, che tende ad inibire la differenziazione creativa dei nostri pensieri
e delle nostre azioni.
Per imitare in maniera sempre più perfetta la realtà che ci circonda è essenziale
conoscere a fondo i meccanismi della nostra percezione per imparare a sfruttarne
anche i limiti. Soltanto dopo aver compreso quanta parte del mondo esterno non
viene affatto percepita dai nostri sensi, è possibile selezionare le informazioni
veramente necessarie per ottenere riproduzioni verosimili.
Gli studi sulla percezione umana hanno contribuito non soltanto a definire le capacità
dei nostri cinque sensi, ma anche a spiegare come il meccanismo della conoscenza di
ciò che ci circonda sia condizionato non esclusivamente dal funzionamento dei
percettori, dei sensori di cui l'uomo dispone, ma anche dal "modello del mondo" che
il cervello utilizza nell'interpretare i segnali che essi ci trasmettono.
La mente, sulla base delle informazioni trasmessegli dai sensi, costruisce una sua
"realtà virtuale". Se il modello costruito è soddisfacente, l'uomo tende a confondere la
realtà con il modello e assume questo come base per le sue azioni.
L'avvento della registrazione e il progredire della disponibilità di informazioni ha
posto rapidamente il problema di quanto ricca debba essere l'informazione per fornire
un soddisfacente modello della realtà e appagare i nostri sensi.
Per adattare l'informazione digitale alla percezione, è stata impiegata una tecnica,
nota in letteratura già da molti anni, ma non applicata finché la disponibilità di
potenza di calcolo a basso costo non ha consentito di chiudere in economici chips
potenti strumenti di elaborazione numerica. Si tratta di riscrivere, con l'ausilio di
strumenti matematici, i numeri che compongono una immagine o un suono digitali in
una forma adatta al trattamento psicovisuale (o psicoacustico). Per trattare l'immagine
in video, ad esempio, questo modo di scrivere l'informazione evidenzia non la sua
consueta forma pittorica (punti luminosi o pixel, il cui valore numerico rappresenta
luminosità e colore) ma le cosiddette "frequenze spaziali" in cui numeri (sempre di
ugual consistenza, ma di valore diverso) rappresentano ora la presenza di determinate
forme elementari o sfumature di colore in una intera area di immagine. La somma di
tutte le forme elementari di una stessa area compone l'immagine finale.
Il vantaggio dell'operazione consiste nel fatto che, per ciascuna delle forme
elementari, sono noti i limiti percettivi. É quindi possibile scartare la parte
dell'informazione non percepibile e operare successivamente la trasformazione
inversa restituendo infine all'utente un'immagine depurata e adattata alla sue capacità
visive. L'esperienza dimostra che la gran parte delle cifre binarie che compongono
l'informazione audio o video può essere scartata senza che l'utente se ne accorga.
Nel tentativo di identificare i meccanismi cerebrali responsabili della comprensione e
della produzione del linguaggio e della visione, occorre fissare i livelli corrispondenti
dei campi di indagine, fisiologica, linguistica e percettiva.
L'immagine interna cerebrale di una parola, di un morfema, di un fonema, di un
rapporto lessicale o di una immagine, è da ricercarsi al livello molecolare della
30
sostanza nervosa, oppure risiede nell'attività delle singole cellule cerebrali, o in quella
di gruppi di centinaia o di migliaia o milioni di cellule?
Che cosa corrisponde, nell'attività delle cellule nervose, a un oggetto del mondo
esterno?
Sembra appurato che una tale rappresentazione non possa corrispondere all'attività di
singoli neuroni. Questi, nella regione del cervello meglio studiata, la corteccia visiva,
indicano con la loro attività la percezione di certe componenti elementari delle figure
ma non indicano mai la presenza di un evento di una complessità tale da richiedere
una risposta adeguata nel comportamento complessivo.
Gli eventi e gli oggetti che si presentano come conglomerati di tratti elementari, sono
rappresentati all'interno del cervello, a seconda della loro complessità, sotto forma di
raggruppamenti di decine, migliaia e forse decine di migliaia di neuroni.
Si può supporre che la definizione del repertorio fonetico fra il primo ed il secondo
anno di vita, irreversibile come l'acquisizione del repertorio dei tratti visivi, avvenga
in un processo di precisazione delle connessioni di fibre afferenti alla corteccia
cerebrale con i neuroni della corteccia stessa.
Non esistono regioni puramente sensoriali ed altre puramente motorie, collegate da
regioni associative. Dappertutto vi è la possibilità di introdurre dei dati nella
corteccia, e dappertutto se ne possono ricavare informazioni.
Anche in assenza di informazioni, le immagini interne possono continuare a
svilupparsi secondo le regole apprese, che verosimilmente approssimano quelle che
governano la realtà esterna.
Non solo la produzione di sequenze di parole, ma anche la loro percezione è un
processo attivo, creativo, estrapolazione continua, predizione di quello che avverrà a
partire da quello che c'è già, confronto della produzione interna con le sequenze che
arrivano dall'esterno, correzione e completamento contestuale di imperfezioni del
discorso: l'organismo interviene attivamente fin dall'inizio del processo percettivo.
Il bambino scopre ben presto le configurazioni grammaticali e stupisce i grammatici
con la sua abilità di generare proposizioni corrette, apparentemente costruite secondo
una grammatica che sembra esulare di gran lunga dal suo livello evolutivo.
Nel cervello si formano degli aggregati cellulari specificatamente connessi che si
stabilizzano sulla base di coincidenze di attivazione determinate dagli input
percettivi, per questa ragione il cervello risulta essere così sensibile alle sincronicità,
ovvero agli eventi che presentano una sincronia significativa.
Le regole grammaticali così come le leggi del mondo fisico sono per così dire
assorbite tramite l'uso nella fase di apprendimento e si riflettono nella struttura di
questi aggregati cellulari.
Negli ultimi anni si è molto discusso di due modi di articolare il pensiero, uno
causale-sequenziale e uno morfologico-sincronico.
Queste due modalità di pensiero si possono trovare congiuntamente nelle
argomentazioni scientifiche e non, e rappresentano una vera e propria spaccatura
nella scienza attuale.

31
La fisica, la matematica e la logica presuppongono una modalità di pensiero causale e
sequenziale, mentre la biologia non può fare a meno di prendere in considerazione
aspetti morfologici e sincronici.
Quando si cerca di spiegare il comportamento dei viventi il primo tentativo consiste
nell'individuazione di regole e leggi causali, ma inevitabilmente gli aspetti
morfologici si impongono come importanti guide del processo evolutivo.
Questa spaccatura genera una reciproca incomprensione che interseca in ogni senso la
comunità degli scienziati, e che ha spesso un effetto disorientante.
Una certa specie di filosofi ritengono l'esistenza della realtà intersoggettiva una
questione opinabile. In effetti l'unica cosa di cui ciascuno di noi è certo risiede nella
propria soggettività e il fatto oggettivo potrebbe essere una mera convenzione.
Esiste una asimmetria irriducibile tra il soggettivo e l'oggettivo.
Il concetto di informazione coinvolge aspetti che storicamente sono stati riservati ai
filosofi dello spirito: l'essenza dell'informazione è immateriale.
Si può misurare la quantità di informazione trasmessa in un telegramma, per scoprire
che un telegramma banale, con lo stesso numero di lettere, trasmette molta meno
informazione di uno accortamente formulato.
É stata riprodotta nei programmi per computer l'informazione e l'intelligenza per
consentire ad una macchina di battere il campione mondiale di scacchi.
Con l'aiuto del calcolo dei predicati si è risolto il problema di distinguere conclusioni
valide da quelle non valide: problema che aveva afflitto per mille anni i sillogisti
aristotelici.
Si è potuto risolvere, in certi casi, tramite programmi per computer il problema
filosofico dell'astrazione di una forma comune da figure simili fra loro.
Questi successi dell'analisi delle modalità di manipolazione dell'informazione hanno
spostato il limite di demarcazione tra le scienze esatte e l'ambito di ricerca filosofica.
Le scienze empiriche che si avvalgono dell'esperimento si differenziano da quelle che
si limitano all'osservazione non tanto per la teoria della conoscenza quanto per lo stile
di ricerca. La necessità di spiegazioni causali determina l'atteggiamento dello
sperimentatore. Il ricercatore si espone nell'enunciare chiaramente le sue ipotesi e si
espone a maggior ragione quando sostiene, di un esperimento riuscito, di poterlo in
un qualsiasi momento ripetere.
Quando invece le teorie sono costruite solo su osservazioni non sempre è possibile
ripetere le osservazioni cruciali che hanno condotto ad una determinata spiegazione
dei fatti, e spesso, nella teoria stessa, i fatti non sono inseriti seguendo un metodo di
spiegazione riconducibile direttamente a cause ed effetti.
Le cause devono precedere nel tempo i loro effetti perché possano essere addotte per
le spiegazioni causali. La causa del comportamento di un animale può essere ricercata
nel futuro: in particolare il comportamento manifesta uno scopo.
Ci sono molti fenomeni nella biologia che si possono spiegare molto più rapidamente
e in modo assai convincente se si dà accesso al concetto di scopo.
Utilizzare il concetto di scopo significa avere due diversi modi di spiegazione, quello
causale in senso stretto e quello teleologico.
Esiste una antitesi concettuale tra sostanza e struttura.
32
Molti testi di neurologia si occupano della relazione di singole parti del cervello con
singole facoltà della psiche. Nella teoria della localizzazione ci si è per lo più
accontentati della prova che l'integrità di una certa parte del cervello è necessaria per
la corrispondente funzione, per esempio attenzione, movimenti espressivi,
orientamento, senza intraprendere il tentativo di spiegare la specifica funzione con la
specifica trama delle connessioni fra le cellule nervose nel settore di cervello
corrispondente. La teoria della localizzazione non vuole altro che localizzare sostanze
psichiche in pezzi di sostanza cerebrale.
Si considera la psiche, nella sua essenza, una sostanza.
Gli psicologi propensi al pensiero strutturale, cercano con predilezione situazioni in
cui l'oggetto di studio possa risolversi in una struttura complessa, in una compagine
funzionale, in relazioni fisico-chimiche oggettivamente definite.
Pensiero volto alla sostanza e pensiero volto alla struttura non si possono equiparare a
osservazione ingenua e ad analisi scientifica.
Il desiderio che l'esperienza sia una sostanza ha indotto molta gente a trascurare che
una teoria chimica della memoria pone assai più domande di quelle a cui presume di
rispondere.
La dicotomia tra pensiero volto alla struttura e pensiero volto alla sostanza ha
storicamente profonde radici nella nostra tradizione filosofica.
Esiste un'altra spaccatura nelle scienze naturali, su cui si è sollevato molto scalpore,
vale a dire la cesura che separa la ricerca quantitativa da quella solo qualitativa.
A volte non esistono le basi matematiche sufficienti per trasformare una teoria
qualitativa in una ricerca sperimentale quantitativa, ma ciò non inficia la validità
stessa della teoria, purché rispetti la coerenza, la non contraddittorietà e la
corrispondenza ai fatti osservabili.
Nel corso di una ricerca importante, che si trovi ancora nella sua fase di evoluzione,
le categorie teoriche preconcette di conoscenza più che essere utili sono a volte di
disturbo. Quando si tratta ancora di acquisire molta informazione, ci si avvale di tutti
i metodi possibili e si spera che la scienza stessa cui ci si dedica fornisca la chiave
giusta per la sua decifrazione. Così per esempio i fisici hanno imparato dalla fisica, e
non dalla filosofia, che un concetto di causalità concepito in termini troppo rigidi
induce all'errore.
Il fatto di impegnarsi a favore del modo globale di considerare le cose della
morfologia potrebbe suscitare l'impressione che si voglia trascendere i risultati e i
metodi imposti dalle scienze esatte, ma questo non è corretto.
I metodi della fisica falliscono spesso di fronte ai problemi complessi della
psicologia, l'approccio olistico suggerito dalla morfologia può venirci in aiuto in
molti casi e fornirci spiegazioni verosimili dei fatti osservati: ci vorrà ancora
parecchio tempo per sviluppare una matematica adatta alla psicologia.

33
Il significato del significato
Nel corso dell'intera storia della razza umana nessun'altra questione ha provocato
maggiori preoccupazioni, tumulti e disastri della corrispondenza tra parole e fatti.
É proprio l'indagine sulla natura della corrispondenza tra parola e fatto, adoperando
questi termini nel senso più largo, a costituire il problema più caratteristico e
importante della scienza del significato. Sebbene sia impossibile negare che ogni
parola corrente ha le sue radici nei fatti della nostra coscienza e della storia, è una
faccenda assai diversa determinare esattamente a che cosa corrispondono tali fatti.
La concezione primitiva è che il nome sia indicativo o descrittivo della cosa, dal che
si potrebbe derivare che dalla esistenza del nome si deduce l'esistenza della cosa.
Ovviamente questa assunzione è completamente falsa.
L'atteggiamento nei confronti del linguaggio che deve essere superato consiste nel
ritenere che l'uso delle parole presupponga un significato stabilito una volta per tutte
e che il significato possa essere colto tramite l'uso di vaghe metafore.
I sostantivi sono segni applicati alle cose: contengono esattamente quel tanto di verità
che può essere contenuto in un nome, una quantità necessariamente piccola in
proporzione alla realtà dell'oggetto. Il nome astratto è adeguato all'oggetto in quanto
rappresenta una semplice operazione della mente.
Se prendo una entità reale, un oggetto esistente in natura, sarà impossibile per il
linguaggio introdurre nella parola tutte le idee che l'entità o l'oggetto risveglia nella
mente: il linguaggio è costretto a scegliere, crea quindi un nome come puro e
semplice segno.
Una volta accettato il nome si libera del proprio significato etimologico.
Le parole implicano il movimento del parlare e al tempo stesso, come strumenti del
pensiero, implicano delle idee. Le idee hanno un aspetto sociale e un aspetto
individuale, e ad ogni istante il linguaggio contiene in sé sia un sistema stabilito sia
un'evoluzione.
La lingua è la somma delle immagini verbali accumulatesi in tutti gli individui, un
tesoro depositato dalla pratica del parlare nei membri di una data comunità; un
sistema grammaticale, virtualmente esistente in ciascun cervello, e nei cervelli di un
corpo di individui; la lingua raggiunge il suo massimo di perfezione soltanto
considerando l'intera massa di individui che la parlano.
I simboli, di qualsiasi natura essi siano, hanno un ruolo preminente nel flusso del
pensiero umano.
I simboli ci aiutano e a volte ci ostacolano nel processo di riflessione sulle cose.
I simboli orientano e organizzano, registrano e comunicano.
É il pensiero o il riferimento ad essere orientato ed organizzato.
Le parole non significano niente di per se stesse, solo quando chi pensa fa uso delle
parole, queste tengono il luogo di qualcosa, è l'intero processo cognitivo che avviene
nel parlare che possiede un significato.

34
Per essere adoperabile il linguaggio deve essere uno strumento pratico. Ai fini della
maggiore o minore utilizzazione di una frase, la maneggevolezza e la comodità sono
sempre più importanti della precisione.
Dal punto di vista dell'utilizzo, il linguaggio viene spesso usato per la promozione di
scopi piuttosto che come mezzo per simboleggiare i riferimenti.
Il significato delle parole non ha più lo stesso rapporto con le cose, ma viene
cambiato dagli uomini come sembra loro meglio.
Anche quando i veri riferimenti non sono dubbi, non ci si rende forse abbastanza
conto di quanto sia diffusa l'abitudine di sfruttare il potere delle parole non solo per
comunicare in buona fede ma anche come mezzi di inganno.
Esiste un aspetto che riguarda la modalità con cui ognuno di noi interagisce col
linguaggio, ovvero il proprio punto di vista.
Se restringiamo l'oggetto della ricerca alle idee e alle parole dal nostro punto di vista
introspettivo, e omettiamo ogni franco riconoscimento del mondo al di fuori di noi,
inevitabilmente introduciamo elementi di confusione in argomenti come la
conoscenza percettiva, la verifica e il significato stesso.
Il linguaggio deve trovare il proprio significato a livello oggettivo anche se sono i
singoli processi cognitivi soggettivi che di volta in volta attribuiscono un senso alle
frasi di un discorso.
Fin dai primissimi tempi, i simboli adoperati dagli uomini per favorire il processo del
pensiero e per registrare le loro conquiste sono stati una fonte ininterrotta di stupore
ed inganno. L'intera razza umana è rimasta fino a tal punto impressionata dalle
proprietà delle parole come mezzi per il controllo degli oggetti, che in ogni età ha
attribuito loro poteri occulti: la parola è magica.
La potenza delle parole è la forza più conservatrice esistente nella nostra vita.
Lo schema concettuale ereditato, che ci circonda da ogni parte e che ci giunge
naturalmente e indiscutibilmente come l'aria che respiriamo, ci è non di meno
imposto e limita in innumerevoli maniere la nostra libertà di movimento intellettuale,
con tanta maggiore determinatezza e irresistibilità quanto più, inerendo al linguaggio
stesso che dobbiamo usare per esprimere i più semplici significati, esso viene adottato
e assimilato ancor prima che noi si sia in grado di cominciare a pensare per conto
nostro.
Dalla struttura del linguaggio è difficile persino pensare di sfuggire.
Un termine è tutto ciò che può essere oggetto di pensiero o può ricorrere in qualsiasi
enunciato vero o falso, o può essere calcolato. Un uomo, un istante, un numero, una
classe, una relazione, una chimera o qualunque altra cosa possa essere citata è un
termine. Un termine possiede le proprietà di una sostanza o di un sostantivo.
Ogni discorso sensato è sensato solo per convenzione e non per sua natura o per il
fatto di essere uno strumento naturale.
Quando riflettiamo sugli influssi che possono aver richiamato l'attenzione dei
pensatori greco-romani sui problemi linguistici, è a prima vista sorprendente che
molti di coloro i cui sistemi erano in così larga misura verbali fossero anche sotto
certi aspetti pienamente consapevoli del carattere ingannevole del loro strumento.

35
Sono proprio i logici più abili a essere indotti a elaborare i sistemi più fantastici con
l'aiuto della tecnica verbale, e a volte risulta difficile cogliere il riferimento esatto di
termini così astrusi ed astratti.
Nei ragionamenti definiti di solito metafisici, il linguaggio ha innanzitutto la funzione
di fornire uno stabile supporto verbale, per cui concetti inesatti, nebulosi e fluttuanti
possono essere richiamati alla mente ogni qual volta se ne sente il bisogno, senza
alcun pregiudizio per la elasticità dei concetti stessi.
Il guscio verbale conserva traccia di una passata esistenza di concetti che ora non ci
sono più, la scomparsa di qualsiasi contenuto intellettuale implicherebbe la
scomparsa di ogni traccia della passata esistenza di ogni contenuto. Ma i guscio
preserva qualcosa che, proprio in quanto dimostra la passata esistenza di un concetto
che precedentemente aveva una vita reale, può benissimo esser preso per un concetto
ancora esistente: la parola fissa la realtà in maniera tale che sia possibile parlare
anche di oggetti inesistenti.
Dall'uso simbolico delle parole passiamo così all'uso emotivo.
Un significato emotivo, si trasforma in una sorta di linguaggio musicale che stimola
sentimenti ed emozioni.
La parola significa ciò che desideriamo significhi per il nostro gradimento emotivo.
La teoria contestuale dei segni getta luce sull'idea che le parole e le cose siano poste
in relazione tra loro da qualche legame magico; poiché è in effetti a causa del loro
ricorrere insieme con le cose, a causa del loro collegamento con esse in un contesto,
che i simboli svolgono una parte importante nella nostra vita, una parte che non
soltanto li ha resi oggetto legittimo di meraviglia ma anche fonte di ogni nostro
potere sul mondo esterno.
Il primo obiettivo che l’interpretazione semantica mira a soddisfare è il reperimento
dell'informazione testuale o documentaria seguendo le parole che la portano; a questo
scopo occorre assegnare ad ogni parola isolata una rappresentazione del suo
significato e istituire relazioni tra le parole stesse (sinonimia, iperonimia, meronimia,
ecc.). Le relazioni lessicali tra le singole parole sono, tradizionalmente, espresse
secondo i formalismi proposti dagli psicologi cognitivi, come le reti semantiche i
frames o le semplici relazioni lessicali.
Per fornire l’interpretazione semantica di una frase, invece, occorre disporre di una
descrizione del significato delle singole parole tale che si possa combinare con le
parole circonvicine in un significato composito, secondo la gerarchia dei sintagmi.
La logica é la disciplina che fornisce una base credibile alla rappresentazione del
significato di una frase, soprattutto considerando che ci fornisce lo strumento
automatico per ragionare sul contenuto delle frasi prima di avviarle ad una qualche
forma di esecuzione. Inoltre, la logica costituisce uno strumento adeguato anche per
la rappresentazione delle relazioni tra parole.
La logica in quanto tale ha per obiettivo la trasduzione delle frasi del linguaggio in
formule che possono essere trattate da un sistema di ragionamento e per le quali è
possibile calcolare una semantica, in termini di un valore di verità (vero/falso). Nel
campo della linguistica computazionale, la verità o falsità della formula non é

36
rilevante; acquisisce maggiore rilievo la rappresentazione in termini logici solo per lo
schema formale.
Una frase introduce un certo numero di oggetti, tra i quali stabilisce una relazione o
dei quali predica qualcosa. In termini di rappresentazione, il verbo funge da predicato
e i suoi complementi sono gli argomenti. Dunque, un prerequisito essenziale per la
costruzione della struttura predicativa di una frase é la definizione della cosiddetta
reggenza stretta del verbo, cioè quanti e quali elementi sono suoi argomenti
obbligatori o inerenti (agente, oggetto, ricevente ecc.).
Il significato, termine cardinale di ogni teoria del linguaggio, non può essere discusso
senza una teoria soddisfacente dei segni.
Analizzando il significato dal punto di vista introspettivo le risposte che vengono
fornite concordano nel sostenere che, quando pensiamo a qualcosa, abbiamo con
questo qualcosa una relazione di tipo assolutamente unico.
Il pensare è considerato un avvenimento non paragonabile a nient'altro.
Nel corso di tutta la vita trattiamo le cose come segni.
Ogni esperienza, adoperando la parola nel senso più largo possibile, è interpretata.
Gli effetti provocati sull'organismo da un segno, che può essere uno stimolo esterno o
un processo interno, dipendono dalla storia passata dell'organismo, in particolare vi
saranno eventi della storia passata, engrammi, che determinano più direttamente la
reazione dell'organismo stesso.
Quando un contesto ci ha influenzato nel passato, il ripresentarsi anche di solo una
parte del contesto stesso ci indurrà ad interpretare quell'engramma nel modo
originario. Il processo mentale provocato dal richiamo di un engramma è un
adattamento analogo: nella misura in cui è conoscitivo, ciò a cui si adatta è il suo
riferente ed è ciò che significa il segno che lo eccita.
Ogni apprendimento per esperienza costituisce un esempio del fatto che un atto di
interpretazione è soltanto un membro particolare di un contesto psicologico; e un
contesto psicologico è una serie ricorrente di eventi mentali che sono in rapporto
particolare tra loro per quanto riguarda le caratteristiche principali.
I contesti psicologici ricorrono ogni qualvolta riconosciamo o deduciamo.
Il linguaggio astratto, che è indispensabile impiegare, dà luogo ad alcune difficoltà.
Il problema principale delle parole astratte, ovvero fondate in maniera puramente
simbolica senza una base percettiva, consiste nella naturale incredulità sull'esistenza
dei riferimenti corrispondenti.
Quando si tenta di definire il tipo di contesto psicologico in cui consiste un
riferimento astratto, i termini relativi richiederebbero una sintesi, ovvero la
determinazione dei casi particolari che hanno originato il concetto astratto.
Un riferimento è collegato ai contesti psicologici ed esterni mediante i quali si
rapporta al suo riferente. In una discussione sulla composizione dei riferimenti
occorre discutere sulle relazioni reciproche tra i contesti relativi.
Le forme logiche degli enunciati e le forme dei riferimenti sono forme o strutture di
contesti determinativi delle interpretazioni e sono affrontate dai logici studiando il
procedimento simbolico.

37
Consideriamo l'idea o concezione del verde. Essa sorge per esempio a causa
dell'apparizione della parola verde. In molte occasioni questa parola è stata
accompagnata dalla presenza di cose verdi. Così il ricorrere della parola provoca nel
lettore un certo processo che possiamo chiamare l'idea del verde. Ma questo processo
non è l'idea di una particolare cosa verde; una simile idea sarebbe più complessa e
richiederebbe un segno, o un simbolo, con ulteriori caratteristiche che debbono essere
interpretate: solo in questo modo l'idea formulata può diventare specifica.
L'idea del verde non si collega ad una cosa particolare ma è generale.
Volendo assumere un atteggiamento scientifico verso il mondo, si potrebbe accettare
l'ipotesi generale che il riferimento sia riducibile a relazioni causali. In tal caso il
significato nel senso di riferimento diverrebbe un campo di ricerca aperto ai metodi
sperimentali, tuttavia nell'esaminare i processi coscienti e critici di attribuzione di un
significato, dobbiamo renderci conto che molte delle attività di interpretazione, si
basano su processi mentali istintivi strettamente dipendenti dai singoli individui.
Con lo sviluppo della conoscenza siamo diventati molto meno certi di quanto non
fossero i nostri antenati circa quel che sono le sedie e i tavoli, i fisici e i filosofi non
sono ancora riusciti a risolvere completamente il problema. Tutti sono d'accordo sul
fatto che le sedie e i tavoli sono là e possono essere toccati, ma tutti i competenti sono
altrettanto d'accordo sul fatto che ciò che vediamo non sono propriamente quegli
oggetti: essi non corrispondono esattamente a ciò che i sensi rilevano.
Occorre rendersi conto che la percezione può essere trattata scientificamente solo in
un certo ambito ristretto: ovvero solo quando si analizzano le sue caratteristiche come
situazioni segniche.
Il modo in cui passiamo dalle sensazioni semplici ai giudizi di percezione coinvolge,
in una maniera estremamente complessa, i nostri contesti psicologici.
Le sensazioni che stanno alla base di tutte le percezioni sono segni soggettivi degli
oggetti esterni e le qualità delle sensazioni non sono le qualità degli oggetti.
Noi siamo autorizzati a continuare a parlare di tavoli sulla base della nostra
esperienza diretta perché lo abbiamo appreso direttamente; venir direttamente
appreso significa provocare determinati accadimenti nei nervi, realizzare processi di
modificazione dei nostri organi sensoriali e del nostro sistema nervoso.
Ogni esperienza è una interpretazione che passa attraverso i nostri processi cognitivi.
Quando parliamo di un tavolo, in realtà, non facciamo riferimento ai tavoli reali o a
quello che i fisici possono dirci sui tavoli, ma facciamo riferimento alle nostre
diversificate esperienze sensoriali con i tavoli, convenientemente generalizzate e
concettualizzate dalla nostra mente.
Le modificazioni della retina apprese direttamente sono i segni iniziali degli oggetti e
degli eventi; le caratteristiche delle cose che elaboriamo mediante l'astrazione sono
segni di secondo o di terzo ordine.
Alla base di ogni comunicazione vi sono determinati postulati o prerequisiti,
presupposti normativi senza i quali non potrebbe svilupparsi alcun sistema di simboli,
alcuna scienza, e neppure la logica.
Un simbolo sta al posto di un riferente e nella maggior parte dei casi questo riferente
è complesso.
38
I simboli della matematica sono particolari in quanto sono simboli o di altri simboli o
di operazioni compiute con simboli: nella matematica un simbolo sta al posto di uno
e di un solo riferente.
Grande cura si pone nell'eliminare le ambiguità di significato.
É questa particolarità che si esprime spesso dicendo che la matematica pura è astratta,
o formale, o che non si riferisce ad alcunché.
Wittgenstein è riuscito a persuaderci che gli enunciati della matematica sono
equazioni, dunque pseudo enunciati e che il metodo con il quale la matematica
perviene alle sue equazioni è il metodo di sostituzione.
La matematica è in certa misura la esposizione di esperimenti fisici immaginati,
registrati e rappresentati tramite sequenze di simboli.
Il sistema simbolico della matematica, altamente sistematizzato, diviene in grado di
elaborare i fatti per proprio conto senza un esplicito riferimento alle cose reali.
I computer basati su leggi matematiche divengono delle macchine pensanti in grado,
quando opportunamente programmati, di fornire risultati che non possono essere
previsti con alcun processo consistente di immaginazione di esperimenti fisici.
La risposta al difficile interrogativo sulla natura della matematica consiste in una
combinazione di proprietà che essa dimostra possedere: la matematica non è una
disciplina omogenea. Non solo simboli singoli ma interi sistemi di simboli possono
servire a innumerevoli usi, e la matematica si è dimostrata estremamente versatile dal
punto di vista delle sue possibili applicazioni.
I simboli che possono essere sostituiti l'uno con l'altro hanno la stessa connotazione, e
dovrebbero a rigor di logica simboleggiare il medesimo riferimento.
Il riferente di un simbolo contratto è il riferente di tale simbolo esteso.
Molto spesso nell'uso i simboli vengono contratti per comodità, per coglierne il senso
pieno occorre estenderli fino alla loro forma piena: fino a una forma capace di
indicare le situazioni segniche al di là del riferimento simboleggiato.
Le classi sono finzioni simboliche e per coerenza di ragionamento anche gli
universali non sono altro che una convenzione dello stesso tipo: le qualità universali
sono fantasmi vuoti dovuti al potere rifrangente del mezzo linguistico.
Che alcune cose siano simili rientra nella conoscenza naturale. Ma, sfruttando
l'economia del simbolismo, porre ciò alla base della conoscenza metafisica,
trasformare ciò in una prova dell'esistenza di un altro mondo di puro essere, dove le
entità sussistono ma non esistono, non è un modo corretto di procedere. Nessun
ragionamento sul mondo è valido se basato unicamente sul modo di comportarsi di un
sistema simbolico. É una sorpresa che la matematica riesca a descrivere i fenomeni
fisici con tanta precisione e corrispondenza.
Matematicamente un simbolo si riferisce a ciò cui effettivamente si riferisce nell'uso
che ne viene fatto; nel linguaggio comune invece il simbolo può di volta in volta
riferirsi a ciò che viene inteso da un interprete o a ciò cui intendeva riferirsi colui che
lo ha adoperato: in questo caso il simbolo può essere interpretato secondo scopi e
finalità differenti diventando ambiguo ed incerto.
Abbiamo bisogno di conoscenza per perfezionare i nostri simboli, così come abbiamo
bisogno di simboli perfezionati per far progredire la conoscenza.
39
Quando usiamo il linguaggio definiamo le cose o le parole?
Quando definiamo le parole accenniamo a qualcosa di assai diverso da ciò a cui ci si
riferisce e da ciò che si intende con definire le cose.
Quando definiamo le parole prendiamo un'altra serie di parole che possono essere
usate col medesimo riferimento della prima.
Quando si tratta delle cose non viene effettuata alcuna sostituzione di questo genere.
Esiste una lunga disputa tra i sostenitori delle definizioni reali e simboliche.
Benché la definizione sia una sostituzione simbolica, le definizioni devono in genere,
essere espresse in una forma che le fa apparire relative alle cose.
Inoltre le definizioni servono a scopi o situazioni particolari, e di conseguenza sono
applicabili soltanto in un campo ristretto e in un ristretto universo di discorso.
Ogni qualvolta un termine viene utilizzato al di fuori dell'universo di discorso in cui è
definito, diventa una metafora e necessita di una ulteriore definizione.
Per una corretta definizione di un termine occorre identificare il riferente.
Per far ciò occorre trovare una serie di riferenti che sia certamente comune a tutto ciò
di cui si tratta e su cui si possa garantire l'accordo, e individuare il riferente richiesto
mediante i suoi collegamenti con essi.
Data la multiforme complessità dei nostri discorsi, le cose sono collegate tra loro in
innumerevoli modi, ma per fortuna esistono dei tipi di collegamento fondamentali
che sono in numero limitato: per esempio lo sviluppo dell'astrazione che chiamiamo
relazione spaziale o anche relazione temporale.
Quando qualcuno ci chiede una informazione, per essere in grado di rispondere,
dobbiamo avere un punto di partenza familiare, e ciò può essere garantito in pratica
solo quando si tratta di qualcosa di cui abbiamo diretta, e non solo simbolica,
consapevolezza e per scopi più rigorosi saranno richiesti punti di partenza che
possiamo indicare o sperimentare.
Le relazioni non sono da considerare parte del materiale di cui è composta la natura, e
quando sembra che parliamo di esse le usiamo in realtà come strumenti, il che non
implica l'esistenza di riferimenti reali corrispondenti.
Esistono relazioni semplici e relazioni complesse, relazioni dirette e relazioni
indirette, relazioni evidenti e relazioni che non lo sono.
Una prima possibilità di definizione dei simboli consiste nella denotazione diretta.
Per generalizzare questo tipo di definizione ci si può appellare all'uso delle relazioni
di somiglianza, la discriminazione di una relazione di somiglianza richiede
generalmente l'impiego di esempi paralleli o analogie.
La somiglianza stessa può essere usata come relazione definente di un simbolo.
Le relazioni spaziali e temporali sono anch'esse relazioni che possono essere usate ai
fini di una definizione di simboli in un determinato contesto.
Le definizioni sono di grande importanza nella costruzione di sistemi deduttivi,
scientifici: la costruzione di macchine pensanti automatiche per le quali la logica e la
matematica costituiscono le regole o le istruzioni.
La comunicazione è una faccenda assai complicata, ed è un evento relativamente raro
trovare una stretta corrispondenza di riferimento nei diversi pensatori.

40
In tutte le discussioni troveremo che quanto viene detto è determinato solo in parte
dalle cose alle quali l'oratore si riferisce, spesso senza averne chiara consapevolezza,
la gente è soggetta a scopi che determinano il loro uso delle parole. Se non siamo
consci dei loro obiettivi e dei loro interessi, non capiremo di che cosa stanno parlando
e se i loro riferimenti coincidano o no con i nostri.
Le parole nel discorso ordinario acquistano usi derivati e aggiuntivi attraverso
scivolamenti metaforici di vario grado di sottigliezza e attraverso quelli che si
potrebbero chiamare accidenti linguistici, ciò è sufficiente a dimostrare l'estrema
improbabilità che un elenco comune di qualche interesse o importanza ricorra in tutti
gli usi accettabili di una determinata parola.
L'esistenza di parole dal significato indeterminato, come per esempio la parola
"bello", dovrebbero far desistere dalla tentazione di ricercare significati essenziali o
irriducibili per tutte le parole del linguaggio comune.
Come possiamo definire la bellezza?
La bellezza è in realtà un esempio eccellente della impossibilità di trovare un
riferente universale per tutti gli individui che utilizzano lo stesso linguaggio, e mette
in luce il rischio che si corre in qualsiasi dibattito che sia acritico dal punto di vista
simbolico sull'uso corrente delle parole.
Termini come bellezza vengono adoperati nel discorso in considerazione del loro
valore emotivo, ne deriva inevitabilmente qualche confusione, e occorre rendersi
conto ad ogni istante che le parole così impiegate sono indefinibili.
Proprio tali impieghi indefinibili hanno con indubbia frequenza fatto sorgere l'ipotesi
dell'esistenza di qualità semplici, come la bellezza, di natura metafisica.
L'impiego di parole di questo tipo è totalmente diverso dall'impiego scientifico,
ovvero dall'uso rigorosamente simbolico delle parole, anche se sarebbe sbagliato non
considerarle meritevoli di attenzione.
L'aspetto emotivo avviluppa e colora sempre l'espressione logica del pensiero. Non
ripetiamo mai la stessa frase due volte; non adoperiamo mai due volte la stessa parola
col medesimo valore; non vi sono mai due fatti linguistici assolutamente identici;
questo è dovuto alle circostanze che incessantemente modificano le condizioni della
nostra emotività.
Gli stati di contemplazione estetica debbono la loro pienezza e ricchezza alla
complessità, alla varietà e alla vastità del mondo interiore.
Non si dovrebbe mai pretendere che una affermazione scientifica possa fornire una
visione della realtà più illuminante o più profonda di altre conseguite in maniera del
tutto differente. Può essere più generale o più utile, ma sempre di pari dignità.

41
Rappresentazione del mondo
Le caratteristiche generali e permanenti del mondo esterno vengono rappresentate nel
cervello per mezzo di configurazioni relativamente durature di connessioni
sinaptiche.
Le caratteristiche specifiche e mutevoli dell'ambiente sensoriale immediato in cui il
cervello è immerso vengono rappresentate da una configurazione mutevole dei livelli
di attivazione nei molti neuroni del cervello, quali per esempio quelli della retina e
della corteccia visiva.
Ogni livello di attivazione neuronale in ogni dato istante costituisce il ritratto che il
cervello si fa della situazione locale in cui si trova qui e ora, l'attivazione neuronale è
continuamente aggiornata da stimoli e inibizioni che, in ultima analisi, derivano tutti
dal mondo esterno.
Il cervello non ha la limitazione di poter formare rappresentazioni puramente visive,
il cervello ritrae la realtà in molte dimensioni sensoriali e verbali.
Se ci poniamo la domanda di chi è che sta guardando in questo momento il grande
spettacolo della rappresentazione così costituita, la risposta potrebbe essere: nessuno
che possa essere distinto dal cervello considerato come un tutto.
Ogni parte del cervello viene "guardata" da qualche altra sua parte, e spesso da
diverse parti contemporaneamente.
Gli schemi di attivazione dei neuroni della retina oculare, per esempio, sono
controllati da uno strato distinto di neuroni che si trova in una specie di grappolo nel
mezzo del cervello, chiamato corpo laterale genicolato (o nucleo laterale genicolato,
NGL). I neuroni della retina proiettano il loro ritratto collettivo del mondo esterno
verso l'interno, lungo un cavo di fibre ultrasottili dette assoni. Il cavo di assoni
costituisce il nervo ottico che trasporta verso il nucleo laterale genicolato
informazioni dettagliate sullo schema di attivazione presente nei neuroni della retina.
A loro volta, i neuroni dal NLG proiettano i propri assoni verso una zona piuttosto
ampia della superficie posteriore del cervello, la corteccia visiva. Questi neuroni
corticali ricevono informazioni sullo schema di attivazione presente nei neuroni del
NLG. Il NLG è perciò a sua volta monitorato dalla corteccia visiva.
Il trasferimento di informazione da una zona all'altra del cervello è mediato da una
intricata configurazione di connessioni sinaptiche.
Le connessioni sinaptiche hanno una importanza vitale nei confronti dell'attività del
cervello, perché, tipicamente, nel momento in cui passano l'informazione alla
popolazione di neuroni accanto, trasformano lo schema dell'informazione che
ricevono e trasmettono. Modificano l'informazione, la selezionano, la riducono
all'essenziale e, in generale, la interpretano utilizzando una tecnica molto sofisticata.
Le zone corticali fanno qualcosa di più del semplice limitarsi a ripetere o a riprodurre
lo schema di attivazione originale, le molteplici connessioni modificano lo schema di
arrivo in modo da formare una nuova configurazione nella zona di destinazione.

42
Il processo di "stare a guardare", ovvero il processo di interpretazione della
rappresentazione degli schemi di attivazione nelle precedenti popolazioni di neuroni,
non è affatto un processo passivo. Via via che lo schema presente nella popolazione
di neuroni della retina si muove verso l'interno, passando da una popolazione di
neuroni specializzati alla successiva, la configurazione originale viene, a ogni tappa,
progressivamente trasformata dalla configurazione delle connessioni sinaptiche
intermedie. É in questo modo che avviene la gran parte del calcolo cerebrale.
Questo metodo di calcolo, la trasformazione di uno schema in un altro passando
attraverso una vasta configurazione di connessioni, è chiamato calcolo distribuito
parallelo (CDP); esso presenta tutta una serie di vantaggi assolutamente decisivi nei
confronti dello stile di calcolo detto seriale, utilizzato nei calcolatori digitali.
In primo luogo il calcolo parallelo è molto più veloce di uno seriale almeno per una
vasta gamma di problemi. É più veloce perché esegue molte singole operazioni
simultaneamente, anziché una dopo l'altra in successione.
Se ora guardiamo all'interno del cervello e non solo alla corteccia visiva, che è
relativamente piccola, noteremo che il cervello può eseguire centomila miliardi di
calcoli elementari nello stesso intervallo di tempo, 10 msec, dato che questo è il
numero di connessioni sinaptiche che possediamo e dato che ciascuna di esse esegue
la sua piccola operazione indipendentemente.
Un calcolatore parallelo può subire disfunzioni, inattivazioni e persino l'interruzione
di un gran numero delle proprie connessioni e nello stesso tempo non subire altro che
un degrado marginale delle proprie prestazioni complessive.
Il contributo di ogni sinapsi alla trasformazione globale di uno schema in un altro è
così piccolo che una perdita, distribuita casualmente, di una connessione ogni dieci
lascerebbe in piedi un sistema in grado di eseguire approssimativamente la stessa
trasformazione che eseguiva prima di essere danneggiato.
Il cervello è andato altamente sviluppandosi per milioni di anni e non dipende dalla
perfezione dei suoi componenti. Deriva la sua velocità di calcolo dalla natura
massicciamente parallela del modo in cui tratta l'informazione. E deriva la sua
persistenza funzionale dalla natura massicciamente distribuita del suo modo di
codificare e registrare l'informazione.
Una velocità eccezionale e la persistenza funzionale sono importanti, ma sono appena
le prime voci di una lista di proprietà cognitive affascinanti dei calcolatori paralleli.
In particolare si possono elencare:
- la capacità di riconoscere figure o caratteristiche attraverso un velo di disturbi e
distorsioni, o anche se viene fornita solo una informazione parziale;
- la capacità di cogliere analogie complesse;
- la capacità di richiamare l'informazione necessaria, istantaneamente, ogni volta
che essa possa essere utile in circostanze nuove e inaspettate;
- la capacità di focalizzare l'attenzione su diverse caratteristiche dell'input
sensoriale;
- la capacità di mettere alla prova una serie di diverse ipotesi cognitive in una
situazione problematica;
- la capacità di riconoscere qualità sensoriali particolari e indefinibili;
43
- la capacità di muoversi con grazia e coerenza nell'ambiente fisico;
- la capacità ci comportarsi in accordo a determinati scopi.
Da alcuni decenni si discute alacremente se queste capacità sono realmente al di là di
un qualsiasi sistema materiale di calcolo. Tali capacità sembrano sfuggire alle
possibilità di un computer seriale tradizionale che funzioni in tempo reale, ma non
sono affatto al di là delle possibilità di un calcolatore parallelo.
Si potrebbe dire che vedere la rilevanza e l'analogia in mezzo alla confusione e al
rumore è ciò che i calcolatori paralleli fanno meglio.
La situazione, sia teorica sia sperimentale, è cambiata in modo spettacolare
nell'ultimo decennio, con le nuove teorie e con le nuove tecniche sperimentali ci è
oggi possibile cominciare a rivolgerci all'intera scala dell'attività cognitiva animale e
umana. É oggi possibile introdurre in una problematica tradizionalmente filosofica la
discussione di modelli artificiali verificabili e una dettagliata informazione
neurobiologica.
Mentre tutti noi partecipiamo alla ricchezza della vita sensoriale, dobbiamo fare molti
sforzi per riuscire a comunicare agli altri anche solo le sue più rozze caratteristiche.
La nostra capacità di descrizione verbale non si avvicina nemmeno lontanamente alle
nostre capacità di discriminazione sensoriale.
Tale disparità deriva da una differenza fondamentale fra la strategia di codificazione
impiegata nel linguaggio e quella utilizzata nel sistema nervoso.
Il linguaggio adopera un insieme discreto di nomi e ricade in metafore imperfette
quando la sottigliezza della situazione sensoriale supera la disponibilità di nomi.
Il sistema nervoso impiega un sistema combinatorio di rappresentazione, sistema che
permette una analisi capillare di ogni sottigliezza sensoriale che gli si presenti.
Questa circostanza ci permette di discriminare e riconoscere molto più di quello che
possiamo solitamente esprimere a parole.
Prendiamo per esempio la codificazione dei sapori.
I sapori sono vari e complessi, ma il sistema di codifica si basa solo su quattro tipi di
recettori diversi. Riguardo al problema di riconoscere una pesca, non è il livello di
reazione presente in ogni singolo tipo di recettore che conta, quanto piuttosto lo
schema collettivo di tutti e quattro i tipi.
Ogni schema è una specie di firma o di impronta digitale specifica.
Ogni gusto, qualsiasi sapore, è un unico schema di attivazione presente nei quattro
tipi di cellule, una combinazione specifica.
Le parole non si assomigliano graficamente l'una con l'altra, ma gli schemi neurali di
attivazione corrispondenti possono invece essere confrontati in maniera significativa.
In questo modo le rappresentazioni cerebrali dei vari sapori possibili sono disposte in
uno spazio sistematico di somiglianze e differenze.
Un sistema così semplice nasconde una potenzialità inaspettata.
Il sistema visivo utilizza la stessa tecnica per codificare i colori.
La retina contiene tre distinti tipi di coni, cellule fotosensibili, ciascuno dei quali è
sintonizzato su una lunghezza d'onda diversa. Questi coni fotosensibili proiettano
collettivamente i loro livelli di stimolazione verso popolazioni neuronali diverse,

44
anch'esse composte di tre tipi di cellule. Queste cellule realizzano il vero e proprio
spazio dei colori, uno spazio che ha tre dimensioni.
Ogni colore umanamente percepibile è uno schema di attivazione distinto fra tre tipi
di neuroni coinvolti nel processo di percezione.
Molte relazioni conosciute tra i colori sono diretta conseguenza dello schema di
codifica adottato dal cervello.
Seguendo questa linea di ragionamento possiamo ipotizzare che anche il
riconoscimento di oggetti complessi, quali per esempio i volti umani, siano codificati
dal cervello utilizzando la medesima tecnica di codifica.
La codificazione vettoriale dei volti produce gli stessi vantaggi combinatoriali.
I membri della stessa famiglia tenderanno a essere codificati nella stessa regione
dello spazio facciale come conseguenza della somiglianza dei loro volti.
La tecnica della rappresentazione facciale con vettori ad alta dimensione ci permette
di cogliere aspetti che non potrebbero essere colti per altra via.
La teoria del riconoscimento dei volti basata sulla codificazione vettoriale, per quanto
possa essere affascinante, deve vincere una valida obiezione. Gli esseri umani non
possiedono tipi distinti di cellule sensoriali, ciascuno dei quali sensibile a un aspetto
specifico di un viso percepito. Non abbiamo un analogo sensoriale dei quattro tipi di
recettori del gusto.
Come riusciamo allora a rappresentarli e a riconoscerli?
Per cercare di rispondere occorre analizzare in maggiore profondità come funziona il
calcolo vettoriale.
Anche se sulla retina non ci sono cellule che rispondono specificatamente ai vari
aspetti dei volti umani rilevanti per riconoscere le facce, collettivamente le cellule
della retina contengono informazione sulle facce percepite, come parte implicita del
loro schema globale di attivazione cellulare, tale informazione viene trasmessa e
interpretata successivamente in altre regioni cerebrali.
I tipi cellulari che codificano i volti debbono essere cercati, non alla periferia
sensoriale, ma molto più internamente, in questa catena di popolazioni cellulari.
Un danno fisico isolato in un settore specifico del lobo parietale del cervello produce
una strana condizione, nota come agnosia facciale. I pazienti mostrano una perdita
altamente specifica della normale capacità di riconoscere i volti, persino quelli che in
precedenza conoscevano molto bene.
Sembra che esista una popolazione di neuroni ben distinta, specializzata nella
codificazione dei volti, che si trova cinque o sei gradini a valle della retina.
Le molte connessioni sinaptiche fra le cellule retiniche e le lontane cellule preposte
alla codifica dei volti nel lobo parietale, filtrano e trasformano l'informazione in
arrivo in modo tale che le "cellule facciali" rispondano alle dimensioni che hanno
importanza nella struttura facciale, e solo ad esse.
Queste dimensioni, già codificate implicitamente nello schema globale di attivazione
della retina, vengono per così dire estratte dalle cellule facciali.
Possiamo immaginare che una intera popolazione di cellule, ciascuna delle quali
specifica per una determinata configurazione, ciascuna delle quali riceva un insieme
completo di terminazioni che si proiettano dagli assoni della retina. Ciascuna di
45
queste cellule arriva a possedere una configurazione di connessioni eccitatorie e
inibitorie che la trasforma in un rivelatore di una e una sola configurazione fra tutte
quelle possibili.
Caratteristiche distributite nel livello di entrata possono essere raccolte senza errori
nei livelli successivi di neuroni grazie all'attività di filtro di un sistema di connessioni
assolutamente posizionate e specifiche.
Vettori di codificazione alla periferia del sistema sensoriale possono in questo modo
essere processati e trasformati attraverso una matrice di connessioni sinaptiche.
Alcuni ricercatori nel campo delle reti neurali sono recentemente riusciti a
modellizare un sistema di rappresentazione e discriminazione di volti che funziona in
maniera adeguata seguendo i principi descritti.
Esiste una tecnica generale per addestrare una rete neurale, in particolare per trovare
soluzioni sinaptiche di problemi trasformazionali, tecnica ampiamente utilizzata da
chi si occupa di modelli neurali: essa comporta il continuo aggiustamento in risposta
alle pressioni dell'esperienza.
Questa tecnica è definita aggiustamento sinaptico per mezzo di successiva
retropropagazione degli errori.
Essa consente di trasformare ciascuno dei tantissimi possibili vettori in entrata in un
vettore in uscita che sia in qualche modo appropriato.
Nel caso di una rete neurale artificiale, a differenza del cervello vivente, possiamo
ottenere una risposta assolutamente precisa alla domanda: qual è lo stimolo
preferenziale a livello dello stato di input di ciascuna cellula di ogni strato coinvolto
nel compito del riconoscimento dei volti?
Questo perché il computer seriale utilizzato nell'addestramento della rete conosce
l'esatto valore delle connessioni sinaptiche fra due cellule qualsiasi dell'intera rete.
La risposta che otteniamo relativamente alla rete per il riconoscimento dei volti
risulta piuttosto sorprendente.
Ci saremmo potuti aspettare che ogni cellula si focalizzasse su qualche caratteristica
facciale localizzata, ma la ricostruzione degli stimoli preferenziali effettivi dimostra
che la rete utilizza una strategia di codifica alquanto differente.
Ogni singola cellula abbraccia l'intera superficie dello strato di input e, piuttosto che
una caratteristica facciale isolata di un qualche genere rappresenta una struttura
intera, simile a un volto. Questi stimoli preferenziali non corrispondono nemmeno a
singoli volti esistenti con cui la rete è stata addestrata.
Sembrano incorporare una varietà di caratteristiche decisamente olistiche.
Tali caratteristiche rappresentano le dimensioni dell'elemento "faccia", dimensioni
per le quali il linguaggio ordinario non possiede un vocabolario adeguato.
I ricercatori in questo campo hanno coniato il termine olone per indicare uno stimolo
o caratteristica preferenziale di questo tipo, diffuso, esteso globalmente.
Presumibilmente questa modalità di codifica è un modo efficace ed efficiente di
codificare l'informazione necessaria per trovare la trasformazione corretta tra input e
output. Inoltre questo metodo possiede una importante caratteristica: contribuisce a
dare alla rete capacità di persistenza funzionale nel caso di danni alle cellule o di
disfunzioni sinaptiche.
46
Ogni singolo elemento contiene tutta l'informazione necessaria e la sua informazione
è distribuita su tutte le cellule.
Si comincia a intravedere qualcosa di molto importante: una struttura gerarchica di
categorie riconoscibili.
Le partizioni nello spazio di attivazione delle cellule rappresentano delle categorie.
Si potrebbe dire che la rete ha sviluppato nel corso del suo addestramento una
famiglia di concetti rudimentali, che vengono attivati da input sensoriali appropriati.
La comparsa dei concetti nelle creature viventi potrebbe consistere nello stesso tipo
di suddivisione degli spazi di attivazione neuronale.
Una caratteristica che emerge dalle reti neurali è che esse possono produrre una
risposta corretta anche nel caso in cui vi sia una perdita di informazione nel vettore di
entrata. Tale proprietà è la loro capacità di operare ciò che viene chiamato
completamento di un vettore.
Questo fenomeno di completamento di un vettore potrebbe essere una forma
primitiva di inferenza induttiva e si manifesta come un fenomeno cognitivo naturale e
inevitabile anche nella più semplice delle reti neurali.
Da molti punti di vista la rete artificiale rappresenta solo un modello parziale
dell'intricata realtà neuronale, e senza dubbio ci sono molti altri aspetti che nemmeno
conosciamo, però essa rappresenta indubbiamente un utile modello di chiarificazione
su come certi processi possano avvenire in una rete di neuroni.
Il problema di costruire una macchina in grado di leggere testi scritti ad alta voce è
stato affrontato utilizzando dapprima le tecniche di programmazione seriale e in
seguito utilizzando una rete neurale.
Il confronto fra questi due approcci e i relativi risultati sono estremamente
significativi e illustrano molto bene le potenzialità delle reti neurali e la loro
particolare modalità di trattamento dell'informazione.
Il problema consiste nella costruzione di un algoritmo di correlazione tra i singoli
caratteri e i fonemi corrispondenti nella lingua parlata.
Utilizzare la tecnica algoritmica tradizionale significa codificare in un insieme di
regole fisse tutte le possibili correlazioni causali tra caratteri e fonemi considerando
anche le eventuali eccezioni.
Utilizzando una rete neurale tutto ciò che si deve fare è addestrare la rete su un
campione sufficientemente significativo di casi selezionati.
Effettivamente questi due diversi programmi sono stati portati a termine da ricercatori
che hanno utilizzato i due approcci alternativi.
Mentre il programma per calcolatore seriale ha richiesto la stesura di codice
macchina impiegando risorse valutabili in diversi anni-uomo, alla rete neurale è
bastata una settimana di addestramento.
Un aspetto interessate è stato quindi analizzare come tale rete si fosse strutturata per
eseguire il compito richiesto.
La rete aveva autonomamente costruito una suddivisione dei input sensoriali in una
modalità che ricorda molto da vicino la formazione di concetti.
In particolare aveva separato le consonanti dalle vocali senza nessun aiuto o indizio
da parte degli sperimentatori.
47
Lo spazio delle configurazioni presentava una suddivisione dettagliata in classi
discriminatorie abbastanza ben definite che potevano essere messe in relazione da un
funzione di somiglianza, in particolare la rete aveva costruito una metrica sulle
configurazioni possibili.
La rete esibisce un sistema di categorie in relazione fra loro, un sistema di concetti, la
cui attivazione è responsabile del raffinato comportamento nel trasformare lettere in
fonemi con una discreta precisione.
Lo strumento che si è dimostrato così utile per la comprensione dei processi
all'estremità, quella sensoriale, in entrata del sistema neuronale, la codificazione
vettoriale, si dimostra altrettanto utile all'estremità in uscita, quella motoria.
Per controllare una vasta popolazione di muscoli distinti, il cervello utilizza un
sistema di codificazione vettoriale che invia ai muscoli, tutti in una volta, uno schema
di livelli di attivazione. Ogni componente di questo schema di attivazione arriva
all'appropriata fibra muscolare dettandone la tensione a seconda dell'ordine di
grandezza della componente in arrivo. Una intera popolazione di muscoli viene
orchestrata simultaneamente in modo da assumere una configurazione collettiva di
tensioni: il corpo si muove armoniosamente nell'ambiente.
Il cervello comanda a milioni di neuroni motori e dirige un'orchestra di migliaia di
muscoli con impulsi correlati e simultanei. La codificazione vettoriale a più
dimensioni è una ottima soluzione per un problema tanto complesso.
Per risolvere il problema della coordinazione motoria, il cervello deve affrontare il
problema di come trasformare un vettore sensoriale in arrivo nel suo appropriato
vettore motorio in uscita.
Ancora una volta le reti neurali ci vengono in aiuto per comprendere come questo
strabiliante risultato sia possibile.
Una rete neurale può approssimare con successo un compito simile.
Questo è possibile grazie alla correlazione che si instaura, nella rete, tra una posizione
nello spazio motorio e la corrispondente posizione nello spazio sensoriale.
Stiamo toccando un aspetto fondamentale dell'intelligenza: la capacità di eseguire le
trasformazioni sensomotorie che guidano il comportamento, la capacità di fare la
cosa giusta relativamente alle circostanze che vengono percepite.
Esiste però un aspetto che deve essere indagato ulteriormente: l'aspetto temporale.
Il comportamento si estende nel tempo.
Azioni quali prendere un oggetto, correre, parlare, implicano tutte una successione di
posizioni corporee ben orchestrate.
Un cervello reale che guida un corpo reale deve generare non solo un singolo vettore
motorio da consegnare una tantum ai suoi molti muscoli, ma piuttosto una
successione continua di vettori motori che varierà in dipendenza del tempo,
producendo, nel tempo, i cambiamenti corporei opportuni.
Da questo punto di vista, il sistema nervoso non è mai a riposo.
A questo scopo, per tener conto della dimensione temporale, dobbiamo introdurre il
concetto di traettoria nello spazio delle configurazioni vettoriali.

48
Abbiamo bisogno di una forma di sensibilità a eventi specifici del passato recente e di
un qualche meccanismo per cui tramite questa informazione sia possibile modellare
l'attività cognitiva corrente.
In altri termini abbiamo bisogno di una qualche forma di memoria a breve termine.
Le reti che modellizzano l'attività neurale possiedono una forma di memoria: le
conoscenze o le abilità incorporate nella configurazione globale dei loro pesi
sinaptici. Ma questa forma di memoria è completamente cieca nei confronti dei
dettagli di specifici eventi passati.
La configurazione finale di una rete neurale non contiene alcuna registrazione dei
singoli input e output prodotti considerati individualmente.
Per ottenere un effetto di memoria a breve termine dobbiamo introdurre un aspetto di
feedback, ovvero di ritorno indietro, nei processi di trasmissione dei vettori di
attivazione.
Nel cervello sono presenti un gran numero di percorsi discendenti.
L'informazione si può trasmettere quindi anche in un senso retrogrado, un assone
ricorrente o discendente si origina in una cellula che si trova molto avanti nel
percorso di trasmissione dell'informazione, e produce allora informazione sulla
attività passata della rete neurale, attività che diviene presentemente disponibile per
essere trattata, specificatamente in quello strato di neuroni in cui il percorso
discendente va a terminare.
Tale percorsi discendenti fanno in modo che l'immediato passato cognitivo sia
disponibile per essere trattato insieme con l'informazione sensoriale relativa al
presente.
Una rete ricorrente così congeniata può generare complesse successioni di vettori di
attivazione da sola, persino quando i suoi strati di input rimangono silenziosi.
Una successione di punti nello spazio delle attivazioni, una linea, può chiudersi su se
stessa e diventare un ciclo che indica la presenza di un comportamento periodico.
Queste traettorie non necessariamente devono essere sempre curve chiuse.
Non tutti i comportamenti sono periodici, né tutte le azioni si ripetono in successione
e non tutti i movimenti finiscono dove sono cominciati.
Nonostante che una memoria a breve termine così concepita si estenda nel passato
soltanto per una frazione di secondo, una rete ricorrente ben addestrata può
nondimeno rappresentare successioni temporali di lunghezza arbitraria, perché può
generare da sola, tramite la modulazione ricorrente della propria attività vettoriale,
lunghe successioni di vettori di attivazione.
Gli spazi di attivazione delle reti ricorrenti sono configurati in una gerarchia di
categorie riccamente strutturata, come succede nelle reti non ricorrenti.
La differenza consiste nel fatto che, nel caso di reti ricorrenti, le categorie hanno
spesso una dimensione temporale: sono traettorie invece che singoli punti.
Come la discriminazione percettiva nelle reti non ricorrenti consiste nell'attivazione
innescata percettivamente di un vettore di attivazione appropriato, la discriminazione
percettiva in una rete ricorrente consiste spesso nell'attivazione, innescata
percettivamente, di una successione vettoriale appropriata: successione il cui

49
dispiegamento è dovuto principalmente all'attività ricorrente della rete stessa,
piuttosto che agli stimoli percettivi esterni che essa riceve.
Nelle reti ricorrenti avviene un ulteriore fenomeno interessante.
Il modo in cui un oggetto è percepito non è determinato univocamente dallo stimolo
esterno che arriva ai sensi, è determinato anche dal precedente stato cognitivo, dal
contesto mentale di chi percepisce.
Ed è proprio questo che le reti ricorrenti riescono a fare.
Input sensoriali identici possono occasionalmente portare a rappresentazioni vettoriali
del tutto diverse in dipendenza dello stato interno corrente.
Il cervello opera un completamento vettoriale di input parziali o degradati, un
completamento che spesso è sostenuto dalla manipolazione ricorrente che il cervello
opera sulle popolazioni neuronali di rappresentazione coinvolte nella situazione.
Questo processo mostra come si arrivi a riconoscere, forse lentamente dapprima, ma
poi assai più rapidamente, che alcune situazioni non familiari, incerte, o altrimenti
problematiche sono un esempio o un caso particolare di qualcosa che ci è già ben
noto o che comunque avevamo già visto prima.
Le reti neuronali ricorrenti mostrano delle potenzialità veramente strabilianti.

50
Elaborazione parallela distribuita
L'idea dell'elaborazione parallela distribuita, ovvero la nozione che l'intelligenza
possa emergere dall'interazione di un grande numero di semplici processi, possiede
una lunga tradizione, ma solo ora essa sta diventando un modo di pensare fecondo e
gravido di promettenti risultati sperimentali.
Questa idea diviene sempre più attraente al fine di simulare le caratteristiche tipiche
della percezione, memoria, linguaggio e pensiero umano.
Sembra ovvio che per mostrare le prestazioni tipiche di un cervello umano occorra un
tipo di elaborazione massivamente parallela.
Il cervello esegue dei compiti che richiedono generalmente considerazioni simultanee
di parecchi parti di informazione o vincoli.
Ogni vincolo può essere specificato imperfettamente o essere ambiguo, ciascuna
parte dell'informazione può essere decisiva per il comportamento complessivo.
L'elaborazione parallela offre una base computazionale per modellare i processi
cognitivi che dovrebbe essere più aderente di approcci tradizionali allo stile di
elaborazione che sembra realizzarsi nel cervello umano.
In ogni istante dobbiamo eseguire un grande numero di considerazioni
semplicemente per determinare come afferrare gli oggetti.
La posizione dell'oggetto, la nostra posizione, la dimensione, la forma, la stima del
peso, eventuali ostacoli che si frappongono tra noi e l'oggetto, tutti questi fattori
congiuntamente determinano la maniera esatta che noi useremo per avvicinarci e
afferrare l'oggetto.
Anche nel processo linguistico operano contemporaneamente diversi vincoli: esiste
una mutua influenza tra sintassi e semantica.
Come il ruolo sintattico di una parola può influenzare il ruolo assegnato ad un'altra
parola in una frase, così l'identificazione di una lettera può influenzare il
riconoscimento di una parola.
A prima vista la situazione sembra paradossale: l'identità di ciascuna lettera è
vincolata dalla identità di tutte le altre lettere di cui si compone la parola.
Il nostro sistema percettivo è in grado di esplorare tutte le possibilità grafiche delle
lettere in una parola contemporaneamente, tenendo in considerazione tutte le
relazioni tra lettere nello stesso momento.
É importante aver ben presente che in molte situazioni quotidiane non è possibile
risolvere un problema con la tecnica sequenziale, ovvero utilizzando degli script.
Molto spesso ci troviamo di fronte alla mutua interazione tra un rilevante numero di
differenti fonti di informazione: un numero di differenti parti di informazione
debbono essere tenute in mente allo stesso istante.
Questo sembra coinvolgere un meccanismo in cui ciascun aspetto dell'informazione
relativamente ad una determinata situazione possa interagire con gli altri aspetti,
influenzando simultaneamente ogni altro aspetto ed essendo a sua volta influenzato.

51
Il modello di elaborazione parallela distribuita assume che l'elaborazione
dell'informazione abbia luogo attraverso l'interazione di un gran numero di processi
elementari semplici chiamate unità, ciascuna delle quali invia segnali eccitatori o
inibitori alle altre unità.
La ragione che ci spinge a sviluppare modelli di elaborazione parallela distribuita
(EPD) dell'informazione risiede in considerazioni neurofisiologiche.
Il cervello consiste in un gran numero di elementi strettamente interconnessi che
apparentemente sembrano svolgere delle funzioni elementari abbastanza semplici,
messaggi di tipo eccitatorio o inibitorio da un elemento all'altro, e ogni elemento si
aggiorna e reagisce sulla base dei messaggi che riceve.
Le proprietà delle unità in molti modelli EPD sono ispirati alle proprietà base degli
strati neuronali del cervello, ma questa non è l'unica ragione.
Vi sono anche ragioni psicologiche e ragioni puramente computazionali che ci
spingono a sviluppare tali modelli.
L'approccio EPD ci costringe a modificare radicalmente le nostre concezioni
relativamente al corso del tempo nell'elaborazione, la natura delle rappresentazioni
dell'informazione, e i meccanismi di apprendimento.
I processi cognitivi umani esaminati alla scala dei minuti e dei secondi ci appaiono
come processi sequenziali, ma se esaminiamo questi processi a livello di
microsecondi ci accorgiamo che in realtà essi avvengono in parallelo.
In generale gli oggetti a cui ci si riferisce nei modelli a livello di macrostruttura nei
processi cognitivi appaiono come descrizioni approssimate di proprietà emergenti a
livello della microstruttura del sistema.
Meccanismi di elaborazione parallela possono aiutarci a capire come per esempio sia
possibile governare il comportamento sensomotorio nel caso di un robot che debba
afferrare un oggetto posto dinanzi a lui senza perdere l'equilibrio.
Il problema consiste nel muovere simultaneamente gli arti in accordo con i vincoli
imposti dai movimenti possibili per il robot.
Il robot deve raggiungere l'obiettivo di afferrare l'oggetto e nello stesso tempo deve
mantenere il controllo del proprio centro di gravità.
Il processore di controllo del movimento delle gambe deve essere sincronizzato
sinergicamente con il processore di flessione ed estensione delle braccia.
I tentativi di programmare un robot per eseguire questo compito hanno messo in
risalto il problema di mantenere la coordinazione dei movimenti che devono essere
eseguiti in parallelo: la soluzione migliore consiste nell'azione di un numero di
semplici processori ciascuno dei quali tenta di soddisfare i vincoli indipendentemente
e in parallelo agli altri processori.
Un sistema di elaborazione parallela è in grado di completare un'informazione che si
presenti in forma parziale. Per esempio nel riconoscimento di parole parzialmente
nascoste il riconoscimento può avvenire grazie al fatto che il sistema elabora
l'informazione in maniera complessiva, ovvero tenendo conto di tutto il campo
percettivo, in tal caso le relazioni tra le lettere producono un effetto di reciproca
influenza che consente al sistema di riconoscere correttamente la parola.

52
Tramite il calcolo parallelo si riesce a dare una spiegazione delle regole grammaticali,
non in termini di regole ortografiche come è stato proposto dai linguisti, ma in
termini di relazioni emergenti dall'elaborazione parallela distribuita del testo.
Anche il meccanismo di memorizzazione e recupero dell'informazione può trovare
utili modelli nello schema dell'elaborazione parallela.
Supponiamo di immaginare che ciascun ricordo sia rappresentato da unità che
interagiscono mutuamente e che ciascuna unità rappresenti una proprietà relativa al
ricordo stesso. Quando ogni proprietà del ricordo diviene attiva, il ricordo diverrebbe
attivo e tutto il suo contenuto sarebbe recuperato. Ogni proprietà del ricordo
costituirebbe una valida modalità di accesso, e quando un numero di proprietà
sufficiente venisse attivato si otterrebbe il recupero immediato del ricordo.
Inoltre, poiché l'informazione è distribuita su un gran numero di elementi, uno
stimolo simile allo stimolo originario è in grado di produrre il recupero completo
dell'informazione memorizzata.
Anche il processo di generalizzazione trova una forma molto semplice e naturale nel
modello di elaborazione parallela, infatti un sottoinsieme parziale di proprietà
costituisce di per se stesso una generalizzazione dell'oggetto originario e tale
sottoinsieme può essere attivato in maniera indipendente.
In molti modelli di elaborazione parallela l'informazione non viene memorizzata
come una copia statica, ma piuttosto ciò che costituisce la memoria sono la forza di
connessione tra le singole unità, sono i pesi assegnati ai singoli nodi che consentono
il recupero dell'informazione. Ogni singola unità contiene una parte
dell'informazione, ma non contiene una copia dell'informazione, è l'attivazione
complessiva che consente il recupero dell'informazione memorizzata.
Questa differenza di trattamento dell'informazione ha enormi implicazioni sia dal
punto di vista delle modalità di elaborazione sia per le capacità di apprendimento.
La rappresentazione della conoscenza è di importanza fondamentale per le successive
potenzialità di elaborazione.
Utilizzare la conoscenza in un determinato processo non significa eseguire operazioni
di recupero dell'informazione rilevante dalla memoria per utilizzarla, ma è una parte
essenziale del processo stesso di elaborazione.
Le implicazioni per i processi di apprendimento sono altrettanto profondi, poiché la
conoscenza è memorizzata nei pesi delle connessioni, imparare significa trovare i
giusti pesi affinché il pattern di attivazione risulti quello corretto. Ciò apre la
possibilità che un processo di elaborazione dell'informazione possa imparare come
risultato di un aggiustamento progressivo dei pesi delle proprie connessioni,
diventando quindi capace di catturare le interdipendenze tra le attivazioni a cui nel
tempo viene esposto.
L'obiettivo dell'apprendimento non diventa quindi la formulazione di regole esplicite,
ma piuttosto si assume che il comportamento dettato dalle connessioni conosca ed
utilizzi tali regole.
Inoltre per apprendere non diventa più necessario avere una capacità computazionale
sofisticata, ma semplicemente un meccanismo di modulazione molto semplice dei

53
pesi delle connessioni che funzioni basandosi su una informazione locale disponibile
in ciascun elemento della rete.
Una regola semplice che porta ad un apprendimento in una rete è la seguente:
aggiustare il peso di una connessione tra due unità A e B in proporzione al prodotto
della loro attivazione simultanea.
Questa regola si presta molto bene ad una interpretazione biologica in cui l'organismo
che vive in un certo ambiente rafforza con l'uso e in concomitanza di coincidenze
significative le proprie capacità discriminatorie.
Ovviamente questa regola è molto semplice e i ricercatori ne hanno proposto diverse
altre più potenti, ma tutte le regole di apprendimento proposte hanno la proprietà di
aggiustare i pesi delle connessioni in funzione dell'informazione disponibile
localmente tra le singole unità.
L'apprendimento allora corrisponderebbe ad un processo molto semplice che può
essere implementato localmente ad ogni connessione senza la necessità di qualsiasi
supervisore globale.
Il fatto che pattern simili tendano a produrre effetti simili consente ai modelli
distribuiti di mostrare un tipo di generalizzazione spontanea, estendendo il
comportamento appropriato per un pattern ad altri che sono simili.
Se esistono delle regolarità tra le corrispondenze tra coppie di pattern, il modello
estrae in maniera naturale queste regolarità.
Il concetto di elaborazione parallela distribuita non si esaurisce nella realizzazione di
una rete neurale tradizionale che è storicamente la prima pratica applicazione del
modello ma può trovare applicazioni anche in strutture di altro tipo che
eventualmente utilizzano al loro interno modalità di trattamento dell'informazione
non semplicemente connessionistiche; utilizzando per esempio la logica fuzzy,
principi competitivi del tipo utilizzato negli algoritmi genetici o altre modalità di
elaborazione dell'informazione.
Tipicamente possiamo rintracciare i seguenti aspetti caratterizzanti i modelli di
elaborazione parallela distribuita:
- un insieme di unità elementari di elaborazione
- uno stato di attivazione
- una funzione di output per ciascuna unità
- una rete di connessioni tra le singole unità
- una regola di propagazione per trasmettere pattern di attività attraverso le
connessioni della rete
- una regola di attivazione per combinare i segnali di input di ciascuna unità con lo
stato corrente dell'unità che produce un nuovo livello di attivazione
- una regola di apprendimento attraverso la quale i pattern sulle connessioni sono
modificati dall'esperienza
- un ambiente all'interno del quale il sistema può operare.
In questi modelli il sistema risulta essere plastico nel senso che i pattern di
interconnessione non sono fissi per tutto il tempo, piuttosto i pesi si modificano con
l'uso e man mano che l'esperienza procede, inoltre il sistema può lavorare in modi
sostanzialmente differenti.
54
In ogni modello di elaborazione parallela occorre specificare un insieme di unità di
elaborazione, queste unità possono rappresentare oggetti particolari come lettere,
parole o concetti, oppure essere semplicemente elementi astratti su cui pattern dotati
di significato possono essere definiti.
Il lavoro di ogni unità consiste semplicemente nel ricevere un input dalle unità vicine
e come funzione dell'input calcolare un valore di output da inviare a sua volta alle
corrispondenti unità nel suo intorno.
Il sistema è intrinsecamente parallelo in quanto molte unità possono eseguire le loro
computazioni nello stesso lasso di tempo.
Le unità si possono suddividere in unità di input di output o interne.
Le unità di input raccolgono gli stimoli provenienti dall'esterno.
Le unità di output mandano all'esterno i segnali risultanti l'elaborazione.
Le unità interne sono unità non visibili dall'esterno del sitema.
Lo stato di attivazione specifica il pattern di attivazione su un insieme di unità che
cattura quello che il sistema sta rappresentando ad un certo istante.
L'evoluzione nel tempo del pattern di attivazione su un certo insieme di attività
rappresenta l'elaborazione complessiva del sistema.
L'output di ogni unità viene calcolato in accordo con una determinata funzione
specifica del modello, in generale si parla di un vettore di attivazione.
Le unità sono connesse le une con le altre, è questo pattern di connessioni che
costituisce cosa il sistema conosce e determina come il sistema risponde ad un
arbitrario segnale di ingresso.
In molti casi ogni unità fornisce un contributo aggiuntivo all'input delle unità a cui è
connessa, l'input totale può essere la somma pesata di tutti i contributi forniti dalle
singole unità connesse, in questo caso il pattern totale di connettività può essere
rappresentato specificando i pesi per ciascuna connessione del sistema.
Per esempio un peso positivo può indicare una eccitazione mentre un peso negativo
uno stimolo inibitorio.
In generale comunque sono possibili modelli con pattern di connettività più
complessi, una data unità può ricevere input di tipo differente i cui effetti sono
sommati in maniera differenziata. In particolare vi possono essere delle regole di
eccitazione e di inibizione specifiche per il trattamento di determinati stimoli.
A volte risulta conveniente disporre di due tipi di connessione diversi per gli stimoli
eccitatori e quelli inibitori.
Nella rete è necessaria anche una regola di propagazione che determini il vettore di
output che rappresenta i valori di attivazione per ogni unità che si propagano nella
rete, tale regola normalmente procede in avanti nella successione degli strati della
rete, ma in modelli più articolati essa può anche procedere all'indietro.
La regola di attivazione consente a ogni particolare unità di combinare lo stato di
attivazione delle altre unità con il proprio output specifico.
Ad ogni istante nella rete si succedono i diversi stati di attivazione in dipendenza
delle singole elaborazioni elementari dettate dalla regola di attivazione.
Anche se in molti modelli la regola di attivazione è una funzione lineare, essa può
anche essere una funzione non lineare degli input.
55
Il pattern di connessioni si modifica con l'esperienza, cambiando il processo o la
struttura di conoscenza cambia di conseguenza anche la struttura delle connessioni.
In particolare possono verificarsi tre tipi di modificazione:
1. Possono svilupparsi nuove connessioni
2. Possono perdersi delle connessioni esistenti
3. Possono modificarsi i pesi relativi alle connessioni esistenti.
Comunque il cambiamento dei pesi delle connessioni ha in pratica lo stesso effetto di
aggiungere o togliere connessioni.
La variazione dei pesi delle connessioni dipende dagli eventi a cui sono soggette le
singole unità, tipicamente una funzione che tiene conto delle coincidenze e
sincronicità di attivazione.
Il teorema della convergenza del perceptrone ci assicura che la rete raggiungerà un
punto di stabilità in un tempo finito.
É cruciale nello sviluppo di qualsiasi modello avere chiaro qual è il tipo di ambiente
in cui il modello opera.
Molti modelli di elaborazione parallela presuppongono una caratterizzazione molto
semplice dell'ambiente in cui operano, l'ambiente è caratterizzato da una
distribuzione stabile di probabilità degli stimoli di input che risultino indipendenti dal
passato del sistema. In questo modo i possibili input possono essere descritti come un
insieme di stimoli indipendenti dal tempo.
Le situazioni di apprendimento di una rete possono essere suddivisi in due distinte
categorie: apprendimento associativo e scoperta di regolarità.
Nell'apprendimento associativo avviene la produzione di un particolare pattern di
attivazione su un insieme di unità in relazione ad un altro pattern di attivazione che
avviene in un altro insieme di unità. In tale schema l'apprendimento consiste in una
relazione tra pattern di attivazione che si realizzano in distinte parti della rete.
Nel caso della scoperta di regolarità le unità imparano a rispondere a pattern specifici
e significativi del loro input. In generale un tale schema rende in grado di formare
una base per lo sviluppo di prestazioni di rivelazione di caratteristiche, ovvero una
base per la rappresentazione della conoscenza.
Le modalità di propagazione di attivazione nella rete avviene in molti modelli in
maniera sincrona, ovvero tutte le unità sono aggiornate nello stesso istante,
comunque, in alcuni modelli, l'aggiornamento dello stato di attivazione avviene in
maniera asincrona ovvero ogni unità si attiva singolarmente in dipendenza di una
funzione sostanzialmente stocastica.
Il modello più semplice di rete neuronale è il modello lineare.
In tale rete vi sono solo unità di input e unità di output.
La computazione avviene in un singolo passo di attivazione.
Tutte le connessioni sono dello stesso tipo.
Per il modello lineare il paradigma associativo di pattern costituisce la tipica modalità
di apprendimento.
In generale ogni unità di input può essere connessa con ogni unità di output.
In dipendenza di diverse regole di apprendimento è possibile ottenere una vasta
gamma di prestazioni associative.
56
Il passo successivo consiste nel fornire alla rete una funzione di attivazione non
lineare, in questo caso l'elaborazione non può avvenire in un singolo passo.
Una rete di questo tipo è in grado di calcolare qualsiasi funzione booleana.
Gli algoritmi di apprendimento possono essere di carattere molto generale.
Per esempio uno schema di regole di apprendimento è il seguente:
1. i pesi sono cambiati solo quando in una connessione l'unità corrispondente è attiva
2. se la risposta è corretta non viene fatta alcuna modifica al peso della connessione
corrispondente
3. se la risposta è negativa quando dovrebbe essere positiva il peso della connessione
viene incrementato di una quantità opportuna
4. se la risposta è positiva quando dovrebbe essere negativa il peso della connessione
viene decrementato opportunamente.
Nel modello caratterizzato da vettori di attivazione è possibile costruire una
rappresentazione multidimensionale dello stato della rete, ogni dimensione
corrisponde all'attività di una singola unità, in particolare ogni punto nello spazio
multidimensionale corrisponde ad un possibile stato di attivazione del sistema.
La rete neurale si presta molto bene come metafora del funzionamento del cervello.
Molti comportamenti non sono il prodotto di un singolo componente separato del
sistema cognitivo, ma sono il prodotto di una vasta interazione tra molti componenti,
ciascuno mutuamente vincolato dal comportamento degli altri per produrre il
comportamento complessivo dell'intero sistema.
Data una rete di semplici elementi di elaborazione e delle entità da rappresentare, lo
schema più utilizzato consiste nell'usare ogni singolo elemento per calcolare una
corrispondente entità. In questo modo si ottiene una rappresentazione locale.
É facile capire e implementare una simile struttura poiché la rete fisica rispecchia la
struttura della conoscenza che contiene. La naturalezza e la semplicità di queste
relazioni tra la conoscenza e il supporto fisico sottostante ha portato i ricercatori a
pensare che questo sia un modo appropriato di rappresentare la conoscenza.
Tuttavia sono stati implementati sistemi in cui questo semplice schema ha subito un
certo grado di evoluzione, in cui non esiste una corrispondenza biunivoca tra i
concetti e le unità fisiche, ma i concetti sono rappresentati tramite proprietà emergenti
che non sono propriamente archiviate in termini di rappresentazione locale.
In questi modelli ogni entità viene rappresentata tramite un pattern di attivazione
distribuito su molti elementi di computazione, e ciascun elemento coinvolge la
rappresentazione di molte entità diverse.
Il vantaggio di questo tipo di rappresentazione, più complicato, non risiede in una
notazione più conveniente ma piuttosto nell'efficienza che il sistema mostra di
possedere nell'abilità di elaborazione rispetto alle reti più semplici.
Test psicologici mettono in evidenza come il tipo di rappresentazione distribuita sia
un modello migliore per comprendere le caratteristiche relative al cervello umano.
La rappresentazione distribuita ci fornisce alcune potenti ed inaspettate proprietà
emergenti che possono essere utilizzate come primitive in un formalismo astratto.
Per esempio la rappresentazione distribuita è un buon metodo per una memoria di
indirizzamento basato sul contenuto, fornisce una spiegazione semplice ed
57
automatica del processo di generalizzazione e inoltre consente la selezione delle
regole che meglio corrispondono ad un determinato contesto.
Queste proprietà non sono facilmente riproducibili in un formalismo di alto livello.
Le persone possiedono una modalità di accesso alla propria memoria veramente
molto flessibile: possono ricordare elementi complessi a partire da una descrizione
parziale del loro contenuto.
Addirittura possono ricordare correttamente un evento anche se parte della
descrizione usata per il recupero risulta sbagliata.
Questo tipo di memoria ad indirizzamento per contenuto è molto potente e anche
molto difficile da realizzare su computer convenzionali.
La rappresentazione distribuita offre uno schema efficiente per ricercare una
informazione sulla base del contenuto: informazioni differenti corrispondono a
differenti pattern di attività sullo stesso gruppo di unità di base.
Una descrizione parziale corrisponde ad una attivazione parziale che influenza le altre
unità che completano il pattern consentendo il recupero dell'informazione completa.
Una nuova informazione è memorizzata modificando le interazioni tra le unità in
modo da creare un nuovo pattern di attivazione stabile.
Ogni pattern può essere ricreato sulla base dei pesi tra le connessioni opportunamente
modificati, ma ogni connessione è coinvolta nella memorizzazione di molti pattern,
così che è impossibile individuare un particolare luogo dove una particolare
informazione è memorizzata.
A prima vista è sorprendente come le connessioni siano in grado di memorizzare un
gran numero di pattern differenti.
Un modo di pensare alla memoria distribuita consiste nel considerarla in termini di un
enorme insieme di plausibili regole di inferenza.
Ogni particolare pattern di attività delle unità di base soddisfa ad alcune
microinferenze e ne viola altre.
Questo modo di procedere suggerisce che non c'è una netta differenza tra una
memoria genuina e una ricostruzione plausibile dell'informazione.
La natura ricostruttiva della memoria umana ci sorprende solo perché è in conflitto
con le metafore che di solito utilizziamo quando pensiamo ad una memoria.
Tendiamo a pensare che una memoria debba riportare delle copie fedeli delle
informazioni originarie.
Se noi consideriamo la memoria come un processo che ricostruisce l'informazione
grazie ad un pattern di attivazione che sia consistente con i criteri di ricerca,
otteniamo un sistema che risulta più tollerante rispetto alle incertezze eventualmente
presenti nei dati di partenza.
Gli effetti di interferenza tra gli stati di attivazione producono un effetto molto
interessante: una naturale forma di generalizzazione.
Essa ci consente di stabilire effettivamente quando due situazioni sono simili tra loro
relativamente ad esperienze passate.
Se si apprende un fatto relativo ad un oggetto siamo portati ad estenderne le
conseguenze anche a tutti gli oggetti che in qualche misura sono simili.

58
In una rete che utilizzi una rappresentazione distribuita questo tipo di
generalizzazione è una conseguenza automatica.
Una modificazione relativa ad uno stimolo automaticamente cambia gli effetti causali
di tutti i vettori di attivazione simili.
In particolare esiste un intorno nello spazio dei vettori di attivazione tale per cui se un
concetto viene attivato allora verranno attivati parzialmente anche tutti i concetti che
corrispondono all'intorno del concetto originario.
Qualsiasi sistema che cerchi di implementare il tipo di struttura concettuale utilizzato
dalle persone deve essere in grado di rappresentare due tipi diversi di gerarchia.
Il primo tipo di gerarchia mette in relazione certi tipi di istanze con altre
corrispondenti di tipo classificatorio.
Il secondo corrisponde alla gerarchia che associa il tutto ad una parte, essa mette in
relazione certe tipi di istanze con le relative parti costituenti.
La caratteristica più importante del primo tipo di gerarchia corrisponde alla nozione
di "inerenza", che consente di attribuire ad una istanza le proprietà della classe di
appartenenza.
Il problema di come rappresentare la relazione tra un dato e i dati costituenti di cui si
compone è stato un vero rompicapo per i teorici della rappresentazione distribuita.
Poiché nello schema distribuito dati differenti corrispondono a pattern alternativi
sembrerebbe che la rappresentazione del tutto non corrisponda alla somma delle
rappresentazioni delle parti componenti, e in particolare che il tutto e le sue parti non
possano essere rappresentate allo stesso istante.
Una proposizione composta di oggetti che occupano un particolare ruolo nella
struttura complessiva non sarebbe rappresentata come mera composizione delle
singole parti.
Questa circostanza mette in discussione alcuni capisaldi della nostra usuale analisi
concettuale, ci costringe a riesaminare alcuni nostri concetti fondamentali.
In particolare suggerisce che il modo olistico di considerare un evento possa non
corrispondere in maniera analitica al corrispondente metodo, riduzionista, di
procedere suddividendolo in parti separate.
La natura sequenziale del ragionamento umano ad alto livello di descrizione è
sorprendente considerata l'architettura massivamente parallela del cervello.
La nozione che le persone siano degli elaboratori sequenziali di simboli in ogni
rappresentazione simbolica contiene un fondo di verità, ma la struttura cerebrale
rivela la natura parallela e interattiva dell'elaborazione neuronica.
Un vantaggio dell'approccio dell'elaborazione simbolica sequenziale consiste nella
capacità di focalizzare ogni parte di una struttura e di espandere le conclusioni al tutto
come somma delle parti. L'abilità ricorsiva di espandere parti di una struttura in una
infinita successione di livelli successivi corrisponde ad una potente modalità di
generalizzazione.
La generalizzazione tipica manifestata naturalmente dalle reti neurali corrisponde alla
possibilità di catturare le relazioni di somiglianza tra distinti stati di attivazione.
Un aspetto molto interessante della ricerca in questo campo consiste nell'individuare
dei modelli matematici in grado di conciliare i concetti emergenti dallo studio e dalla
59
realizzazione delle reti neurali con i corrispondenti concetti maturati nei diversi
settori dell'intelligenza artificiale.
Una delle principali critiche al funzionamento di una rete neurale consiste nel notare
che essa non fornisce un adeguato meccanismo per l'attenzione, non vi è modo di
focalizzare la macchina sull'analisi di una parte di una informazione su larga scala
considerata come un tutto.
Il meccanismo di elaborazione parallela risulta per principio incapace di esibire il
fenomeno dell'attenzione focalizzata solo su una parte dello stimolo.
Questa difficoltà può essere superata utilizzando delle connessioni programmabili in
grado di selezionare solo una parte dello stimolo.
Alcuni recenti lavori mostrano come il meccanismo di elaborazione parallela possa
essere in grado di normalizzare e focalizzare l'attenzione successivamente da un
vettore di attivazione al successivo.
Una caratteristica del calcolo seriale che non risulta evidente come sia possibile
implementarla nelle reti neuronali è la ricorsività.
Gli algoritmi ricorsivi sono in grado di elaborare delle strutture, come per esempio le
proposizioni, in cui una parte di informazione interna produce delle dipendenze che
ricorrono indefinitivamente a vari livelli di incapsulamento.
É stato suggerito che il meccanismo parallelo di elaborazione non sia capace di
eseguire un calcolo ricorsivo e sarebbe perciò incapace di fornire un meccanismo di
elaborazione delle proposizioni ed altre strutture definite ricorsivamente.
Tuttavia è possibile mostrare come quei processi che di solito sono implementati a
calcolatore utilizzando la tecnica ricorsiva possano essere realizzati in termini
naturali nel modello di elaborazione parallela distribuita.
Si può dimostrare che è possibile costruire una macchina basata sul modello di
elaborazione parallela distribuita in grado di eseguire tutte le operazioni necessarie
per implementare una macchina di Turing, ovviamente il limite che mostrano risiede
nel fatto che, come in ogni organismo biologico, tali macchine sono finite.
Non si vuole sostenere che tutti i problemi siano stati risolti, i modelli realizzati nei
laboratori contengono delle limitazioni e ancora molto rimane da fare.

60
Elaborazione dell'informazione
Il cervello umano è la sede principe per eccellenza dell'elaborazione
dell'informazione.
Quotidianamente siamo bombardati da miriadi di informazioni che interpretiamo,
filtriamo ed elaboriamo; segni e messaggi che giungono a noi sui supporti più svariati
e a cui noi attribuiamo un significato.
Il computer, seriale o parallelo, costituisce un notevole esempio di una macchina in
grado di elaborare l'informazione.
I principi base del funzionamento di un computer ci sono ben noti, essendo esso uno
strumento costruito dall'uomo.
Il computer è la miglior metafora del cervello che abbiamo a disposizione per
comprendere in che modo le informazioni possono essere elaborate.
Le prestazioni di un computer e di un cervello umano sono molto diverse sia per
qualità che per quantità, questo ci mette in guardia sui possibili errori di valutazione
che rischiamo di correre confidando in maniera eccessiva sulla reale esistenza nel
cervello di modalità di elaborazione del tipo realizzato nei computer, siano essi di
architettura seriale o reti neurali.
In ogni caso le proprietà matematiche, logiche e algoritmiche corrispondenti a
modalità di elaborazione dell'informazione che si realizzano nel computer possono
fornirci utili indicazioni sia per comprendere il funzionamento del cervello sia per
sviluppare e potenziare le capacità di calcolo dei computer.
Il primo passo imprescindibile in qualsiasi modello di elaborazione dell'informazione
corrisponde all'operazione di codifica dell'informazione stessa.
La codifica dell'informazione presuppone l'utilizzo di un supporto fisico che la
rappresenti e che la trasporti.
Nel linguaggio codifichiamo le informazioni in parole che possono essere
pronunciate oppure scritte su un supporto cartaceo.
In un computer le informazioni sono codificate tramite stringhe di bit.
L'informazione può passare da una rappresentazione ad un'altra senza perdere il
proprio contenuto informativo.
Possiamo tradurre le parole in lingue diverse mantenendo in essenza lo stesso
messaggio verbale.
Possiamo codificare una immagine in una successione di bit, memorizzarla,
trasmetterla e visualizzarla di nuovo senza perdere la risoluzione sufficiente affinché
chiunque possa riconoscerla come tale.
La codifica di una informazione presuppone una struttura di riconoscimento, ovvero
un processo di decodifica dell'informazione stessa.
L'informazione codificata su un opportuno supporto si sposta nello spazio da un
punto all'altro in una dimensione temporale.
L'elaborazione dell'informazione avviene nel tempo.

61
La relazione più semplice tra due supporti di codifica di un messaggio consiste nella
relazione biunivoca: ogni segno costituente il messaggio codificato sul primo
supporto corrisponde ad un unico segno codificato sul secondo.
La nota sul pentagramma del pianista corrisponde al tasto premuto e al suono
corrispondente che possiamo ascoltare.
L'informazione può essere filtrata ovvero sottoposta ad un processo di selezione che
ne conserva solo gli aspetti più significativi.
Nel passaggio da un supporto ad un altro l'informazione può essere alterata.
L'alterazione di un messaggio che si può verificare durante il suo percorso nel
processo di trasmissione e decodifica costituisce una prima forma di elaborazione.
Nella tecnologia della scienza dell'informazione e nella realizzazione degli
apparecchi di trasmissione dei dati si pone grande cura al fatto che il messaggio non
venga alterato nel processo di trasmissione e che il ricevente ne possa ottenere una
copia fedele in tutti i dettagli.
Un dispositivo elettronico che non conservasse l'integrità del messaggio verrebbe
considerato difettoso; nel cervello invece questa elaborazione primaria di filtraggio
dei messaggi avviene in maniera diffusa e molto presto nei processi di percezione, già
fin dal primo momento in cui l'informazione giunge agli organi di senso.
Il paradigma tipico di come avviene l'elaborazione dell'informazione può essere
schematizzato in:
INPUT -> ELABORAZIONE -> OUTPUT
Nel computer l'elaborazione viene eseguita dal microprocessore che esegue in
successione i singoli passi dell'elaborazione utilizzando operazioni di congiunzione,
disgiunzione e negazione applicate sui dati di input.
Una elaborazione complessa viene suddivisa in tante operazioni elementari.
Le operazioni elementari sono eseguibili, concettualmente, sulla base di
corrispondenze puntuali tra i singoli bit di rappresentazione delle informazioni.
Sostanzialmente l'elaborazione più elementare consiste nel verificare se esiste una
corrispondenza di attivazione tra i bit che codificano l'informazione.
Le funzioni di AND, OR, NOT si basano sulla presenza od assenza di segnale nei
circuiti che corrispondono ai registri che rappresentano i singoli dati.
Nei microprocessori specifici circuiti elettronici sono cablati per eseguire, a grande
velocità, le principali operazioni di confronto e trasmissione dei dati costituenti
l'elaborazione dell'informazione.
L'elaborazione, in questo schema, può essere considerata come un processo di
trasformazione dell'informazione da un certo input ad un corrispondente output.
La sequenza delle singole operazioni elementari costituisce l'algoritmo di
elaborazione implementato sul microprocessore.
Un algoritmo può essere descritto a diversi livelli di dettaglio, dal più analitico, in
codici macchina, adatto per essere eseguito da un microprocessore, al più generale, in
un linguaggio di programmazione di alto livello, più vicino al linguaggio naturale e
quindi più adatto alla comprensione di un essere umano, ma comunque ancora tale da
poter essere compilato e quindi ricondotto al microlinguaggio.

62
Questi diversi livelli di codifica costituiscono gli strati di rappresentazione in cui
l'informazione viene di volta in volta tradotta per poter essere elaborata.
La possibilità di costruire una rappresentazione coerente dei dati su diversi strati
successivi, via via sempre più articolati, consente ai programmatori di scrivere i
propri algoritmi di elaborazione utilizzando istruzioni sempre più complesse.
In particolare possono ragionare sui dati in maniera astratta.
Pensiamo alla incredibile complessità dell'elaborazione che il nostro cervello
quotidianamente esegue quando semplicemente camminiamo.
Ad ogni passo dobbiamo calcolare e controllare lo spostamento del barricentro e
mantenerlo in equilibrio per non cadere e contemporaneamente dobbiamo inviare i
segnali elettrochimici opportunamente calcolati ai muscoli per consentire il
movimento delle gambe nella corretta sequenza e in maniera armonica.
Dobbiamo evitare gli ostacoli che eventualmente incontriamo sul nostro percorso e
coordinare il movimento istante per istante in dipendenza dell'ambiente in cui ci
muoviamo.
Il semplice camminare costituisce un problema di ingegneria di incredibile
complessità.
Codificare un algoritmo in grado di eseguire questo compito costituisce una grande
sfida, anche stimolante, per la tecnologia informatica applicata alla robotica.
Una elaborazione relativamente semplice in un computer si esegue quando si
memorizza un dato alfanumerico in memoria, sul disco fisso.
In realtà questa operazione è più complessa di quel che sembra, ma possiamo
schematizzare la seguente successione di operazioni:
- il dato, informazione già codificata, viene digitato su una tastiera
- il dato, senza alterazioni, viene trasportato in una zona di memoria di lavoro
- al dato viene attribuito un indirizzo corrispondente ad una zona di disco fisso
- il dato viene registrato in corrispondenza del proprio indirizzo
Se a questo punto ci chiediamo quali sono le relazioni che sussistono tra questo dato e
gli altri dati presenti in memoria la risposta è semplice: nessuna.
Per rappresentare le relazioni tra i dati abbiamo bisogno di eseguire altre registrazioni
corrispondenti ad un nuovo tipo di informazione.
Memorizzare i dati non è sufficiente, occorre anche memorizzare le relazioni che
sussistono tra le informazioni coinvolte nella registrazione.
Se ci chiediamo qual è il significato del dato che abbiamo memorizzato, ancora una
volta la risposta è semplice: nessuno.
Supponiamo che il dato memorizzato corrisponda al nome di una funzione eseguibile
dal computer, in questo caso il computer "riconosce" il dato ed è in grado di eseguire
il programma corrispondente; possiamo dire che ciò costituisce un primo rudimentale
significato del dato per il computer.
Supponiamo che il dato sia correlato ad un altro dato in memoria, in tal caso il
computer sarebbe in grado di "tradurre" il primo dato nel secondo; ciò potrebbe
suggerire un secondo rudimentale significato del dato.

63
Supponiamo che il dato appartenga ad un certo dominio definito, in tal caso il
computer potrebbe "classificare" il dato; e questo sarebbe un terzo rudimentale
significato possibile.
Quando l'informazione viene elaborata essa si trasforma in informazione di
complessità sempre crescente.
L'informazione elaborata diventa qualcos'altro in cui è sempre più difficile
rintracciare i nessi causali operanti nella trasformazione.
Per esempio relazioni spaziali si trasformano in relazioni logiche e relazioni
temporali in relazioni spaziali o topologiche.
La contemporanea presenza di due dati in un singolo processo di memorizzazione
può diventare un criterio classificatorio.
Una relazione arbitraria può essere rappresentata come contiguità spaziale dei dati
corrispondenti sul supporto di memorizzazione.
In un computer le informazioni sono codificate in stringhe di bit, teoricamente
qualsiasi informazione può essere codificata in questo modo, ma eseguire
praticamente tale codifica si scontra con difficoltà che sembrano insormontabili
anche nel caso di esempi relativamente semplici.
I ricercatori nel campo della visione artificiale ne sanno qualcosa.
Per fare un esempio non è facile codificare l'informazione che se Mario è vivo alle 8
di mattina ed è vivo alle 8 di sera allora era vivo anche a mezzogiorno.
Inoltre l'operazione di codifica, disincarnando l'informazione dal suo contesto, porta
molto spesso ad una perdita di informazione che a volte si dimostra essere cruciale
nelle successive elaborazioni.
Nel computer certe elaborazioni, grazie alla grande velocità di calcolo e alla grande
fedeltà di manipolazione dei dati, risultano essere strabilianti se confrontate con la
capacità della mente umana.
D'altra parte il computer si dimostra particolarmente inefficiente quando si tratta di
eseguire compiti che il cervello esegue quotidianamente con facilità.
In particolare il computer manipola molto bene l'informazione presente in strutture
simboliche, ma nella realtà in cui viviamo la maggior parte dell'informazione che noi
elaboriamo non appartiene a questa categoria.
Un computer ha battuto il campione del mondo nel gioco degli scacchi.
Le informazioni necessarie per giocare a scacchi concernono le regole del gioco e le
posizioni relative dei vari pezzi.
Queste informazioni possono essere codificare in maniera efficiente.
Il gioco degli scacchi non è ambiguo e non presenta informazioni carenti o parziali.
Anche se giocare bene non è facile ogni singola mossa è la risposta ad una
elaborazione a partire da una configurazione sulla scacchiera ben definita.
In questo caso le capacità di calcolo esatte e rigorose del computer hanno avuto la
meglio sulla capacità strategiche ed intuitive dell'uomo.
Se i limiti del computer risiedono nell'esplosione esponenziale delle configurazioni
possibili, e che quindi non consentono una esplorazione esaustiva, per il cervello
questa corrisponde ad una normale modalità di operare.

64
Il cervello filtra l'informazione significativa fin dall'inizio evitando così di rimanere
bloccato dalla esuberante mole di informazioni coinvolte in un determinato compito.
Quando il cervello non ce la fa più si appella al concetto di infinito riuscendo in tal
modo a superare l'intoppo e a fornire una risposta ragionevole.
Nelle reti neurali l'informazione è codificata nel pattern di attivazione che dalle unità
di input si propaga e si trasforma nella rete fino alle unità di output.
Questo schema di elaborazione non è propriamente simbolico.
Comunque la descrizione del funzionamento, e in particolare la capacità di creare
delle categorie classificatorie che le reti mostrano di possedere, può essere ricondotta
ad uno schema concettuale composto da simboli.
Nel lungo processo di elaborazione che a partire dalla percezione dell'oggetto ci
consente di riferirci ad esso in un atto linguistico attraversiamo tutti i territori
cognitivi dal sub-simbolico fino al simbolo astratto.
L'informazione nuda e cruda viene rivestita da uno spesso strato di classificazione
concettuale in tutti i principali aspetti della comunicazione umana.
Il computer seriale nel suo riproporre il dato sempre uguale a se stesso non è in grado
di elaborare autonomamente una discriminazione concettuale sui dati di input.
Nelle reti neurali l'informazione si trasforma e in qualche misura si organizza.
Una interessante realizzazione della ricerca sull'intelligenza artificiale sono i sistemi
esperti, ovvero i motori inferenziali.
Un sistema esperto è costituito da regole del tipo: se A allora B, C, D.
Il motore inferenziale non fa altro che applicare queste regole ad un determinato input
ottenendo la risposta conseguente.
Quando la base di conoscenza, costituita da tutte le regole, risulta adeguata i sistemi
esperti riescono a risolvere complicati problemi decisionali che riflettono la
competenza di un esperto del settore.
Da un punto di vista computazionale applicare tali regole non è molto diverso
dall'applicazione di regole di attivazione: se A è attivo allora sono attivi B, C, D.
Da questa prospettiva i sistemi esperti contengono una interessante analogia con il
meccanismo di propagazione di un pattern di attivazione in una rete neurale.
Nella rete neurale però è possibile l'apprendimento modificando i pesi delle
connessioni, nei sistemi esperti ogni regola nuova deve essere specificatamente
inserita; inoltre nei sistemi esperti la base di conoscenza è costruita esplicitamente a
partire dall'esperienza di un esperto, mentre nelle reti neurali la conoscenza è
acquisita tramite un processo di addestramento della rete.
Alcuni sistemi esperti sono stati progettati per costruire la propria base di conoscenza
sulla base di esempi di applicazione.
In tal caso l'analogia tra sistemi esperti e reti neurali diventa ancor più stringente.
Una differenza importante consiste nel fatto che nelle reti neurali non vi sono regole
esplicite mentre nei sistemi esperti sì; questo fatto ci riporta alla fondamentale
osservazione che in ogni modello risulta cruciale il tipo di rappresentazione
dell'informazione che vogliamo utilizzare.

65
In una rete di computer interconnessi, come internet per esempio, l'informazione
viene trasportata ed elaborata da un capo all'altro della terra e viene resa disponibile
agli utenti che la utilizzano.
Le elaborazioni principali che i computer eseguono solitamente consistono nella
trasmissione, codifica e formattazione di immagini e testi contenenti informazioni a
cui gli utenti possono attribuire un significato.
La strutturazione delle informazioni è un processo a monte del calcolo che il
computer esegue e che i progettisti del sistema hanno incorporato nelle procedure di
elaborazione.
La auto-organizzazione delle informazioni è un processo molto difficile da realizzare
col computer, anche se nelle reti neurali si può osservare una rudimentale formazione
di categorie classificatorie.
Meccanismi in grado di rilevare coincidenze significative negli stimoli possono
produrre come effetto una associazione tra le rispettive informazioni in grado di
creare dei raggruppamenti classificatori e indurre delle relazioni.
Possono essere delineati tre livelli concettuali distinti in cui si descrive cosa le
macchine possono calcolare.
Il primo livello consiste nella teoria computazionale in cui si definisce la strategia
astratta che si vuole seguire per realizzare una determinata elaborazione.
Il secondo livello è quello della scelta della rappresentazione e dell'algoritmo che si
vuole utilizzare.
Il terzo livello consiste nella vera e propria implementazione hardware.
Al livello della teoria computazionale possiamo trascurare i particolari algoritmici e
di implementazione e concentrarci sui problemi concettuali che vogliamo affrontare.
Quando vogliamo affrontare un problema il primo passo che dobbiamo fare consiste
nell'analisi logica e formale necessaria per la sua definizione in un contesto
concettuale opportuno.
Questo ci porta immediatamente alla delimitazione e alla individuazione puntuale dei
termini che utilizzeremo nello sviluppo successivo.
Nella pratica molto spesso il contesto viene dato per così dire come una specie di aria
di famiglia condivisa nel senso comune, in altre parole utilizziamo degli stereotipi.
Se mi trovo al ristorante si dà per scontato che ho intenzione di mangiare.
Le informazioni che possediamo sul mondo sono in quantità enciclopediche e ogni
informazione nuova interagisce con tutte le altre in una certa misura.
Quando vogliamo utilizzare un computer per risolvere un problema dobbiamo
inevitabilmente ridurre questo contesto a dimensioni ragionevoli, poiché non sarebbe
proponibile inserire tutte le informazioni correlate per qualche ragione al problema in
esame. Anzi di solito si riconduce il contesto solo agli aspetti più significativi.
Molto spesso si eseguono delle drastiche semplificazioni concettuali.
L'informazione originariamente disponibile viene ritagliata e selezionata e solo una
relativamente piccola parte di essa entrerà effettivamente a far parte dell'elaborazione
automatica in grado di risolvere il problema.
Una cosa analoga avviene anche a livello del nostro normale campo percettivo,
l'informazione che ci interessa si staglia nel contesto e cattura la nostra attenzione in
66
maniera preminente: questo ci consente di focalizzarci su dettagli significativi e di
non disperderci nel caos del vasto input percettivo.
Il secondo passo consiste nella definizione delle strategie di elaborazione che
utilizzeremo per risolvere il problema, ovvero per trasformare i dati in input in una
risposta consona alle nostre esigenze.
Supponiamo di voler utilizzare la tecnica degli algoritmi genetici.
Tale tecnica presuppone meccanismi di riproduzione, selezione e mutazione applicati
sugli individui di successive generazioni nel tempo.
Questi meccanismi hanno la loro ragione di essere sulla base della correttezza della
teoria dell'evoluzione della specie.
Teoricamente è stato dimostrato che utilizzando i meccanismi proposti l'elaborazione
converge effettivamente verso una soluzione ottimale.
Questi meccanismi possono essere implementati utilizzando relativamente poche
regole di manipolazione dei dati.
Tuttavia nel caso di applicazioni reali si constata che non sempre questo metodo porta
ad una soluzione soddisfacente del problema, vuoi perché occorre troppo tempo, vuoi
perché gli algoritmi realizzati non corrispondono perfettamente ai principi base in
tutti i loro aspetti computazionali.
Allora si può ricorrere a soluzioni alternative meno generali ma più mirate al caso
particolare che si vuole affrontare.
In particolare occorre analizzare la struttura dell'informazione codificata per scoprire
i caratteri salienti utilizzabili nell'elaborazione.
A volte succede che la soluzione euristica realizzata funziona sulla base delle
caratteristiche di codifica dell'informazione piuttosto che su effettive caratteristiche
proprie dell'informazione stessa.
Il modo in cui codifichiamo l'informazione risulta essere determinante per le
possibilità di elaborazione dell'informazione.
Questo suggerisce che circostanze simili possano avvenire anche nei meccanismi
cerebrali, potrebbe essere che il tipo di codifica che i sensi eseguono sui dati
percettivi consenta una successiva elaborazione in grado di mostrare proprietà che
non dipendono dall'informazione originaria ma dipendono esclusivamente dalle
modalità di elaborazione utilizzate dal cervello.
L'esempio tipico è la capacità classificatoria che emerge nelle reti neurali.
In questo senso si potrebbe interpretare la natura di categoria data a priori del tempo e
dello spazio; tempo e spazio sarebbero categorie emergenti dovute alle modalità
funzionali strutturali di codifica delle informazioni da parte del cervello.
Bisogna tuttavia osservare che l'informazione giunge sulla retina trasportata dalle
onde luminose e che, in un certo senso, l'informazione è codificata nella luce come
fotoni che sono in mutua relazione spazio-temporale.
In un computer l'informazione è codificata in stringhe di bit che vengono elaborate e
duplicate come copie fedeli dell'originale.
Questa staticità e fedeltà di rappresentazione possiede alcuni notevoli vantaggi.

67
Mentre il cervello si trova in un mare di mutevoli percezioni in cui si adopera
alacremente per completare ed integrare le informazioni parziali che dispone sul
mondo, il computer opera in un paradiso di certezze.
Le informazioni che manipola sono tutte ben definite, non come informazioni
significanti, ma come messaggi formali in cui il supporto fisico non presenta
ambiguità di sorta: il computer elabora solo dei dati.
La logica che utilizza è assolutamente rigorosa.
Le relazioni logiche tra dati sono rappresentate da ferree regole di manipolazione.
In ogni comportamento del computer è possibile rintracciare una causa ben definita.
Per questo esso rappresenta un eccezionale strumento di controllo e verifica della
correttezza formale delle nostre informazioni.
Il computer sa riconoscere ed è in grado di avvertirci quando un dato inserito non
corrisponde ai vincoli logici relativi ad altri dati logicamente correlati alla funzione
che si pretende che il computer esegua in un dato istante.
Il computer ci costringe ad essere conseguenti rispetto alla congruenza delle
informazioni che desideriamo elaborare.
Anche se il computer non capisce, in senso psicologico, le informazioni che man
mano elabora tuttavia esso rispetta tutti i vincoli formali che tali informazioni
presuppongono dal punto di vista computazionale, nessuno escluso.
La memoria del computer è assolutamente fedele, registra tutto quello che inseriamo
senza trascurare il benché minimo particolare.
Se non riconosce una funzione ci segnala semplicemente un errore, non prosegue
l'elaborazione utilizzando inferenze più o meno discutibili su ciò che potrebbe
significare o ciò a cui ci si potrebbe riferire di più o meno simile.
Il cervello invece molto spesso fa proprio questo.
Interpreta continuamente l'informazione sulla base delle relazioni che questa
suggerisce rispetto alla grande quantità di informazione precedentemente acquisita.
Induzione, aspettativa e senso sono molto correlati l'un l'altro e costituiscono le
caratteristiche peculiari del contesto in cui il ragionamento umano si sviluppa.
La metafora del computer per spiegare il funzionamento del cervello è analoga alla
metafora dell'aeroplano per spiegare il volo degli uccelli.
L'ambito per cui la metafora funziona risiede ad un alto livello di astrazione rispetto
ai principi fisici e meccanici che governano le leggi del volo.
Il computer elabora informazione e il cervello fa lo stesso, anche se le differenze su
come essi operano sono abissali.
Alcuni ricercatori nel campo dell'intelligenza artificiale hanno profuso molte energie
nel tentativo di individuare modalità di elaborazione che potessero funzionare anche
in ambito di incertezza.
Certamente questo è un interessante ambito di ricerca, ma si scontra con la necessità
pratica dell'industria informatica di produrre computer che siano affidabili.
Per elaborare dati incerti col computer occorre inserire una enorme quantità di
informazione su cui poter eseguire una analisi statistica.
Infatti se rinunciamo alla certezza dobbiamo appellarci almeno ad un criterio di
massimo di probabilità di correttezza delle conclusioni.
68
Tutto ciò porta a diversi ordini di grandezza di complessità aggiuntiva rispetto alla
definizione dei problemi da risolvere.
Quando un cervello prende una decisione ha a disposizione una incredibile quantità
di informazione sul mondo in tutti i suoi aspetti, dai più semplici ai più articolati,
sedimentata in anni di esperienze, a cui può attingere liberamente.
Quando un computer prende una decisione, dettata da un qualche criterio di
ottimizzazione, ha a disposizione solo un ambito relativamente ristretto di dati
pertinenti al problema considerato.
Esistono molti robot nella fantascienza ma molto pochi e rudimentali nella realtà.
Il cervello di un gatto risolve con efficienza complicatissimi problemi di ingegneria
informatica che l'attuale tecnologia dei computer è ancora molto lontano da risolvere.
Coordinare il movimento di un corpo tenendo conto di tutte le possibili interazioni
con l'ambiente è veramente un problema difficile.
Ma il cervello umano fa molto di più.
In particolare l'uomo possiede una mente, una ricchissima vita psichica.
Credenze e desideri sussistono solo in un contesto mentale di cui l'uomo ha
consapevolezza solo soggettivamente, anche se il linguaggio consente di rendere
partecipi anche altre persone rispetto ai propri aspetti tipicamente interiori.
Tra lo stimolo e la risposta trascorre un notevole lasso in cui il cervello elabora
l'informazione in una modalità complicatissima.
Le conseguenze di una azione vengono valutate dalla mente sotto una grande varietà
di aspetti e informazioni che passano dal soddisfacimento di necessità immediate alla
realizzazione di scopi e desideri proiettati su un'ampia dimensione temporale.
Dotare il computer di scopi sarebbe estremamente pericoloso.
In alcuni laboratori di ricerca sono state realizzate delle entità virtuali.
Una entità virtuale consiste in un programma eseguibile a calcolatore in grado di
sostenere un colloquio con un essere umano.
Il colloquio avviene ad un livello puramente linguistico del tipo domanda-risposta.
Ovviamente l'entità virtuale non possiede credenze o desideri ma è informata su una
certa base di fatti più o meno vasta e quando cade in difetto può ricorrere all'aiuto del
proprio interlocutore proprio come un bambino che fa domande ai propri genitori.
L'entità virtuale risponde sulla base di una analisi automatica delle correlazioni
sussistenti tra le parole presenti nella domanda e le possibili risposte che il
programma è in grado di formulare.
L'entità virtuale è in grado di produrre risposte imprevedibili a priori poiché
dipendono dal processo stesso in cui avviene il dialogo e i criteri statistici di analisi
delle possibili risposte possono modificarsi allorché si modifica il contenuto della
base di conoscenza.
Il colloquio non si riduce quindi ad una semplice ricerca in memoria della risposta.
Le relazioni tra i dati e i criteri di selezione tra le possibili risposte governano in una
maniera interessante un colloquio tra un essere umano e una macchina.
Ovviamente quando parliamo con una persona non pensiamo che questa ci stia
fornendo una mera risposta automatica frutto di un complicatissimo calcolo ma pur
sempre deterministica.
69
Siamo abituati a considerare le persone come degli individui dotati di coscienza,
libero arbitrio e volontà propria.
Lo studio delle entità virtuali ci suggerisce come sia possibile che una modalità di
dialogo, ovvero ciò che quotidianamente ci mette in relazione con gli altri, possa
essere in realtà frutto di una computazione anche se complicatissima.
Anche se praticamente l'algoritmo utilizzato da una entità virtuale per rispondere ad
una domanda è certamente molto diverso da quello che potrebbe essere usato da un
cervello umano, l'esempio mostra come certe elaborazioni dell'informazione possano
essere realizzate da un paradigma computazionale.
A partire da elaborazioni elementari dell'informazione è possibile costruire, in una
serie di strati e livelli successivi, una macchina che elabora l'informazione in maniera
estremamente complessa.
Il cervello è frutto dell'evoluzione biologica e le soluzioni che ha adottato per
elaborare l'informazione sono estremamente sofisticate.
Soluzioni che si sono dimostrate valide nel risolvere i più elementari bisogni
biologici potrebbero conservare traccia nelle modalità di elaborazione coinvolte nelle
più alte vette cognitive proprie della mente umana.
In particolare la necessità di trovare una soluzione buona, anche se non ottimale, in
un ambito di precarietà dell'informazione possono aver influenzato in maniera
determinate le modalità del pensiero anche nelle sue forme più astratte.
L'essere umano vive sulla terra e conosce solo il proprio ambiente naturale in cui si è
evoluto, il suo cervello è in grado di trascendere il mondo sensibile, il concetto di
infinito ne è un esempio chiaro, ma forse esistono dei limiti intrinseci alle sue
possibilità di elaborazione dell'informazione dettati dalla struttura fisica del proprio
cervello. (o forse no)

70
Il punto di vista
La coscienza è essenzialmente un fenomeno soggettivo, accessibile solo alla persona
che la possiede, mentre tutto ciò che è realmente fisico, per esempio l'attività
cerebrale, è di natura oggettiva, ovvero può essere accessibile a molte persone e
rispetto a molti punti di vista.
In un articolo dal titolo: che cosa si prova ad essere un pipistrello, Nagel ha
presentato un argomento convincente del fatto che non possiamo sperimentare
direttamente l'esperienza soggettiva di un pipistrello, anzi facciamo veramente molta
fatica anche solo ad immaginarla.
Nagel sostiene che per quanto si possa conoscere la neuroanatomia di un cervello di
pipistrello e la neurofisiologia della sua attività sensoriale, non si saprà ancora che
cosa si prova ad avere le esperienze sensoriali di un pipistrello.
Non si saprà ancora come siano queste esperienze dal punto di vista del pipistrello in
prima persona, da quella prospettiva che egli possiede come unico soggetto.
Esiste un abisso fra realtà fisica del cervello biologico e realtà psicologica
dell'esperienza conscia in prima persona.
Il pipistrello ha accesso alle proprie sensazioni, in un modo così esatto e peculiare che
allo scienziato umano esterno ad esso manca.
Ciascuno di noi ha un accesso esatto e peculiare alle proprie sensazioni e nessun'altra
creatura può averlo.
Ciascuno di noi ha a disposizione un insieme unico di connessioni causali con
l'attività sensoriale del proprio cervello e del proprio sistema nervoso.
Ogni individuo ottiene informazioni sugli elementi in continuo movimento della
propria attività sensoriale attraverso un insieme specifico di percorsi neuronali che
solo lui possiede.
Ogni insieme di tali connessioni è sempre interno al cervello, o al corpo.
Ogni creatura possiede un modo di conoscere i propri stati sensoriali che nessun'altra
creatura possiede.
Gli altri possono conoscere i vostri stati sensoriali deducendoli dalle circostanze o dal
vostro comportamento, o addirittura sbirciando dentro al vostro cervello con elettrodi,
ma in ogni caso questa conoscenza è sempre di tipo qualitativamente differente.
Le altre persone non possono conoscere le vostre sensazioni attraverso quei precisi
percorsi di informazione grazie ai quali voi li conoscete, perché solo voi possedete
esattamente quei percorsi.
Esiste una unicità della vostra attività conoscitiva a proposito dei vostri stati interiori.
E questo vale per tutto l'organismo che vi costituisce.
La vostra mano per esempio è percepita in maniera irriducibilmente differente dal
vostro punto di vista rispetto a qualsiasi altro punto di vista.
Mondo soggettivo e mondo oggettivo sono pertanto irriducibili.
Ogni uomo costituisce una finestra sul mondo unica e irripetibile.

71
Il dato oggettivo della scienza deve essere valutato da una persona cosciente.
Lo stesso oggetto fisico osservato da due persone diverse coinvolge processi cognitivi
differenti che si realizzano in due supporti fisici, i due cervelli, distinti.
Si può discutere e argomentare lungamente sul fatto che tali processi psichici
debbano essere più o meno uguali.
Di fatto essi sono irriducibilmente diversi poiché è diverso il punto di vista.
Diverso è lo stimolo percettivo, diverso è il processo neuronale coinvolto, diverse
sono le interpretazioni soggettive, diversi sono i processi mentali caratteristici
dipendenti dalla storia dei soggetti, diverso è il contenuto informativo preesistente
utilizzato nel processo di percezione.
Se una persona è daltonica non potrà mai sapere che cosa si prova a vedere il colore
rosso, tutta la conoscenza neurobiologica possibile del sistema visivo non può aiutare
in alcun modo quella persona a vederlo.
Esistono diversi modi di conoscere le cose ma tutti passano attraverso i canali di
trasmissione delle informazioni di cui madre natura ci ha dotato.
L'informazione di qualsiasi natura essa possa essere viene elaborata sulla base dei
nostri canali sensoriali e coinvolge i nostri personali processi cognitivi.
L'utilizzo dei nostri sensi costituisce il principale, prescientifico, modo di conoscenza
del mondo reale.
Nessuna descrizione per quanto possa essere particolareggiata può sostituire
l'esperienza diretta di un fatto.
L'atto di percepire sensorialmente un oggetto non corrisponde in maniera puntuale
alla conoscenza di tutta l'informazione sull'oggetto.
Le cose e gli eventi di cui abbiamo esperienza possiedono una dimensione psichica in
cui sono rappresentati che è alquanto diversa da una rappresentazione formale tramite
la quale sia possibile parlarne.
La conoscenza scientifica deve essere strutturata e coerente.
É molto più facile spiegare ad un alieno che cosa sia un gatto dicendo "questo è un
gatto" piuttosto che fornirgli una descrizione, per quanto dettagliata, delle
caratteristiche di un gatto, anche se la seconda possibilità è scientificamente migliore.
I nostri canali sensoriali sono canali privilegiati attraverso cui percepiamo il mondo.
Se, come in certi film di fantascienza, i nostri sensi fossero connessi a canali di
ingresso controllati per esempio da un computer, potremmo vivere in una realtà
virtuale con la stessa certezza percettiva con cui sperimentiamo la realtà.
Se al posto degli occhi ci fosse una telecamera che ci mostra il paesaggio lunare
potremmo avere l'impressione di essere sulla luna.
Non a caso la televisione ci dà l'impressione che esista un mondo là dentro mentre in
realtà sono solo puntini luminosi che corrono a gran velocità sullo schermo.
La nostra coscienza è connessa in maniera privilegiata al nostro corpo, e il punto di
vista da cui noi osserviamo il mondo ne è di conseguenza strettamente dipendente.
Ogni singola esperienza umana non può prescindere dal contesto in cui fisicamente
può avvenire, cioè l'uomo stesso, ovvero informazione che per diversi canali viene
riportata alla nostra coscienza personale.
Ogni pensiero, pensabile dall'umanità, è pensato da una mente di qualche uomo.
72
Ogni esperienza umanamente possibile presuppone un essere umano che la
sperimenta dal proprio particolare punto di vista.
Ogni uomo costituisce una finestra sul mondo, e l'insieme complessivo di questi
diversi punti di vista costituiscono la realtà umanamente sperimentabile.
Visoni diverse della realtà possono coincidere ma possono contenere anche aspetti
che non sono conciliabili o comunicabili.
L'osservazione simultanea di un evento o la riproducibilità di un fatto costituiscono la
base su ci si fonda la credenza dell'unicità dell'esistenza.
L'universo esisterebbe anche senza un essere umano che lo osserva ma se adesso ne
possiamo parlare dipende dalla constatazione che siamo uomini che osservano
l'universo, non si tratta di negare la realtà ma di porre il processo conoscitivo ad un
livello prettamente umano, dove esso effettivamente si svolge, poiché siamo uomini
di fatto e non possiamo essere qualcos'altro.
Non possiamo prescindere dalla nostra struttura, dalla nostra costituzione fisica.
Le informazioni che giungono alla nostra coscienza sono mediate dal corpo.
É la carne che pensa.
Non c'è bisogno di essere un dualista cartesiano vecchio stile per rifiutare le
aspirazioni riduzioniste della neuroscienza moderna.
Non c'è bisogno, cioè, di credere che esista una sostanza distinta, un qualcosa di
immateriale, mente o anima che dir si voglia, che costituisca il vero Io e il vero
soggetto di tutti gli stati consci.
Esiste infatti un'opinione teorica, a metà strada fra questa antica concezione e quella
neuroscientifica, per cui tutti i fenomeni mentali sarebbero in fondo di natura
puramente fisica.
Nel suo libro The Rediscovery of the Mind (La riscoperta della mente), il filosofo
Searle ha cercato di sviluppare e difendere una concezione ibrida di questo tipo.
Searle si distacca dai precedenti antiriduzionisti sottolineando il fatto che le
sensazioni, i pensieri, i processi mentali in generale sono tutti stati o aspetti del
cervello. Egli rifiuta il dualismo sostanziale.
É il cervello il soggetto e il luogo proprio di ogni attività mentale.
D'altro canto, sostiene, questi stati e attività mentali non sono di per sé stati fisici del
cervello. Non sono identici e nemmeno riducibili agli intricati stati fisici cerebrali con
cui lavorano le neuroscienze propriamente dette: anzi, sono da questi metafisicamente
distinti. Secondo Searle, gli stati mentali costituiscono una classe distinta e nuova di
fenomeni che hanno le loro proprietà peculiari, quali il significato e l'intenzionalità, e
i loro modi di comportamento peculiari, come avviene nel ragionare e nel prendere
decisioni. E sarebbe fatica vana a cercare di ridurli a fenomeni meramente fisici.
In sostanza la mente andrebbe distinta dal cervello.
Ciascuno di noi possiede un suo peculiare e prescientifico modo di conoscere i propri
stati mentali interiori, il loro verificarsi e le loro caratteristiche.
Le scienze fisiche non possono per principio indagare e conoscere questi stati mentali
dal punto di vista di chi le esperimenta ma solo da un punto di vista esterno, che
corrisponde ad una analisi, e non può essere diversamente, di informazioni indirette.
Le caratteristiche soggettive sono diverse da quelle oggettive.
73
Nel caso degli oggetti fisici esiste una legittima distinzione fra apparenza e realtà.
Ma nel caso delle cose mentali, la distinzione scompare, non può essere tracciata:
all'interno della mente l'apparenza è realtà, e viceversa.
In ciascuna mente i processi cognitivi che avvengono costituiscono l'unica realtà
possibile, il filtro tramite qualsiasi realtà può giungere alla coscienza.
Possiamo avere una concezione falsa o superficiale del carattere essenziale dei nostri
stati mentali, ma non ne possiamo prescindere.
Anche se le neuroscienze potessero scoprire sistematiche analogie neurali per tutte le
proprietà intrinseche e causali degli stati mentali, non sarebbe ancora possibile
stabilire con certezza scientifica se un determinato soggetto, o meccanismo,
sperimenta realmente quel particolare stato mentale.
La luce visibile è stata ricondotta a una spiegazione in termini di onde
elettromagnetiche descrivibile in termini di equazioni matematiche, ma una riduzione
del genere non è possibile per gli stati mentali semplicemente perché anche se fosse
possibile non ne coglierebbe l'essenza.
Nessun uomo può sperimentare gli stati mentali di un'altra persona per quanto
possano essere descritti matematicamente: nessuna descrizione di uno stato mentale
ne coglie l'essenza.
Potrei perfino dubitare che in un altro uomo avvengano effettivamente processi
mentali simili ai miei.
Il punto di vista filosofico del solipsimo psicologico può essere sostenuto con grande
coerenza. Ognuno di noi ha accesso solo ed esclusivamente alla propria coscienza.
La coscienza è sfuggita a ogni ricostruzione plausibile in termini
neurocomputazionali. Tutti i vari fenomeni cognitivi potranno anche essere realizzati
con successo in una qualche rete puramente fisica o elettronica, ma in una tale rete,
con tutte le sue raffinate capacità, non esiste nessun modo scientifico disponibile per
dimostrare che possiede realmente una propria coscienza.
Anche se la possedesse noi non potremmo mai saperlo!
Potremmo solo dedurlo dal suo comportamento ma questa è una estrapolazione non
verificabile con i metodi della scienza.
L'obiettivo delle neuroscienze di spiegare la coscienza è semplicemente un problema
mal posto. I successi delle neuroscienze nella simulazione dei processi mentali ci
aiutano a comprendere il funzionamento del cervello e nella costruzione di macchine
con elevate capacità di elaborazione, ma l'obiettivo di ridurre la mente ad un mero
meccanismo è per principio al di fuori del metodo scientifico.
Vediamo per esempio alcune caratteristiche che dovrebbe avere la coscienza:
1. La coscienza implica la memoria a breve termine
2. La coscienza è indipendente dai dati sensoriali.
3. La coscienza mostra di possedere una attenzione che può essere indirizzata
4. La coscienza ha la capacità di dare interpretazioni alternative di dati complessi o
ambigui
5. La coscienza scompare nel sonno profondo
6. La coscienza riappare nel sogno

74
7. Nella coscienza i contenuti delle varie modalità sensoriali fondamentali albergano
insieme, all'interno di una unica esperienza unificata.
Un individuo cosciente non ha tante coscienze distinte quanti sono i suoi sensi; ha
invece un'unica coscienza alla quale ciascuno dei sensi dà il proprio contributo
integrato. In che modo queste parti vengano riunite insieme e che cosa ciò significhi è
una cosa che sarebbe bello poter capire.
Rileggendo i punti presentati ci si accorge che con tutta la nostra buona volontà non
abbiamo colto che una infinitesima parte di ciò che effettivamente è la coscienza.
Tentare di descriverne le caratteristiche non ci consente di coglierne l'essenza.
Possiamo costruire reti neurali che mostrano nel loro funzionamento queste
caratteristiche e possiamo osservarle.
Per esempio, per quanto riguarda l'attenzione, in una rete neurale è possibile
rafforzare la possibilità che uno specifico riconoscimento venga effettuato
aumentando la probabilità che il vettore prototipico appropriato sia attivato dagli
input sensoriali.
I percorsi ricorrenti possono influenzare queste probabilità attivazionali preattivando
leggermente il relativo strato neuronale nella direzione specifica di questo o quel
vettore prototipico.
Il vettore prototipico specifico che viene per un certo tempo favorito in questo modo
diventa così al centro focale corrente o l'oggetto dell'attenzione della rete, in un senso
prettamente funzionale.
Una tale attenzione è indirizzabile dalla stessa attività cognitiva della rete, perché le
diverse manipolazioni ricorrenti dello strato relativo produrranno diverse
preattivazioni parziali.
Tutto questo significa forse che la rete mostra una intenzionalità o una volontà?
Siamo ancora di fronte a meccanismi automatici di attivazione, ancora una volta non
c'è nessuno all'interno della rete.
Per quanto cerchiamo di definirla e riprodurla l'intenzionalità ci sfugge di mano.
Non possiamo sapere cosa prova la rete, possiamo solo osservarla, misurare il valore
dei suoi pesi di attivazione delle connessioni, capire il suo comportamento in termini
computazionali ma niente di più.
Dire che la rete presta attenzione a qualcosa è semanticamente differente da quello
che facciamo noi quando prestiamo attenzione ad un determinato stimolo.
Definire intelligente un organismo o una macchina sulla base del suo comportamento
che mostra "intelligenza" è un circolo vizioso che non ci consente di cogliere
l'essenza dell'intelligenza.
Non esiste nessun indizio fenomenologico che ci possa assicurare che siamo in
presenza di coscienza, l'unica coscienza che conosciamo è la nostra.
Attribuirla a qualcosa di diverso da noi stessi, fosse anche un'altra persona in tutto e
per tutto simile a noi, costituisce una estrapolazione non verificabile
sperimentalmente, ma basata su considerazioni filosofiche e metafisiche, e questo per
il modo assolutamente soggettivo in cui questa esperienza avviene nell'uomo.
Non possiamo sapere cosa si prova ad essere altro da noi stessi!
Inoltre la coscienza non è un processo elaborativo ma conoscitivo.
75
L'informazione è riconosciuta dalla coscienza ma i processi di elaborazione delle
informazioni vengono a monte, costituiscono un passo precedente inconscio.
La coscienza di per se non produce pensieri ma li osserva mentre scorrono nella
mente: la coscienza non è semplice calcolo.
Un organismo o una macchina che si comporta in maniera intelligente non è detto che
sia cosciente anche se supera il test di Turing.
Il mostrare di possedere una conoscenza o una competenza non è sufficiente per poter
dire di essere di fronte a qualcosa di cosciente.
Il test di Turing ci dice quando una macchina si comporta come un essere umano,
almeno verbalmente, ma non ci dice che la macchina è un essere umano.
Come i processi di pensiero vengono realizzati è altrettanto importante delle
prestazioni che si possono osservare.
Il pensiero è certamente anche una elaborazione di informazioni e i computer sono
macchine in grado di elaborare informazione, ne consegue che il computer coglie
almeno un aspetto significativo del pensiero.
Le reti neurali rappresentano una modalità di calcolo automatico che assomiglia per
molti aspetti a quello che si presuppone avvenga nel cervello.
Ma assumere che l'intelligenza cosciente che gli esseri umani esibiscono risulti dal
contesto di reti di codificazione e di calcolo vettoriale costituisce una
generalizzazione avventata che non tiene conto delle differenze strutturali e di
complessità coinvolte.
Se effettivamente la capacità di eseguire una semplice operazione aritmetica è indice
di intelligenza che accomuna una calcolatrice e il cervello umano nondimeno il
fattore di complessità funzionale e contestuale in cui opera il cervello non ci consente
di fare paragoni significativi in merito alla natura ed all'essenza di tale intelligenza.
L'analisi dettagliata delle prestazioni del cervello in ambiti settoriali ci consente di
progettare macchine e scrivere algoritmi in grado di raggiungere elevate prestazioni
intelligenti ma pretendere di aver colto l'essenza di come il cervello opera è
certamente molto discutibile.
Possiamo costruire macchine sempre più intelligenti ma personalmente dubito
fortemente che riusciremo mai a costruire un cervello vivente.
Abbiamo già costruito macchine in grado di superare le capacità di calcolo razionale
dell'uomo, il più eclatante è stato il computer che ha battuto il campione del mondo di
scacchi, ma anche il calcolo delle previsioni della borsa valori, oppure il calcolo di
una complicata trasformata di Fourier, per esempio.
Le potenzialità computazionali del pensiero meccanico sono sbalorditive.
Le macchine intelligenti sono già tra noi.
Ma il cervello è molto più intelligente.
Il cervello ha una incredibile abilità nell'elaborare informazione.
Possiamo delineare le difficoltà che incontrano le macchine verso prestazioni
intelligenti in tre punti:
1. Il problema del significato o del contesto semantico degli stati mentali dell'uomo,
quali pensieri, credenze, desideri.

76
2. Il problema se un computer possa mai ricreare pienamente la capacità matematica
umana.
3. Il problema qualitativo dell'esperienza cosciente.
Searle ha una sua concezione a proposito della natura del significato o del contesto
semantico. Il significato sarebbe intrinsecamente contenuto negli stati coscienti degli
esseri umani, ma sarebbe assente negli stati di un computer.
Gli stati interni di un computer non possiedono significati intrinseci, debbono essere
sempre interpretati.
Un approccio promettente della teoria semantica colloca il significato nel particolare
insieme di relazioni causali e inferenziali che un determinato stato cognitivo
intrattiene con tutti gli altri stati di una persona e con gli aspetti del mondo esterno.
Nel suo libro, la mente nuova dell'Imperatore, Penrose sostiene che il tipo di
procedure algoritmiche utilizzate nei computer non possono dare conto dell'intero
dominio della competenza matematica e della conoscenza umana nel campo della
matematica. Penrose cita il teorema di Gödel sull'incompletezza di ogni
assiomatizzazione dell'aritmetica. Questo famoso teorema stabilisce che non esiste
alcun insieme finito di procedure algoritmiche che possa generare tutte le verità
aritmetiche. Ci dovranno sempre essere alcune verità aritmetiche, che potranno essere
comodamente dimostrate con altri mezzi che non appartengono però al particolare
sistema algoritmico in questione. Nessuna implementazione di questo sistema
algoritmico su una macchina potrà mai stabilire tutte le verità aritmetiche che gli
esseri umani possono arrivare a dimostrare.
Penrose prende questo fatto a dimostrazione che la conoscenza umana delle verità
aritmetiche non possa essere completamente spiegata in termini di utilizzazione di
procedure algoritmiche.
Penrose vuole difendere l'ipotesi che gli esseri umani possiedono una capacità non
algoritmica di riconoscere le verità matematiche, una forma di intuizione che non
dipende dalla manipolazione di simboli fisici, gestita da un pacchetto di regole,
seguendo una procedura a stati discreti.
I processi che hanno luogo all'interno di una rete neurale sono non algoritmici e
costituiscono il nucleo centrale dell'attività computazionale che analogamente
dovrebbero svolgersi dentro la nostra testa.
Sono non algoritmici nel senso che non consistono in una serie di stati fisici discreti
che devono essere attraversati uno dopo l'altro, seguendo le istruzioni di un insieme
di regole per manipolare i simboli immagazzinati in memoria.
Sono trasformazioni di informazione che si propagano grazie a pattern di attivazione
da uno strato all'altro della rete.
Riconoscere la verità di una equazione logica o matematica non necessariamente
coinvolge l'esecuzione seriale di un algoritmo relativo.
L'uomo è un attivatore di prototipi massicciamente parallelo, il computer è un
esecutore ad alta velocità di algoritmi seriali. Le loro capacità, riunite, si
sovrappongono, ma i rispettivi punti forti a livello computazionale sono piuttosto
diversi. L'uomo e il computer sono configurati per esplorare aspetti diversi, anche se
complementari, dello spazio matematico.
77
Certamente le reti neurali sono un potente modello di spiegazione degli aspetti più
misteriosi del tipo di elaborazione che avviene nel cervello.
Tuttavia la complessità del cervello è tale per cui anche altri approcci di analisi
computazionale intervengono sinergicamente nella spiegazione delle prestazioni della
mente. Le ragioni per cui riteniamo un comportamento come intelligente ci guidano
nella ricerca di ambiti ristretti a particolari problemi in cui la realizzazione a
computer di algoritmi in grado di fornirci buone soluzioni hanno un notevole
interesse e potere esplicativo.
L'obiettivo non è capire la mente nella sua essenza, ma capire come la mente elabora
in maniera così efficace l'informazione.
L'utilizzo di credenze e desideri da parte della mente per raggiungere i propri scopi ha
conseguenze notevoli su alcune caratteristiche di elaborazione dell'informazione ai
fini di un comportamento intelligente.
Tramite una semplice telefonata di pochi minuti posso fissare un appuntamento con
un'altra persona a diversi chilometri di distanza.
Lo scambio di relativamente poche informazioni mi consente di predire un fatto che
con molta probabilità avverrà in un futuro relativamente remoto.
L'evento, l'appuntamento, collocato nel futuro può essere previsto già ora e
effettivamente si verificherà nella realtà con grande probabilità, anche se questo
implica lo spostamento di materia, i nostri corpi, in un contesto caotico di eventi
intermedi imprevedibili.
Per recarmi all'appuntamento dovrò eseguire una catena di azioni e movimenti che
implicano l'elaborazione di una gran quantità di informazione, ma lo scopo
determinato dall'informazione originaria verrà quasi certamente perseguito.
Quali leggi fisiche, matematicamente formulate, sono in grado di prevedere il moto di
un corpo in un contesto di corrispondenti eventi casuali con tanta precisione?
Quale algoritmo è possibile formulare in grado di ottenere un simile risultato?
Per realizzare un algoritmo in grado di risolvere un problema complesso nella tecnica
informatica la prima cosa da fare consiste nel fissare e codificare il contesto in cui
l'algoritmo deve operare.
L'elaborazione che esegue la mente per far sì che io possa essere presente
all'appuntamento non consiste nel prevedere e calcolare tutti gli eventi singoli che mi
separano dall'evento desiderato.
Il percorso reale che seguirò per recarmi all'appuntamento è indeterminato.
La mente opera in ambito di incertezza.
Tuttavia la conoscenza del contesto, il mondo, in cui l'evento futuro avverrà mi era
sufficientemente nota fin dal momento in cui ho fissato l'appuntamento.
La conoscenza del luogo, dei possibili mezzi di trasporto e molte altre informazioni
che appartengono alla mia conoscenza implicita sul mondo.
Nella stesura di un algoritmo complesso eseguibile dal computer occorre
preventivamente analizzare ogni dettaglio.
Verificare che tutte le operazioni siano effettivamente computabili in termini di
funzioni eseguibili e di vincoli imposti.

78
Il secondo passo consiste nel codificare in passi logici tutte le singole operazioni in
una catena sequenziale di istruzioni eseguibili.
Anche così non siamo sicuri del risultato a causa delle relazioni causali che
potrebbero intervenire durante le singole operazioni.
Ogni singolo passo deve identificare la pertinenza dell'informazione disponibile,
ovvero identificare l'oggetto formale su cui deve operare.
L'identificazione avviene sulla base del riconoscimento di caratteristiche
significative, ovvero sulla base di un confronto dei dati in memoria.
Ogni piccola differenza nel dato memorizzato rispetto alle caratteristiche specificate
può inficiare e compromettere l'intera elaborazione.
Evidentemente l'elaborazione che il cervello riesce ad operare sull'informazione per
produrre un comportamento intelligente è completamente differente.
Il modo in cui un algoritmo codificato esegue un determinato compito è molto
diverso dal modo in cui lo esegue il cervello anche se le operazioni fondamentali che
costituiscono l'algoritmo sono identiche a quelle eseguite dal cervello.
Su questa base il funzionalismo non riesce a cogliere appieno i processi cerebrali.
Una teoria computazionale della mente deve prevedere metodi di calcolo differenti da
quelli conosciuti ed utilizzati nel computer.
Esiste un grande numero e una grande diversità di talenti cognitivi distinti che
normalmente occorrono per costituire l'intelligenza di un essere umano reale.
Queste diversità e varietà mostrano che l'intelligenza non è un prodotto
unidimensionale che può essere maggiore o minore.
Padroneggiare il linguaggio è certamente l'abilità cognitiva più significativa
dell'essere umano, ma possiamo imparare, con un opportuno insegnamento, a suonare
uno strumento, e possiamo imparare non solo a leggere e a riprodurre la musica, ma
anche a improvvisare in modo fluido e coerente brani musicali di lunghezza arbitraria
a partire da un tema ben definito.
Gli esseri umani possono imparare la geometria e possono imparare a snodare
matasse indefinitamente lunghe di dimostrazioni, di fatti e di relazioni geometriche
sempre più complesse. Gli esseri umani possono imparare l'aritmetica e generare
somme, moltiplicazioni e divisioni di lunghezza arbitraria.
L'architettura del cervello corrisponde a quella di un sistema di calcolo
massicciamente parallelo, eppure è ugualmente capace di ragionare come una tipica
macchina seriale. Possiamo sia produrre sia capire le complesse stringhe di simboli di
un linguaggio, possiamo eseguire operazioni deduttive su tali stringhe con una certa
facilità e affidabilità, possiamo eseguire operazioni aritmetiche ricorsive e così via.
Le capacità seriali della mente costituiscono la base per lo sviluppo del calcolo dei
predicati e della logica deduttiva.
Il funzionamento del computer attuale è basato proprio sulle sequenze di istruzioni
elaborate in successione a gran velocità.
Le reti neurali offrono un modello diverso di calcolo ma dovrebbero essere in grado
di supportare una macchina seriale virtuale per poter produrre quel pensiero di tipo
sequenziale che percepiamo fluire nella nostra mente.

79
Il modello di rete parallela a elaborazione sub simbolica promette una spiegazione
convincente di molte funzionalità tipiche del tipo di elaborazione dell'informazione
che mostra avere il cervello umano.
Ma il computer di tipo seriale si è dimostrato essere di grande potenza elaborativa.
La possibilità di essere programmato da un programmatore intelligente gli conferisce
alcune capacità di calcolo che risulta molto difficile ottenere addestrando una rete
neurale in molti casi pratici di applicazione.
Il successo commerciale e la capillare diffusione del computer dimostra come gli
sviluppi di elaborazione che gli sono tipici, ovvero basati su caratteristiche di grande
affidabilità di ragionamento, possono consentire di ottenere notevoli risultati sulla
base di un processo di sovrapposizione e stratificazione delle piattaforme di utilizzo.
Il computer seriale non riesce a cogliere le sfumature di ragionamento umano ma
procede con la forza bruta verso il raggiungimento del risultato.
Le reti neurali d'altra parte riescono a cogliere caratteristiche tipiche dei processi di
elaborazione delle informazioni che sembra avvengano nel cervello.
Dal punto di vista scientifico della crescita di conoscenza sui presupposti neuronali
del pensiero certamente tali macchine si dimostrano molto utili.
La sfida nel prossimo futuro consisterà nella competizione tra le reti neurali e i
computer seriali a livello di potenza di calcolo e di utilizzo pratico.
Ciascuna delle due tipologie di elaborazione possiede un proprio campo di
applicazioni in cui maggiormente si esaltano le peculiari caratteristiche di
elaborazione dell'informazione.
Certamente in ambito di incertezza e di ambiguità dei dati le reti neurali mostrano
una supremazia dovuta al loro approccio concettuale.
Quando le informazioni sono strutturate e ben definite il calcolo seriale
matematicamente e logicamente esatto parte, ai nostri giorni, con un notevole
vantaggio.
Quando si tratta di calcolare numericamente funzioni matematiche complesse
l'approccio neuronale non sembra essere in grado di competere con la logica e il
rigore del computer seriale.

80
Fisica e informazione
Il concetto di informazione pervade tutte le costruzioni teoriche della fisica.
L'attrazione gravitazionale descritta tramite equazioni di campo presuppone che vi sia
qualche tipo di scambio di informazione tra le masse coinvolte.
Questa assunzione rimane perlopiù implicita nella definizione delle equazioni che
descrivono il moto reciproco dei corpi considerati.
Con lo sviluppo della meccanica quantistica il problema dello scambio di
informazioni tra le particelle è divenuto sempre più evidente.
Nella storia della scienza moderna gli enigmi del mondo quantistico sono stati
oggetto di prolungati e approfonditi dibattiti intorno alla natura definitiva della realtà
fisica.
Einstein e Bohr si incontrarono e si scrissero a lungo per discutere sull'interpretazione
delle osservazioni quantistiche. Einstein non riusciva ad accettare l'indeterminatezza
che sembrava insita nel comportamento dei quanti.
Formulò un esperimento mentale dopo l'altro per dimostrare che la teoria quantistica,
nella formulazione attuale, era incoerente a livello logico.
Bohr, d'altra parte, rifiutò qualsiasi interpretazione che si spingesse al di là delle
osservazioni reali. La natura non solo aveva posto un limite assoluto al misurabile e
all'osservabile, ma anche a ciò di cui si può parlare senza ambiguità.
Il principio di indeterminazione di Heisenberg afferma che la posizione e la quantità
di moto di una particella elementare non sono misurabili simultaneamente.
Le particelle elementari non possiedono una traettoria ben precisa.
Questo implicava che la semplice osservazione della particella ne modificasse lo stato
fisico, ovvero, in maniera molto colorita, che se una persona osserva il mondo questo
implica una modifica dello stato del mondo.
La rilevazione su un contatore Geiger di una particella elementare ne modifica in
maniera irreversibile lo stato fisico.
Si dice che la funzione d'onda collassa ad un solo valore tra quelli probabili.
Conoscere posizione e quantità di moto di una particella elementare significa avere
delle informazioni sul suo stato fisico, queste informazioni non possono mai essere
complete anche se le equazioni quantistiche ci forniscono tutta l'informazione
possibile sul sistema. Esiste un limite invalicabile oltre il quale la particella
elementare non risulta più realmente definita.
Ciò di cui disponiamo è solo una probabilità di esistenza.
Nonostante che le particelle esistano solo in termini di probabilità tuttavia esse
continuano ad interagire tra loro e le equazioni quantistiche descrivono esattamente il
comportamento complessivo del sistema.
Due fotoni che attraversano la doppia fenditura sono informati sui loro reciproci
tragitti producendo una figura di interferenza.

81
Il comportamento delle due particelle presenta una reciproca coerenza ed è descritto
matematicamente tramite un formalismo rigoroso in cui ciascuna particella è
rappresentata da un'onda di probabilità.
La natura di questo scambio di informazioni sembra trascendere lo spazio e il tempo.
Nessun fenomeno quantistico elementare è propriamente un fenomeno a meno che sia
registrato, impresso in modo indelebile, messo alle strette da un atto di
amplificazione irreversibile come l'annerimento di una emulsione fotografica.
Vi sono solo osservazioni di questi atti di amplificazione e vi sono le ampiezze di
probabilità assegnate mediante numeri complessi, ma non si ha nessuna informazione
su ciò a cui corrispondono a tali ampiezze di probabilità.
I fisici sono stati costretti a questa conclusione fenomenica da esperimenti che hanno
deluso tutte le aspettative sul modo in cui dovrebbero comportarsi i pezzi di materia
nel mondo reale.
L'esperimento più famoso è quello della doppia fenditura.
La luce emessa da una sorgente viene fatta passare attraverso una sottile fenditura di
uno schermo. Dietro allo schermo ne viene collocato un altro, per registrare i raggi
che attraversano la fenditura. A quel punto il raggio passa formando una figura di
diffrazione spiegabile con la natura ondulatoria della luce. Ma se nello schermo si
apre una seconda fenditura, avviene una sovrapposizione di due figure di diffrazione,
anche se viene emesso un solo fotone alla volta.
Le onde che si propagano oltre le fenditure formano la tipica figura di interferenza, in
cui i fronti d'onda si annullano reciprocamente quando sono in opposizione di fase e
si rinforzano reciprocamente quando sono in fase. É come se ciascun fotone passasse
contemporaneamente da entrambi i fori, e questo non corrisponde al comportamento
che ci si aspetta da un oggetto corpuscolare nel mondo reale.
Esistono diverse varianti di questo esperimento, in una di queste ideata da Wheeler, i
fotoni vengono emessi a uno a uno e viaggiano dall'emettitore a uno strumento
rivelatore che emette un segnale acustico o si accende ogni volta che viene colpito da
una particella. Lungo il percorso del fotone viene inserito uno specchio
semiargentato, che scinde il fascio, determinando la probabilità che un fotone su due
attraversi lo specchio e uno su due ne venga deviato. A conferma di questa
probabilità, vengono collocati due rilevatori di fotoni, uno dietro allo specchio
semiargentato e uno ad angolo retto rispetto ad esso. La previsione che in media un
fotone su due passi da un percorso e uno su due dall'altro viene confermata dalle
osservazioni: i due rilevatori registrano un numero di fotoni approssimativamente
uguale. Ma quando viene inserito un secondo specchio semiargentato sul percorso dei
fotoni non deviati dal primo si ripresenta l'enigma. L'angolo formato da questo
specchio è tale per cui i fotoni deviati e non deviati dovrebbero ancora arrivare a uno
o all'altro rilevatore. Di conseguenza, ci si aspetterebbe di avere lo stesso numero di
rilevazioni sui due rivelatori: i fotoni emessi individualmente dovrebbero soltanto
aver cambiato destinazione. Ma non accade così. Uno solo dei due rilevatori ticchetta,
l'altro mai. Tutti i fotoni arrivano ad una sola destinazione.
I fotoni, emessi come particelle singole, interferiscono reciprocamente come onde.

82
Su uno degli specchi l'interferenza è distruttiva, perché lo sfasamento tra fotoni è di
180°, di modo che i fotoni, come onde, si annullano a vicenda. Sull'altro specchio
l'interferenza è costruttiva: le onde dei fotoni procedono sulla stessa fase e si
rinforzano reciprocamente.
I fisici sono stati costretti a giungere alla curiosa conclusione che ciascun fotone, in
qualche modo "sa" che cosa stanno facendo gli altri e sceglie il percorso di
conseguenza.
Questa "conoscenza" è resa ancor più problematica dal fatto che il tempo e lo spazio
vi incidono solo marginalmente.
In una versione cosmologica dell'esperimento del fascio suddiviso, sono stati studiati
fotoni che hanno origine in una galassia remota, emessi migliaia di anni prima.
I fotoni di un esperimento sono stati quelli emessi da un quasar doppio.
Si ritiene ora che questo quasar distante sia un oggetto unico, non doppio, e che la
duplice immagine sia dovuta alla deviazione della luce operata da una galassia
intermedia situata a circa un quarto della distanza dalla Terra. La deviazione dovuta
all'azione del prisma gravitazionale è grande a sufficienza da riunire due raggi di luce
emessi dal quasar miliardi di anni fa. A causa della distanza aggiuntiva percorsa dai
fotoni deviati dalla galassia, questi sono rimasti in viaggio cinquantamila anni in più
rispetto a quelli che hanno percorso l'itinerario più diretto. Eppure, nonostante si
siano originati miliardi di anni fa con un intervallo di cinquantamila anni, i fotoni
interferiscono reciprocamente come se fossero stati emessi pochi secondi prima in
laboratorio.
All'inizio degli anni '90 Mandel dell'Università di Rochester ed i suoi collaboratori
hanno compiuto un esperimento straordinario, che potremo analizzare in un certo
dettaglio.
Alcuni fisici in passato davano una banale interpretazione "operativa"
dell'esperimento con le due fenditure: poiché la misurazione è necessariamente
"invasiva", è inevitabile che il sistema fisico alteri il suo stato.
Ma l'esperimento di Mandel ed altri hanno dimostrato che è sufficiente qualcosa di
molto più evanescente di una misurazione per far cambiare lo stato fisico di un
sistema: è sufficiente la conoscenza potenziale che possiamo avere di tale sistema!
Magia? No, fisica contemporanea.
Anzitutto ricreiamo una situazione simile a quella del fotone che transita attraverso
le due fenditure, ma per mezzo di un dispositivo diverso, cioè uno specchio semi-
riflettente (detto anche divisore di fascio): esso trasmette la luce al 50%, ovvero solo
metà dell'intensità luminosa riuscirà ad attraversare lo specchio, mentre l'altra metà
sarà riflessa.
Analizzando i singoli fotoni, in una descrizione tradizionale diremmo che la
probabilità che un fotone attraversi lo specchio (invece di essere riflesso) è del 50%.
Se consideriamo 100 fotoni, secondo la logica convenzionale ci aspettiamo
statisticamente che circa 50 fotoni attraversino lo specchio, mentre gli altri 50
vengano riflessi: il fascio iniziale di 100 fotoni quindi sarà diviso in due fasci diversi
che percorrono cammini diversi. Questo però è vero solo se abbiamo modo di rivelare
esplicitamente i singoli fotoni, altrimenti dobbiamo ammettere che ciascun fotone si
83
troverà in uno strano "stato di sovrapposizione", cioè al 50% attraverserà lo specchio
ed al 50% sarà riflesso. In altre parole, il percorso di ciascun fotone sarà indefinito,
poiché "per metà" passerà attraverso lo specchio e "per l'altra metà" verrà riflesso,
sebbene esso sia indivisibile!
Se noi non misuriamo esplicitamente il percorso seguito dal fotone e facciamo
incidere i due percorsi potenziali su uno schermo, otterremo la solita figura di
interferenza: ovvero il fotone (pur rimanendo una particella singola) passerà da
entrambi i percorsi e alla fine produrrà interferenza con se stesso. Fin qui avviene ciò
che abbiamo già descritto, anche se stavolta il misterioso sdoppiamento del singolo
fotone non è causato dalle due fenditure bensì dallo specchio semi-riflettente.

Il laser (1) emette un fotone, lo specchio semi-riflettente (2) "divide" il fotone in


due parti fantasma, e ciascuno delle due parti fantasma percorre un percorso diverso
(3 e 4). Gli specchi nei punti 3 e 4 sono "normali" (non semi-riflettenti) e servono
solo a indirizzare in maniera opportuna i due percorsi.
Su ciascun percorso vi è un "convertitore verso le basse frequenze". Ciascun
convertitore (5 e 6) divide il proprio fotone fantasma in due fotoni gemelli di energia
dimezzata. Uno viene chiamato "fotone segnale" ed è indicato con S, mentre l'altro
viene chiamato "fotone ausiliario" ed è indicato con A. Infine, i due percorsi S
vengono rivelati sullo schermo (9), mentre i due percorsi A vengono indirizzati sul
rivelatore ausiliario (8). In realtà, per ragioni tecniche, il sistema realmente usato
dall'equipe di Mandel è leggermente più complicato, ma è concettualmente
equivalente a quello appena descritto.
Vediamo allora come funziona l'intero sistema: il laser (1) spara un singolo fotone
alla volta che incide sullo specchio semi-riflettente (2). Poiché noi non misuriamo
quale percorso viene effettuato dal fotone, esso fantomaticamente passa da entrambi i
percorsi (3 e 4), e nei convertitori 5 e 6 il fotone fantasma viene diviso in due fotoni
gemelli di energia dimezzata. Alla fine, i due percorsi "segnale" (indicati con S)
incidono sullo schermo (9) dove il fotone S farà interferenza con se stesso (cioè con
l'altra parte di se stesso passato dall'altro percorso). In seguito dal laser spareremo
altri fotoni, uno alla volta, ed alla fine come risultato vedremo una chiara figura di
interferenza sullo schermo (9).

84
La situazione è simile a quella dell'esperimento con le due fenditure e l'unica
differenza è che qui la situazione è "raddoppiata" (grazie ai convertitori 5 e 6), cioè
abbiamo anche i due percorsi "ausiliari" (A), per cui, ogni volta che un fotone colpirà
lo schermo (9), contemporaneamente riscontreremo l'arrivo di un fotone anche sul
rivelatore ausiliario (8), ovvero registreremo una cosiddetta "coincidenza". In
quest'analisi abbiamo presupposto che non vi sia ancora un ostacolo nel punto 7, che
si trova sul percorso di uno dei fasci ausiliari.
Benissimo: ora viene il bello. Vediamo che cosa succede se si inserisce appunto un
ostacolo nel punto 7. Una volta che i percorsi sono stati divisi, ci aspettiamo che essi
siano indipendenti: perciò l'ostacolo nel punto 7 non dovrebbe alterare la figura di
interferenza nello schermo (9) poiché il punto 7 si trova su un altro percorso, che
porta al rivelatore ausiliario (8) e non allo schermo (9).
Ma se inseriamo l'ostacolo nel punto 7, interrompendo così il percorso di un fascio
ausiliario, la figura di interferenza dei fasci segnale nello schermo (9) scompare!
Eppure non abbiamo effettuato misure sui fasci segnale (che finiscono sullo schermo,
9), ma solo su un fascio ausiliario (che finisce nel rivelatore, 8)! Anche se
allontaniamo moltissimo i due fasci (A e S) tra di loro, quando operiamo sui fasci A
incredibilmente produciamo un'influenza sui fasci S, che contraddice la località di
Einstein.
Com'è possibile? Che cos'è cambiato rispetto al caso precedente quando non vi era
un ostacolo nel punto 7? È cambiata la "conoscenza potenziale" che abbiamo sui fasci
segnale: poiché il percorso che passa dall'ostacolo 7 è interrotto, quando riveliamo un
fotone sul rivelatore degli ausiliari (8) esso deve provenire necessariamente dal
percorso che passa per lo specchio 3 (non può provenire dal percorso dello specchio 4
appunto perché interrotto nel punto 7). Perciò, misurando la sua coincidenza col
fotone segnale sullo schermo (9) noi saremmo in grado di dire con certezza che quel
fotone segnale proveniva dal percorso dello specchio 3, cioè sapremmo che il fotone
è passato "interamente" da questo percorso e conseguentemente non può essere
passato dal percorso dello specchio 4: per questo non può fare interferenza (come nel
caso delle due fenditure).
Questo spiega perché la figura di interferenza nello schermo (9) viene distrutta se
inseriamo un ostacolo (7) sul fascio ausiliario. Il fatto notevole è che si tratta di una
sconcertante "azione fantomatica a distanza": agendo sul punto 7 alteriamo lo stato
fisico in un luogo diverso, cioè sullo schermo (9), dove la figura di interferenza viene
distrutta, e questo è dovuto al fatto che ora noi sappiamo o possiamo dedurre quale
percorso avrà seguito il fotone che inciderà sullo schermo (9): è dovuto cioè a una
conoscenza, ad un'informazione, ad un atto di consapevolezza, e non ad un intervento
materiale diretto. Questa "conoscenza potenziale" è sufficiente ad alterare lo stato
fisico sul rivelatore dei segnali, distruggendo la figura di interferenza.
Il gruppo di R.Chiao, dell'Università di Berkeley, ha condotto altri esperimenti
straordinari, i quali dimostrano che il "collasso della funzione d'onda" è reversibile
(mentre Bohr e gli altri fisici di Copenaghen pensavano che fosse irreversibile, tant'è
vero che su questo fatto, oggi inaccettabile, essi basarono la loro interpretazione, in
modo da aggirare la scomoda figura dell'osservatore cosciente). Il fenomeno in
85
questione è stato chiamato "cancellazione quantistica" (ciò che si può cancellare è
appunto il collasso della funzione d'onda, che negli anni '20 veniva considerato
irreversibile).
Sfruttando "giochi di prestigio quantistici" di questo genere, i fisici P.Kwiat,
H.Weinfurter e A.Zeilinger hanno dimostrato che sono possibili delle "misure senza
interazione", ovvero ci si può accorgere della presenza di un oggetto macroscopico
(cioè "classico" e non quantistico) utilizzando le caratteristiche quantistiche dei fotoni
e la loro non-oggettività (nota: nel caso di un oggetto macroscopico la sua esistenza
"oggettiva" è probabilisticamente elevatissima, cioè praticamente certa; però
l'esperimento sfrutta le qualità di non-oggettività quantistica del fotone rivelatore, che
così rivela l'oggetto senza interagire con esso!).
Misure senza interazione potrebbero avere applicazioni importantissime in campo
medico, per ridurre fortemente l'intensità delle radiazioni nell'osservazione
specialistica di tessuti organici. Si immagini per esempio di poter fare una radiografia
a tutti gli effetti, ma riducendo drasticamente l'esposizione ai raggi X. Un'articolo su
questo tema è stato pubblicato su Le Scienze n.342 del 1997.
Per capire come ciò sia possibile, ci si può ricollegare all'esperimento di Mandel
descritto sopra. Immaginiamo che l'oggetto da rivelare sia l'ostacolo inserito nel
punto 7: ebbene, noi possiamo rivelare la presenza dell'oggetto verificando se sullo
schermo (9) si forma o meno la misura di interferenza! Si tratta quindi di una misura
indiretta che non coinvolge esplicitamente l'oggetto.
Purtroppo l'oggetto verrà comunque colpito da un fotone nel 50% dei casi (poiché
statisticamente nel 50% dei casi lo specchio semi-riflettente 2 lascerà passare un
fotone che attraverso il percorso 4 colpirà effettivamente l'oggetto nel punto 7).
L'esposizione alla radiazione però può essere ridotta a piacere sfruttando un metodo
ingegnosissimo detto "Effetto Zenone quantistico": Weinfurter e Zeilinger sono già
riusciti a ridurre dell'83,3% la radiazione necessaria, lasciando un'esposizione solo
del 16,7%.
Inoltre vi sono altre applicazioni pratiche di questi "giochi di prestigio quantistici".
Per esempio il teorema di Bell permette l'esistenza di una "crittografia quantistica"
assolutamente sicura, poiché decifrabile solo da chi possiede la chiave originale. Ma
non basta. Sono già allo studio dei "computer quantistici" basati sui qubit, ovvero su
"bit quantistici" che possono sfruttare gli stati di sovrapposizione quantistica.
Infine, grazie alle caratteristiche paradossali della realtà quantistica, sono stati
condotti perfino esperimenti di "teletrasporto", cioè di trasporto a distanza! Il sogno
fantascientifico di trasmettere gli oggetti a distanza (si pensi al film Star Trek) è in
linea di principio realizzabile, almeno per le particelle quantistiche, ed i primi
esperimenti sono già stati effettuati con successo (si veda l'articolo di Zeilinger su Le
Scienze n.382, Giugno 2000).
L'interferenza è un fenomeno che suggerisce che esista uno scambio di informazioni
tra fotoni con modalità enigmatiche, il fatto che tale modalità non sia soggetta a limiti
spaziali o temporali mette in crisi tutte le aspettative su come si comportano i singoli
oggetti in natura e in particolare su come l'informazione possa viaggiare su supporti
non fisici, senza un contesto spaziale o temporale.
86
Date queste e simili anomalie, e stata messa in discussione l'idea di poter conoscere la
realtà fisica indipendentemente dalle nostre osservazioni.
Secondo i fisici non si hanno basi per parlare di cosa siano i quanti e di ciò che fanno
nell'intervallo tra le osservazioni che ne segnalano l'emissione e la ricezione.
Nonostante ciò le equazioni che ne descrivono il comportamento in termini di
probabilità sono in grado di prevederne il comportamento con grande precisione.
Esiste solo un limite di principio alla possibilità di conoscenza della realtà espresso
come principio di indeterminazione di Heisenberg.
L'esperimento mentale EPR ideato da Einstein Podolski e Rosen aveva lo scopo di
dimostrare che, in teoria, è possibile determinare sia quantità di moto sia posizione di
una particella; e che perciò ha senso affermare che le particelle possiedono
simultaneamente entrambe le proprietà.
L'esperimento EPR consiste nel considerare una reazione del tipo di quella prodotta
dalla collisione di un elettrone con un positrone. In essa viene prodotta una coppia di
fotoni con stato quantico identico ma che si propagano in direzioni opposte. Si misura
la posizione di uno dei fotoni e, in base al risultato, è possibile prevedere lo stato
corrispondente dell'altro. Dalla seconda particella si misura una proprietà
complementare, come la quantità di moto. In questo modo si verrebbe a conoscenza
sia della quantità di moto sia della posizione della seconda particella, risultato che la
teoria quantistica ritiene impossibile.
L'esperimento EPR fu proposto nel 1935, ma solo nel 1982 gli strumenti fisici hanno
consentito di provarne una versione. Il test ha dimostrato che, pur in condizioni di
distanza spaziale, l'atto di misurazione su una particella faceva collassare anche la
funzione d'onda dell'altra.
Anche in questo caso, come nell'esperimento del fascio suddiviso, due particelle,
anche se separate nello spazio, risultavano correlate all'istante.
Anche in questo caso sembrerebbe che le due particelle possano scambiarsi segnali o
informazioni (non intese nel senso operativo ma in un senso più generale)
indipendentemente da vincoli di spazio e di tempo.
Il teorema di Bell prevede che un segnale passi istantaneamente tra particelle distanti
nello spazio. I segnali potrebbero viaggiare attraverso lo spazio finito senza che per la
loro trasmissione sia necessario un tempo finito.
La trasmissione istantanea di segnali viola una legge fondamentale della relatività:
che nulla nell'universo si sposta a una velocità superiore a quella della luce.
Ma a livello quantistico l'informazione sembra che ignori questo divieto.
La correlazione tra i quanti sembra istantanea, e non sembra diminuire con la
distanza.
Le correlazioni istantanee nella natura fisica si verificano anche a temperature
estremamente basse, nei fenomeni della superconduttività e della superfluidità.
Quando vari metalli puri e leghe vengono superraffreddati fino a pochi gradi dallo
zero assoluto, la loro resistenza elettrica viene meno. Le sostanze diventano
superconduttori: la corrente elettrica che li attraversa viene trasportata completamente
senza attrito. Questo fenomeno è stato scoperto da Onnes nel 1911 e i particolari,
insieme a quelli della superfluidità, la mancanza di viscosità di un liquido
87
superraffreddato come l'elio, sono venuti alla luce nei successivi decenni di ricerca
nel campo delle basse temperature.
La scomparsa di resistenza elettrica in un conduttore è dovuta a un notevole livello di
coerenza tra gli elettroni. Normalmente quando una corrente elettrica attraversa un
metallo gli elettroni vengono sparsi dagli atomi in vibrazione nella struttura reticolare
del metallo. Ciò ritarda il flusso di elettroni attraverso il reticolo e produce l'attrito
che riscalda il metallo: il fenomeno della resistenza elettrica.
Quando invece il metallo viene superraffreddato, le vibrazioni degli atomi si riducono
e la resistenza del metallo diminuisce. Dato che anche in prossimità dello zero della
scala Kelvin le energie prossime allo zero continuano a far vibrare il reticolo, in realtà
dovrebbe esserci resistenza elettrica anche quando i metalli o le leghe vengono
raffreddati fino a pochi gradi dallo zero assoluto. Invece a queste temperature la
resistenza viene meno del tutto: le sostanze si trasformano in superconduttori.
In un anello creato con un superconduttore una corrente elettrica, una volta indotta,
continua a fluire idefinitivamente.
Quando un metallo o una lega vengono raffreddati a una temperatura critica, gli
elettroni vi scorrono in modo del tutto coerente.
Un fenomeno simile si verifica con i superfluidi.
Le molecole, che in precedenza collidevano in modo del tutto casuale, aderiscono in
una singola entità quantistica senza viscosità apparente; tale fluido è in grado di
scorrere in capillari e fenditure senza resistenza.
In entrambi i casi viene generato uno stato quantistico altamente coesivo.
La funzione d'onda del moto di tutti gli elettroni di una corrente e di tutti i quanti che
costituiscono le molecole di un fluido assume sempre la stessa forma.
Gli elettroni di un superconduttore e le particelle che costituiscono le molecole di un
superfluido sono reciprocamente correlate in modo preciso e continuo.
Ma in che modo una particella "conosce" lo stato dell'altra?
Tra di esse non passa alcuna forma nota di energia o segnale.
La superconduttività e la superfluidità sono altri esempi di correlazione istantanea tra
entità in posizioni diverse nello spazio e nel tempo.
Il nucleo dell'atomo è formato da vari campi energetici che definiscono i livelli
energetici possibili nei gusci che lo circondano. Le energie nucleari non definiscono
però in che modo l'energia è sistemata nei gusci: non determinano la struttura
specifica dei gusci. Quella struttura è determinata da una correlazione peculiare che si
verifica tra gli elettroni all'interno dei gusci stessi. Queste correlazioni sono
istantanee e non si verificano tra elettroni non associati e altre particelle indipendenti.
Si verificano solo tra elettroni che orbitano intorno ai nuclei atomici.
Sta di fatto che gli elettroni all'interno dei gusci di un atomo non sono connessi
mediante alcuna forma nota di energia. Eppure il sistema complessivo creato da tutti
gli elettroni condiziona il comportamento di ciascuno e assegna le relative probabilità
del loro stato.
Anche in questo caso sembra che ciascun elettrone "sappia" ciò che stanno facendo
gli altri.

88
La trattazione matematica dell'esclusione degli elettroni fu elaborata da Pauli nel
1925; il suo principio di esclusione afferma che due elettroni intorno ad un nucleo, o
intorno a vari nuclei in una configurazione multiatomica, non possono trovarsi in uno
stato di moto descritto dallo stesso insieme di quattro numeri quantici.
L'esclusione segue la regola dell'antisimmetria. Il principio stabilisce che gli elettroni
di un atomo devono occupare orbite diverse.
Ma in che modo un elettrone può obbedire a questo principio?
Esso dovrebbe possedere delle informazioni che riguardano l'intero sistema atomico.
Il principio di esclusione richiede una correlazione precisa tra gli elettroni senza
comportare alcuna forza dinamica, energia o segnale fisico.
Allo stesso modo in cui i due elettroni dell'esperimento EPR e i due fotoni
nell'esperimento del fascio suddiviso sembrano "conoscere" lo stato quantico
reciproco senza scambio di energia, gli elettroni di un atomo, di una molecola o di un
metallo sembrano interconnessi in modo istantaneo e non dinamico.
Abbiamo visto come l'informazione possa essere codificata e misurata utilizzando
supporti fisici, anzi questo è il solo modo che abbiamo per poterla comprendere e
utilizzare normalmente.
Possiamo osservare i cerchi concentrici presenti in un tronco d'albero e ricavarne
l'informazione sull'età dell'albero.
La correlazione tra i cerchi che si sono formati nel tempo e il complesso fenomeno
della vita dell'albero ci consente di ricavare una informazione abbastanza precisa.
L'informazione sull'età dell'albero è stata codificata dalla natura nei cerchi concentrici
che possiamo osservare.
Possiamo telefonare a casa mandando un messaggio del tipo "ho mal di testa" e
l'informazione contenuta subisce diverse trasformazioni di codifica e decodifica in
termini fisici, parole, onde sonore, impulsi elettrici, scariche neurali nel cervello di
chi ascolta, ma l'informazione contenuta è sempre la stessa, e consiste in una
correlazione tra un evento, il mio mal di testa, e una rappresentazione significativa
dell'evento nella testa di chi riceve il messaggio.
Il cervello costituisce un fantastico elaboratore di informazioni.
Ma per un elettrone le cose stanno molto diversamente.
Un computer può ricevere un messaggio e correlarlo ai propri stati interni
producendo o modificando comportamenti conseguenti, l'informazione contenuta nel
messaggio non viene "capita" ma può influenzare in maniera determinate cosa il
computer esegue.
In un certo senso il computer "comprende" l'informazione senza doversi appellare
all'enigmatica "coscienza" unica in grado di dare un senso all'informazione.
Quando siamo in presenza di correlazioni tra eventi possiamo ipotizzare che esista un
interscambio di informazioni significative oppure che i sistemi siano soggetti alle
medesime leggi causali.
La fisica descrive il comportamento della materia in termini di modelli matematici.
Il problema connesso al ruolo dell'osservatore nella determinazione degli stati fisici
della materia non è stato ancora ben compreso dai fisici.

89
Sembra esistere una relazione tra l'informazione disponibile sullo stato fisico di una
particella elementare e gli strumenti di rilevazione sperimentale.
L'evento che i fisici chiamano "collasso della funzione d'onda" presenta
caratteristiche davvero molto enigmatiche.
La realtà avrebbe una natura indeterminata fintanto che qualcuno la osserva.
L'informazione sulla realtà è indefinita fintanto che non viene fisicamente codificata.
Se un fotone lascia una traccia su un rivelatore l'informazione della sua esistenza ha
lasciato un segno indelebile tramite un processo irreversibile.
L'indeterminatezza di fondo presente in natura mina alla radice la possibilità di
comprensione in uno schema coerente di tutti gli aspetti della realtà.
Anche se le equazioni della meccanica quantistica ci consentono di costruire i
transistor esse aprono una finestra sull'inconoscibile togliendoci la terra da sotto i
piedi e rendendoci consapevoli dei limiti dei nostri metodi conoscitivi.
L'informazione per come la conosciamo ha necessità di una rappresentazione.
Essa deve passare, deve essere trasmessa, dall'evento esterno a noi fino alla nostra
comprensione nei termini delle nostre possibilità cognitive.
Questo processo di comunicazione dell'informazione deve passare attraverso una
qualche codifica in termini fisici, e ciò potrebbe comportare una alterazione
ineliminabile dell'informazione originaria.
Nell'esempio della telefonata sul mal di testa la prima codifica in termini del
linguaggio, ovvero in parole, esclude moltissime caratteristiche relativamente al
fenomeno originale costituito dal mio reale mal di testa.
La comprensione relativa da parte del ricevente presuppone una interpretazione
basata su cosa si prova ad avere mal di testa.
Esiste in natura la possibilità di trasmettere un'informazione senza nessun supporto
fisico che la trasporti?
Questo è proprio quello che sembrano suggerire gli esperimenti osservati.
L'idea di un'informazione senza supporto fisico sembra a prima vista inconcepibile.
Non è il modo solito con cui noi abbiamo a che fare con l'informazione.
Non è una idea che faccia parte della nostra esperienza diretta.
Ma anche i campi elettromagnetici sono cose che sfuggono alla nostra percezione.
I campi elettromagnetici si spostano nel vuoto assoluto senza bisogno di ricorrere ad
una sostanza, come per esempio l'etere, che li trasporti.
Il formalismo matematico con cui li descriviamo è sufficiente a consentirci di
utilizzarli in moltissime applicazioni pratiche.
Definire cosa sia l'informazione pura è estremamente difficoltoso.
In particolare siamo talmente abituati a dare un significato all'informazione che
spesso dimentichiamo che è la nostra mente ad attribuire un significato ai messaggi
che riceviamo continuamente.
Dal punto di vista di una particella materiale le cose stanno molto diversamente.
Comunque possiamo tentare di definire l'informazione come una correlazione fra due
stati materialmente possibili.

90
In particolare se disponiamo di due rappresentazioni collegate tramite un canale di
trasmissione possiamo definire l'informazione come una correlazione fra elementi
nelle rispettive rappresentazioni.
Questa definizione funziona molto bene quando cerchiamo di capire cosa succede
quando due persone si scambiano informazione.
Nella meccanica quantistica la funzione d'onda contiene la correlazione fra le
possibili misurazioni fisiche.
Gli stati possibili descritti dalla funzione d'onda sono quindi in relazione reciproca in
maniera istantanea anche se non siamo in presenza di alcun segnale scambiato.
Possiamo quindi ipotizzare che l'informazione, intesa come correlazione tra stati,
possa essere trasmessa senza scambio di messaggi specifici, in particolare senza
l'utilizzo di energia.
Nell'esperimento EPR due particelle correlate si influenzano reciprocamente.
L'esperimento EPR è un fenomeno non razionalizzabile caratteristico delle dinamiche
della meccanica quantistica, per cui azioni tra luoghi distanti - che normalmente
avvengono in tempi e spazi diversi - avvengono invece nello stesso tempo e
conspazialmente. Questo fenomeno è presentato dai quanti, da protoni o altre
particelle, da elettroni, da interi atomi, da parti di molecole aventi due possibili stati
morfologici (ad esempio, le proteine neuroniche "tubulina alfa" e "tubulina beta", che
differiscono solo per l'orientamento spaziale di parte della molecola), i quali talvolta
vengono emessi e/o si presentano in modo correlato ("entangled"). Il modo correlato
consiste in uno "stato di sovrapposizione" che attribuisce contemporaneamente, ai
vari enti sopraelencati, proprietà normalmente antagoniste, quali ad es. velocità in
due o più diverse direzioni, spin (rotazione) destrorsa e sinistrorsa, orientamenti
spaziali in direzioni diverse, proprietà corpuscolari spazialmente definite che si
trasformano in onde di materia stazionarie e fluttuanti con continuità (elettroni nelle
proprie orbite atomiche o nei circuiti superconduttori). Ciò fu intuito (e rifiutato) dai
fisici Einstein, Podolsky, Rosen (le esperienze compiute, che indicavano questo
comportamento furono da allora dette "EPR", dalle iniziali dei loro cognomi). Al
contrario, Niels Bohr affermò: "...anche se due fotoni (correlati) si trovassero su due
diverse galassie, continuerebbero a rimanere pur sempre un unico ente, e l'azione
compiuta su uno di essi avrebbe effetti istantanei anche sull'altro...". La disputa
terminò nel 1982, con gli esperimenti di Alain Aspect che dimostrarono
inconfutabilmente la giustezza delle suelencate proprietà della meccanica quantistica.
Le equazioni della meccanica quantistica descrivono dunque una correlazione
istantanea tra le particelle, questa correlazione contiene informazione.
Una particella conosce lo stato dell'altra istantaneamente.
Questa interazione reciproca viola il principio di località come è stato più volte
osservato.
In particolare le particelle non sono separabili nonostante la distanza che le separa,
continuano a comportarsi in maniera olistica, come un tutto unico, e sono descritte
dalla meccanica quantistica in maniera unitaria.
Sembrerebbe quindi che l'informazione debba propagarsi a velocità infinita senza
utilizzo di energia.
91
L'informazione contenuta nella funzione d'onda rappresenta la probabilità che si
verifichi una determinata misurazione e questa informazione è perfettamente
comprensibile all'intelletto umano, in particolare ci consente di prevedere
(statisticamente) quali saranno le nostre misurazioni.
Ma questa informazione potrebbe anche essere una componente reale caratterizzante
gli stati fisici, in particolare potrebbe essere una proprietà dotata di senso per la
natura.
Così come il campo gravitazionale trasporta l'informazione che da origine
all'attrazione tra corpi materiali, la correlazione contenuta nella funzione d'onda
descritta matematicamente determina il comportamento delle particelle elementari.
L'elettrone è energia che viaggia nel vuoto sottoforma di onda.
L'elettrone è anche un corpuscolo dotato di massa.
La contraddizione logica dell'elettrone che è sia un'onda che una particella viene
superata dal formalismo della meccanica quantistica al prezzo però di rinunciare alla
possibilità di determinare in maniera esatta cosa esso sia veramente ad un dato
istante.
Nonostante ciò per fortuna i nostri tavoli, costituiti di atomi ed elettroni, non
scompaiono improvvisamente alla nostra vista.
L'informazione pura, di qualsiasi natura essa sia, svolge un ruolo determinante nel
mondo fisico.
Nel caso del diavoletto di Maxwel l'informazione sulla velocità delle molecole di un
gas ci consentirebbe di violare il secondo principio della termodinamica,
consentendoci di far fluire calore da un corpo freddo ad uno caldo.
Il fatto che non si possa costruire nessun meccanismo, che coinvolga la codifica e la
trasmissione dell'informazione relativa in maniera utilizzabile, in grado di funzionare
realmente nel mondo fisico, non inficia completamente questa possibilità di principio.
Se fossimo in grado di utilizzare questa informazione senza utilizzare energia
potremmo costruire una tale macchina.
Queste considerazioni ci portano a riesaminare il funzionamento del cervello da un
altro punto di vista: come esempio principe di un elaboratore di informazioni.
Lo studio di come le informazioni vengono strutturate per poter essere utilizzate, che
la scienza dell'informazione ha indagato in maniera approfondita per quanto riguarda
le macchine elaboratrici, potrebbe portarci ad una comprensione di come il cervello
organizza le proprie informazioni.
In particolare il problema cruciale da risolvere è costituito dalla possibilità
dell'informazione di auto-organizzarsi.
Sarebbe bello poter individuare un principio che consenta all'informazione di
organizzarsi in maniera autonoma.
Nella progettazione di una base di conoscenza, l'organizzazione delle informazioni
viene strutturata in maniera dettagliata dai progettisti.
La suddivisione in domini predefiniti in cui l'informazione viene elaborata costituisce
uno dei primi passi di progettazione.
In un computer le informazioni non si organizzano mai da sole.

92
Negli algoritmi genetici il processo di riproduzione, selezione e mutazione delle
regole della base di conoscenza consente una prima possibilità di organizzazione
delle informazioni.
Le regole selezionate corrispondono a quelle che meglio delle altre ottimizzano una
determinata funzione di fitness.
Questa funzione di fitness che consente al sistema di evolvere è definita a priori dal
programmatore in conformità con l'obiettivo che si vuole raggiungere.
Il computer funge da supporto per tutte le funzioni di riproduzione degli individui che
costituiscono le successive generazioni di popolazioni soggette a selezione.
Effettivamente l'elaborazione conduce ad una soluzione che non è detto che sia
ottimale ma comunque abbastanza buona.
Un altro criterio di organizzazione si basa su considerazioni relative ai processi di
astrazione e costruzione di categorie.
L'interesse è concentrato sulla possibilità di costruire dei concetti astratti.
Le reti neurali sembrano mostrare i rudimenti di un simile processo.
Esse autonomamente costruiscono una suddivisione dei pattern in input in classi
separate che possono corrispondere ai concetti.
Un ulteriore tentativo di strutturazione delle informazioni utilizza semplici operazioni
di intersezione ed unione di insiemi.
Il criterio consiste nell'analisi di coincidenze e sovrapposizione tra i segni.
Tramite una funzione misura opportunamente definita sugli insiemi di informazioni si
dimostra che è possibile costruire uno spazio metrico sulla potenza dell'insieme.
Disporre di un criterio metrico su un insieme di informazioni ci consente di definire
delle relazioni topologiche tra gli elementi dell'insieme, in particolare ci consente di
stabilire un criterio di somiglianza tra due qualsiasi distinte informazioni.
É possibile utilizzare il concetto di intorno matematico per costruire le classi e i
domini con cui manipolare insiemi di informazioni.
Non ci sarebbe quindi una strutturazione predefinita ma la struttura delle
informazioni sarebbe di tipo dinamico, ovvero dipendente dai criteri utilizzati al
momento dell'utilizzo dell'informazione.
L'idea che le informazioni possano organizzarsi da sole potrebbe anche rivelarsi
completamente sbagliata.
Nella nostra esperienza è sempre l'uomo che organizza le informazioni in una
maniera comprensibile.
I messaggi lasciati a se stessi non dimostrano assolutamente di potersi organizzare
anzi mostrano in maniera evidente come sia vera la legge di crescita inevitabile
dell'entropia nell'universo.
Occorre sempre qualche processo di elaborazione specifico.
In particolare nella nostra esperienza il culmine organizzativo dell'informazione
avviene proprio nell'uomo.
Possiamo riconoscere questo principio organizzativo in tutte le forme biologiche.
Forse questa è una proprietà caratteristica dei processi vitali.
Ma anche i sistemi stellari si organizzano e mostrano una struttura definita.
Questa circostanza ci riporta a considerazioni filosofiche e metafisiche.
93
94
Conclusioni
Le considerazioni che si possono trarre da questo studio sul concetto di informazione
sulle sue possibili elaborazioni meccaniche o umane riguardano l'uomo, la sua
essenza e il suo ruolo nell'universo.
Non ci sono considerazioni conclusive o definitive ma semplicemente riflessioni sulle
implicazioni pratiche ed etiche che questo comporta sulla vita dell'uomo.
Il computer è entrato nella nostra vita con grande esuberanza.
Quasi tutti ormai ne possediamo uno e possiamo utilizzarlo potenziando le nostre
capacità pratiche di elaborazione delle informazioni.
Possiamo rapportarci al computer in maniere molto diverse, amarlo, odiarlo,
sopravalutarlo o sottovalutarlo.
Certamente esso si dimostra molto utile ai nostri scopi.
Rappresenta anche un potente strumento di controllo e verifica nelle mani della
burocrazia e del potere.
Ormai siamo tutti schedati e presto gireremo con un tesserino di riconoscimento che
ci consentirà di essere immediatamente riconosciuti in tutti gli erogatori di servizi
siano essi pubblici che privati.
Una delle caratteristiche più evidenti della mente umana consiste nella presenza di
credenze e desideri che guidano in molti aspetti importanti tutti i nostri
comportamenti. Avere uno scopo è per noi vitale.
Dotare il computer di scopi è d'altra parte estremamente pericoloso come ci ricordano
i numerosi film di fantascienza catastrofici in cui il computer si ribella al suo
creatore.
Non credo che ci sia nessuno che desideri che il computer prenda il posto dell'uomo
nel proseguo della storia dell'evoluzione.
Il progetto dell'intelligenza artificiale, ovvero quello di costruire macchine intelligenti
come l'uomo, possiede quindi una limitazione intrinseca.
A che scopo costruire un cervello vivente quando bastano dieci minuti di sesso per
ottenere lo stesso risultato.
Il problema si pone però ad un diverso livello, quello conoscitivo.
Lo scopo consiste nella conoscenza di noi stessi e nella capacità di costruire
macchine sempre più potenti al servizio dell'uomo.
Le idee e i risultati della ricerca nel campo dell'intelligenza artificiale hanno un
impatto concreto sulla concezione che ognuno ha di se stesso.
La possibilità di costruire macchine che mostrano di essere in grado di risolvere un
determinato problema cognitivo implica la disponibilità di un modello concettuale
utilizzabile da ciascuno per comprendere come potrebbero effettivamente svolgersi i
processi all'interno della propria testa.
Come fa la mente a conoscere sé stessa?

95
La risposta tradizionale è che la mente conosce sé stessa direttamente e
indubitabilmente; essa si conosce sia nella sua natura generale sia nel suo stato
presente.
La mente, è stato spesso sostenuto, è "trasparente" a sé stessa: può darsi che debba
lottare per arrivare a conoscere il mondo esterno a sé ma ha una conoscenza certa e
immediata dei vari stati mentali che costituiscono il flusso della nostra coscienza.
Le reti neurali possono avere una conoscenza automatica e certa delle proprie attività
cognitive?
Una rete neurale non ha una conoscenza automatica e diretta di niente, tanto meno
delle proprie attività cognitive.
Per una rete neurale conoscere un dominio in particolare significa aver acquisito
esperienza nel discriminare una collezione di alcune caratteristiche di quel dominio,
caratteristiche importanti e che ricorrono frequentemente, e aver acquisito una
qualche esperienza nel rispondere a esse in qualche modo.
Il che richiede a sua volta lo sviluppo di una opportuna configurazione dei pesi delle
connessioni sinaptiche, configurazione che suddivide lo spazio di attivazione
neuronale della rete in un insieme di categorie utili.
Una volta che queste categorie siano stabilite, si può dire che la rete abbia una
comprensione generale o di fondo del dominio in questione.
Una volta che essa comincia ad attivare queste categorie in situazioni appropriate, si
potrà dire che ha una conoscenza specifica delle attività che in quel dominio si
sviluppano.
Ma non c'è niente di autoevidente nella padronanza che la rete ha del dominio di cui
si occupa, quale che possa essere.
Se viene addestrata a farlo, la rete può in effetti arrivare a rappresentare alcuni dei
suoi stati e processi cognitivi, ma questo risultato non sarebbe diverso da quelli che
essa può conseguire in altri domini cognitivi.
Sarà il risultato di una procedura di apprendimento come in qualsiasi altra situazione.
Tuttavia una rete neurale potrebbe essere in grado di produrre una complessa
diagnosi medica con precisione e correttezza molto maggiore di un normale medico.
La capacità di eseguire un compito complesso e la corrispondente somiglianza di
struttura potrebbe suggerirci che anche il cervello funziona in un modo molto simile.
La rete neurale potrebbe diventare un utile modello per comprendere i processi che
avvengono nel cervello.
Avere a disposizione un modello affidabile consente ai ricercatori di indirizzare gli
esperimenti in maniera proficua e promettente.
Tuttavia la soluzione di complicati problemi computazionali si concretizza anche
utilizzando modelli e logiche differenti.
Noi conosciamo la mente da diversi punti di vista e abbiamo informazioni diverse e a
volta complementari relativamente ai meccanismi che operano attivamente quando il
cervello funziona, in particolare deduciamo il processo che deve essere avvenuto nel
cervello sulla base di diversi modelli computazionali. Anzi il modello psicoanalitico è
quello che meglio riesce ad operare in un ambito di complessità notevole quale
mostra essere il comportamento umano.
96
La pretesa del modello di rete neurale di cogliere l'essenza del funzionamento del
cervello mi appare eccessiva.
Dobbiamo conoscere ancora molte cose su come funziona la mente.
Inoltre i problemi si pongono in un contesto storico culturale vastissimo.
Le informazioni che disponiamo derivano da analisi che si pongono su piani diversi
rispetto ai metodi e agli ambiti coinvolti.
Qualsiasi spiegazione riduttiva di come funziona la mente coglie inevitabilmente solo
una parte di verità.
Questo non vuol dire che dobbiamo rimanere nell'ignoranza.
Quando nel 1962 il mondo accademico vide la pubblicazione del libro di Thomas
Kuhn la struttura delle rivoluzioni scientifiche il mondo filosofico ne fu sconvolto.
La sua asserzione, fedelmente documentata, che le passate rivoluzioni scientifiche
non fossero affatto chiare espressioni di puri e semplici fattori logici e sperimentali,
razionalmente interpretati secondo una ben definita metodologia suscitò grande
scalpore. Erano invece espressione anche di una varietà di altri fattori, molto meno
logici: sociali, psicologici, metafisici, tecnologici, estetici e personali.
La sua seconda asserzione, anch'essa ben documentata, consiste nel fatto che l'unità
della comprensione scientifica non sono le singole asserzioni, o un insieme di
asserzioni, quanto piuttosto il cosiddetto "paradigma". Un paradigma è un esempio
concreto di come si possa fare per intendere una qualsiasi cosa. É un risultato
esplicativo esemplare o prototipico al quale tutte le altre spiegazioni di un dato sono
collegate, come variazioni di un tema di fondo.
Questo modo di procedere della scienza suggerisce che essa non procede linearmente
per singoli passi in successione, ma che avvengono radicali revisioni concettuali.
Quando uno scienziato individua un paradigma nuovo di spiegazione dei fatti innesca
un complicato processo di vaglio e verifica che porta la scienza a progredire.
A volte le scoperte sono assolutamente casuali.
La varietà dell'esperienza umana è vastissima.
Che impatto può avere una scoperta scientifica sulla vita dell'uomo della strada?
Che ne può fare la società di una conoscenza scientifica?
Gli effetti possono essere devastanti.
Per questa ragione occorre essere cauti nell'estrapolare conseguenze azzardate anche
se fondate su esperimenti verificabili.
L'informazione, e la sua conseguente elaborazione, costituiscono un aspetto
fondamentale del vivere sociale, il linguaggio, suo veicolo privilegiato, rappresenta lo
strumento basilare, la massima espressione, di tutte le attività di cooperazione e
reciproca interazione degli esseri umani.
Personalmente ritengo che ognuno sia libero di spiegarsi il mondo come meglio
crede.
Le informazioni a cui attingere provengono dalle fonti più disparate.
Ma l'osservazione che siamo esseri umani e che come tali dobbiamo rapportarci al
mondo mi sembra talmente banale che chiunque dovrebbe farla propria.

97
Il fatto che non possiamo prescindere dal nostro particolare punto di vista da cui
osserviamo il mondo e la realtà dovrebbe aprire la nostra mente verso una maggiore
tolleranza rispetto a punti di vista differenti dal nostro.
La conoscenza scientifica è solo una possibilità a nostra disposizione che molti
possono accettare verificandone il metodo, ma non è l'unica.
Le nostre credenze e desideri si radicano ad un livello pre-scientifico dettato dalla
nostra particolare esperienza privata.
La possibilità che l'informazione possa viaggiare nel vuoto senza alcun supporto
materiale contiene notevoli implicazioni in molte dimensioni esplicative.
Ovviamente occorre un modello matematico in grado di descriverne le proprietà e il
comportamento, però un'analisi stringente a livello sperimentale potrebbe convalidare
questa ipotesi.
Il comportamento della materia a livello quantistico suggerisce proprio questa idea.
Per costruire un modello adeguato occorre però studiare come l'informazione viene
elaborata, e il cervello è il principale elaboratore di informazioni che conosciamo.
I modelli e le idee di spiegazione del funzionamento del cervello possono sfruttare la
tecnologia della scienza dell'informazione.
Le ambizioni dell'intelligenza artificiale sono lo stimolo per realizzare computer
sempre più potenti in grado di simulare il comportamento umano.
Lo studio sistematico del cervello dischiude però un campo di ricerca vastissimo
essendo il centro di tutte le possibilità di conoscenza umana.
Campi interdisciplinari si accavallano portando ciascuno il proprio contributo.
Il problema della coscienza, del linguaggio, dell'intuizione, del ragionamento, per non
parlare degli aspetti emotivi, sono tutti aspetti che si intersecano e che richiedono
spiegazione in un modello unitario della mente.
Ma questo non è ancora possibile, quello di cui disponiamo sono analisi settoriali e
parziali di alcuni aspetti specifici di comportamento.
Come funziona la mente ancora nessuno lo sa.
Le reti neurali costituiscono un buon modello su cui lavorare per trovare spiegazioni
convincenti di molti meccanismi cerebrali, ma il modello matematico che soggiace
alle reti neurali non è in grado di duplicare in maniera esatta il funzionamento
nemmeno di un singolo neurone.
L'analisi filosofica sull'uomo ha ancora ampi margini di manovra.
Le intuizioni di filosofi di decine di secoli fa sono ancora validi riferimenti
nonostante i grandi progressi della neuroscienza.
Siamo alle soglie di un nuovo capitolo importante sulla natura dell'uomo che
consentirà il superamento di antiche concezioni, ma i vecchi concetti di mente, corpo,
coscienza, anima e spirito, che trovano una così precisa espressione nel linguaggio,
resistono tenacemente agli attacchi della scienza moderna.
Parlando della mente non è facile non utilizzarli o definirli esattamente.
Il problema del significato si pone incessantemente in tutti gli studi sul linguaggio
presupponendone la comprensione da parte di un essere umano o di un computer.
La correlazione tra eventi nelle rispettive rappresentazioni è il presupposto da cui
partire per analizzare il senso di ogni simbolo.
98
Cosa significa dotare di senso un simbolo?
Il problema si pone a livello filosofico, ma deve essere risolto nella pratica
computazionale di programmazione del computer.
Il simbolo deve essere correttamente elaborato e ogni livello superiore di significato
accessibile al computer rappresenta un passo importante nella crescita della potenza
di elaborazione conseguita.
Le analisi filosofiche, matematiche, tecnologiche si intrecciano con i metodi
consolidati della scienza dell'informazione.
Le tecniche di rappresentazione della conoscenza utilizzate in intelligenza artificiale
costituiscono un insieme specifico di modalità con cui l'informazione può essere
rappresentata in maniera computabile da una macchina.
I principali metodi corrispondono, oltre che alle parole del linguaggio, a frame, script,
clausole logiche, regole di inferenza, rappresentazione funzionale, rappresentazione
matriciale e, non ultimi, vettori di attivazione.
I sistemi esperti costituiscono una prima forma complessa di ragionamento basato
sulla logica, essi possono trarre conclusioni sensate a partire da certe premesse.
Gli algoritmi genetici consentono la soluzione di problemi di complessità
esponenziale utilizzando la strategia presa a prestito dalla teoria dell'evoluzione.
La logica fuzzy consente di affrontare problemi in ambito di dati incerti.
Le entità virtuali rappresentano il tentativo di simulare compiutamente il
comportamento umano a livello verbale.
Ognuno di questi settori della ricerca sull'intelligenza artificiale si sviluppa in un
ampio corpo di conoscenze e risultati.
Ciascuno di essi fornisce un contributo per la conoscenza delle possibilità del calcolo
automatico e di riflesso sui possibili stati computazionali del cervello.
La mente rimane comunque il principale oggetto di indagine sulle possibilità di
elaborazione delle informazioni che in natura possono avvenire.

99