Académique Documents
Professionnel Documents
Culture Documents
125-137
Le mot de rcursif revient trs souvent sous la plume aussi bien de von
Foerster que de Maturana et Varela. Et quand on tudie lanalyse des comportements tlologiques dans larticle de Bigelow, Rosenblueth et Wiener, de
1943, on saperoit que certaines de leurs distinctions correspondent des
catgories quultrieurement von Foerster a empruntes explicitement la
thorie de la rcursion. Enfin quand on tudie les tentatives des connexionnistes pour traiter des squences de symboles tout en prservant leurs proprits
structurelles, dune part on retrouve la notion de rcurrence, et dautre part on
peut encore reprer un cho lointain des distinctions propres la thorie des
fonctions rcursives. Il ma donc sembl que ces distinctions pouvaient permettre des comparaisons utiles entre des travaux dpoques diverses, mais
dinspiration commune. Nous verrons que les cybernticiens de la premire
priode (Wiener, McCulloch, Shannon) faisaient de la rcursion sans trop le
savoir ; que ceux de la seconde (Ashby, von Foerster, puis Maturana et Varela)
en faisaient en le sachant, mais en tant insensibles la dualit daspects propre la rcursion, dualit entre son aspect de certitude et son aspect de
limitation ; et enfin que les connexionnistes nous ntudierons que les 20
premires annes du connexionnisme se situent la fois en de et en dehors
126
Pierre LIVET
des fonctions rcursives (les fonctions dfinies par composition dautres fonctions simples) tout en en proposant des approximation
Rappel de la thorie de la rcursion
Il nous faut dabord disposer de quelques repres donns par la thorie des
fonctions rcursives. On peut soutenir quelle est lie trois perspectives :
1) dterminer ce qui est calculable ; 2) engendrer des fonctions complexes
partir de fonctions simples ; 3) prsupposer linconnu pour produire du connu.
La notion de rcurrence chre Poincar, qui en faisait le moteur des mathmatiques, nous donne un lien entre la seconde perspective et la troisime. Cette
dernire perspective flirte avec le paradoxe. Elle lvite, en sappuyant sur les
fondations proposes par les tagements de la deuxime perspective, mais elle
permet dintroduire, avec la possibilit de points fixes, des procds de diagonalisation qui, si on les gnralise, nous font justement sortir du domaine du
rcursif patiemment construit selon la deuxime voie, et nous montrent ainsi
les limites de ce qui est calculable de faon dcidable.
Je nai pas besoin dexpliciter la premire perspective. Elle renvoie la
thse de Church ; toute fonction algorithmique est une fonction rcursive .
Elle nous donne par contraposition un moyen de suspecter une opration de
ntre pas algorithmique : il nous suffit de dmontrer que la fonction qui lui
correspond nest pas rcursive. Inversement, si nous avons trouv un algorithme qui calcule la fonction, nous savons quelle est rcursive. Comme la
notion dalgorithme est simplement dcrite, mais non dfinie, le passage par la
notion de fonction rcursive est notre meilleur critre si nous voulons rpondre
la question concernant la ngative.
La seconde ne pose pas davantage de problmes. La notion de fonction
rcursive recouvre des fonctions qui peuvent tre dfinies partir de fonctions
prcdemment construites. On fournit tous les pas dopration ncessaires la
production des valeurs de la fonction. On peut ensuite la dfinir en composant
dautres fonctions, et enfin on peut faire appel la rcursion elle-mme. On
partira dune valeur dfinie par stipulation pour 0, f(x,0) = une valeur donne
(qui pour laddition, par exemple, est 0, et pour lexponentiation est x). Puis
on dfinira par rcurrence f(x,n+1) comme une fonction de f(x,n). Ainsi pour
laddition, f(x,n+1) = f(x,n)+1 ; La dfinition de la fonction fait donc appel
dans le definiens la fonction dfinir (la fonction f se retrouve aussi bien
dans le definiens que dans le definiandum). Nous voyons donc dj apparatre
la troisime perspective : produire du connu partir de linconnu. Car prsupposer la fonction inconnue pour la dfinir provoque une circularit qui pourrait
tre gnante. Mais comme on sait comment amorcer lentre dans ce cercle, et
comment procder tapes par tapes, la rcurrence, loin de nous bloquer dans
un cercle, nous assure que nous pourrons toujours progresser de la mme
manire. Pour tre plus exact, la dfinition de laddition ne fait pas appel au
+ , mais seulement la fonction successeur, qui est donne comme fonction
de dpart. On se donne aussi les fonctions 0, didentit, de composition, et la
dmarche rcursive que lon vient dexemplifier. Une fonction qui peut tre
dfinie en utilisant ces procds est une fonction rcursive primitive. Si on veut
pouvoir traiter le cas de rcursions qui se font en parallle sur deux variables
(x+1 et y+1, par exemple) on passera la notion de fonction rcursive gnrale. On peut raisonner aussi sur des fonctionnelles (des fonctions de
fonctions). Si on remplace une fonction f unaire totale par une squence infinie
127
128
Pierre LIVET
129
elle correspond une fonction f(z,z,y) mais que sa ngation ne lest pas, si
bien que la proprit R nest pas rcursive. Sa ngation exige en effet que la
valeur de la fonction f(z) nappartienne pas au domaine du programme {z}. Or
dans ce cas, z, la valeur de la fonction, appartient cependant au domaine dun
programme, disons de code {e}. Mais il suffit de faire {e} = {z}, donc
dappliquer une diagonalisation, pour voir que la rcursivit de la ngation de
R conduit une contradiction, la valeur appartenant et nappartenant pas au
domaine en question.
Cependant, le thorme des quatre nous permet de trouver, connaissant
lindex (z), la fonction polynomiale pour laquelle f(X,z)=0, et dans chaque
cas, f(X,z)=R(X). Pour chaque valeur de (z) nous allons trouver une telle
fonction polynomiale fz telle que fz (X)=f(X,z). Supposons que f (z) soit la
fonction rductible une squence de nombres qui nous donne justement par
cette squence le code du programme ralisant la fonction fz. La fonction f (z)
est une fonction rcursive. Mais alors, f (z)=fz, et fz (X)=f(X,z). Or que fait
R(z) ? Elle nous dit comment fz varie avec chaque nouvelle valeur de (z).
Mais f(z) nous assure que z est le code du programme qui ralise pour une
valeur de (z) la fonction fz, laquelle permet de trouver une solution, en remontant lquation f(X,z)=0, pour notre fonction. Or cet ensemble de proprits
que nous venons dnoncer est justement celui qui satisfait, pour un z donn, la
proprit P initiale. Si donc nous prenons pour argument de P la fonction f(z)
elle-mme, en tant que squence de nombres, nous lui donnons pour argument
la fonction qui nous dit comment fz varie avec chaque nouvelle valeur de z, et
nous retrouvons ainsi R(z), si bien que R(z)=P(f(z)). Mais on a montr que
R(z) nest pas rcursive, donc P(z) ne peut pas ltre non plus1. Nous
narriverons pas pour tous les z dcider si asserter la proprit P est valide.
Autrement dit les oprations quon peut dire au sens large dauto-rfrence
ne sont pas nocives tant quelles portent simplement sur des identits entre
index du code et variable traite. Mais elles peuvent nous faire sortir des limites du calculable ds que nous les tendons pour parler de lexistence de
solutions, ou de dfinition ou non dfinition des valeurs de la fonction, bref,
ds que nous les utilisons pour traduire des proprits mta-linguistiques, ds
que lauto-rfrence devient une sorte de reprsentation des proprits opratives du langage.
La leon de ces thormes semble tre la suivante : la puissance de la rcursion est immense, puisquelle permet dexprimer certains types dautorfrence, et donc de formaliser des questions que le mathmaticien se pose sur
ses propres dmarches. Mais nous voulions une puissance qui corresponde trs
exactement ce que nous pouvons matriser. Notre matrise a cependant des
limites. Or cette puissance nous permet de les atteindre. On peut aussi proposer une version optimiste : la puissance de ce que nous pouvons matriser va
jusqu dmontrer, de faon matrise, que nous ne pouvons pas matriser
certaines proprits (cest la version de Judson Webb). Nous pouvons donc
matriser le fait de ne pas matriser certaines oprations. videmment, cela
nous permet seulement de savoir que ces oprations sont au del des limites,
pas de matriser ces oprations.
Pour tout ceci, cf. Bell et Machover, 1975, A course in mathematical logic, North Holland, p. 259,
269, 273-5, 282, 313., et Delong H., 1970, A profile of mathematical logic, Addison-Wesley Reading,
Massachusetts.
130
Pierre LIVET
Tout cela nest que rappel de choses ressasses, et il nous faut maintenant
montrer quels clairages ces distinctions peuvent jeter sur les dbats de la
cyberntique et de sa descendance.
En de de la rcursion.
La rcursion amenant raisonner sur des fonctions dont une variable au
moins est la valeur fournie par une application prcdente de la fonction, on
pense immdiatement relier la notion de rcursion et celles de rtroaction ou
de feed-back.
Or si nous revenons larticle princeps de la cyberntique, celui de
Bigelow, Rosenblueth et Wiener sur les comportements purposive (1943),
nous noterons quils faisaient une diffrence entre le comportement purposeful et celui rgul par feed-back, puis entre celui qui est rgul par feedback et enfin celui qui est rgul par anticipation. Le premier est reprsent
par les servo-mcanismes qui se bornent rorienter la trajectoire dun missile
quand arriv un certain point sa cible nest pas dans la zone reconnue. Il en
est de mme pour des robots qui se dplacent et repartent dans une autre direction quand ils ont heurt un mur. En revanche le feed-back consiste en une
rgulation en continu pendant toute lexcution du dplacement. Autrement dit,
la valeur de la sortie prcdente de la fonction, dans le comportement purposeful, nest prise en compte que de manire discrte, certaines tapes, alors
quelle est influente de manire continue, ou en tous les points du temps, dans
le feed-back. Et enfin quand on anticipe, cest quon peut changer de fonction
par rapport celle dans laquelle on est prsentement engag. On retrouve donc
ici des tapes de la construction rcursive. On va voir que von Foerster
reprendra cette ide dune fonction qui consisterait changer de fonction.
liminons cependant une difficult qui pourrait surgir. Les diffrents
auteurs que nous analyserons utilisent la fois la notion de feed-back et celle
de rcursivit, sans sappesantir sur le fait que prendre vraiment au srieux la
boucle dun feed-back interdit justement toute rcursivit. On ne peut pas
considrer comme une fonction rcursive une fonction qui serait fonction la
fois de son entre x et de sa sortie y au mme instant, si bien que x dpend de y
qui dpend de x. Pour la retrouver, il faut videmment dcaler dans le temps
les entres et les sorties, et admettre un t0 o x est donn sans que y ait encore
une influence, quil naura quau temps t+1 sur lentre x en t+1 ( supposer
que le feed-back se fasse sans dlai).
Passons maintenant larticle dAshby sur Les principes du systme autoorganis (1962)2 Il sagit en quelque sorte dun essai pour miner lavance
toute thorie de lauto-organisation qui prtende faire merger du nouveau
par des processus de rtroaction et de rentre. Il part dune machine, conue
comme une fonction. Il soutient que faire de f une fonction de ltat interne de
la machine est un non sens (p. 268). En effet, si je tente de dmultiplier la
fonction en une fonction fa quand ltat interne est a, fb quand il est b, etc.,
quand jaurais a en entre, je ne vais appliquer que fa, si b est lentre, je ne
vais appliquer que fb, etc., si bien que tout cela se rduit avoir dcoup f en
tranches, puisque f est une relation qui relie ltat a une sortie, ltat b une
autre, etc. Lauto-organisation se ramne donc changer de fonction en fonc2
Von Foerster a t lditeur du volume qui comprend ce texte, et il est suprenant de voir quil a utilis
des notions similaires non plus dans un but de rduction de lauto-organisation, mais dans un but, si lon
peut dire, de magnification.
131
132
Pierre LIVET
retrouve ainsi notre fonctionnelle qui permettait de dfinir une liste infinie de
programmes, et den changer en fonction de la variable qui calculait le numro
de code du programme. Ou encore, on retrouve le rapport entre R(z) et fz. Le
numro de code du programme est choisi en fonction de lenvironnement.
Selon von Foerster, la machine non triviale peut ainsi faire de lenvironnement
une machine triviale (une fonction de base), puisque pour tout changement
pertinent de lenvironnement elle dclenche le programme qui y correspond.
En fait, cela revient tout aussi bien faire de lenvironnement le facteur
exogne qui permet la machine non triviale de changer de fonction. Tout au
plus peut-on dire, si on voit l une application du thorme de la rcursion, que
lenvironnement est une des valeurs dentre de la fonction qui nous donne le
numro de code du programme choisir.
Sur ce point, von Foerster est curieusement moins optimiste que Kleene. Il
nous dit en effet, dans What is memory, que partir du comportement pour
retrouver la fonction est en gnral difficile (sauf si le comportement se rpte
pour des squences rptes dentres) et que retrouver les changements de
synapses qui implmentent les changements de fonctions (retrouver le f (z)) est
impossible, ce qui revient orienter son pistmologie vers la production
dartefacts au lieu de lui permettre dexpliquer le vivant. Certes, il a raison sil
entend par l soit trouver les oprations effectives qui ralisent la fonction (car
il y en a une infinit de possibles) soit trouver ce programme si la fonction
nest pas rcursive. Mais le thorme nous dit que si elle lest, et von Foerster a
commenc par le supposer, alors nous pouvons par elle trouver le numro de
code du programme. Reste bien sr le faire, et savoir comment sy prendre
le plus simple serait que ce code nous donne le programme lui-mme mais
ce nest pas impossible.
Par ailleurs von Foerster propose une diffrence entre lexprience dans le
pass, quil pense donne par lembotement des tapes de la fonction, et
lexprience prsente de cette exprience, qui serait donne par la fonctionnelle
qui pose cette fonction comme la fonction en cours. Il semble quil vise par l,
sans lexpliciter, une notion de reprsentation, et de reprsentation de la reprsentation. Et prcisment, on retrouve cette ide dune reprsentation qui na
pour contenu que sa rfrence la relation de reprsentation mme, quand dans
On constructing a reality (1973), von Foerster utilise la notion de rcursion
pour aller encore plus loin. Supposons que la cognition consiste en la computation dune ralit. On ne peut faire de computation que sur une description
de la ralit (disons, un codage). Mais une description est le rsultat dune
computation. Si bien que finalement, on aurait une boucle, la cognition se
rduisant une computation de la computation. On sait quel sort a donn Edgar
Morin ce cercle auto-absorbant dans lequel il voit sa conception de la rcursivit, mais que ses lecteurs ont quelque mal identifier clairement (La
Nature de la Mthode, Seuil, 1977).
Jusque l, von Foerster stait born donner des interprtations gnreuses
de la notion de fonction rcursive, puis de celle de fonctionnelle rcursive. Ici,
il sengage sans le dire dans le domaine dangereux des extensions mtalangagires de la diagonalisation. Comme on la vu, celle-ci consiste, par
exemple, appliquer une fonction sur une valeur qui code la fonction ellemme, ou son numro dordre dans une liste. Tant quon dispose dun langage
formel, on peut toujours relier cette ide de codage linterprtation quon
donne de cette opration dans des termes non formels, du genre : la fonction
qui opre sur elle-mme . Mais ce pronom rflchi devient bien plus dange-
133
134
Pierre LIVET
de feed-back. Mais rcursif est utilis aussi de faon plus prcise et ambitieuse. Dans le chapitre 12, Varela propose de considrer des rentres
dune forme (dans le calcul des formes propos par Spencer Brown). Il
reprend Spencer Brown lide que dun calcul des formes. Une forme a ici
pour symbole un gnomon, et on peut emboter un gnomon dans un autre, ce qui
revient une sorte de ngation de la ngation, ou bien les faire se suivre, mais
alors leur ritration revient un seul gnomon. On peut encore emboter plusieurs gnomons la suite dans un autre, etc. Or, ajoute Varela, si une forme
consiste en un embotement de symboles, abab, elle peut rentrer en ellemme si cet embotement est rpt linfini. On considrera alors que la
valeur de ab est moins dtermine que celle de abab, qui est moins dtermine que celle de ababab, etc. linfini. Si bien que la valeur dune rentre
est la limite de cette forme de rentre quand son embotement tend vers
linfini. Le problme est que ds quon admet que toute forme peut rentrer en
elle-mme, et que lon considre cette valeur limite comme le point fixe de la
rentre (puisqualors, la rentre ne modifie plus la valeur de la forme), toute
forme est elle-mme (en tant que rentrante) son propre point fixe. Ds lors la
distinction entre le dcidable et lindcidable nest plus si tranche, puisque les
deux sont des points fixes, le dcidable tant le point fixe du prdicat dmontrable et lindcidable le point fixe du prdicat non dmontrable . La
thorie de la rcursion tait sous estime par la premire et la seconde cyberntique, mais ces troisimes cybernticiens font un saut au del delle.
Quen est-il enfin des connexionnistes ? On sait quils achoppent sur le
problme dapprendre un rseau traiter des structures symboliques en
conservant leurs proprits structurelles. Le rseau associe, mais il mlange, et
perd ainsi la trace des diffrences structurelles. Plusieurs dispositifs avaient t
imagins dans les annes 90-95 pour permettre aux rseaux de retrouver par
dcomposition ce quils avaient commenc par composer. En particulier avait
t propose la notion de mmoire auto-associative rcursive. Elle consistait
partir dune couche dinputs, les compresser dans une couche dunits
caches, puis les dcompresser dans une couche de sortie. Lalgorithme de
rtropropagation consistant rpercuter les corrections derreur de la couche
de sortie sur la couche cache, on apprenait ainsi cette couche cache oprer des compressions qui puissent redonner la forme dcompresse, conservant
ainsi sa structure.
On a ensuite perfectionn la procdure, dabord en introduisant des boucles
de rcurrence dans un tel rseau. Soit la couche dunits caches renvoie ses
tats vers une partie des units inputs, soit cest la couche de sortie qui opre le
mme renvoi. Le but dune telle rcurrence est bien entendu de faire dpendre
lopration en cours du rsultat de lopration prcdente (on retrouve notre
embotement rcursif la von Foerster). Mais il est aussi et surtout de tenir
compte des effets de contexte entre les symboles donns en inputs, cest--dire
des relations pertinentes entre tel symbole qui apparat sur la fentre de traitement de ce que le rseau prend comme entre, et tel symbole voisin, mais hors
de la fentre de traitement, et qui ne sera pris en compte que dans ltape suivante, alors que le premier symbole ne figurera plus dans la fentre dentre.
Puis on a mis en loeuvre lide suivante. Analysons par des mthodes statistiques les distinctions actives dans les units caches. Construisons partir
de cette analyse les graphes dautomates tats finis. Plus lanalyse (par
clusters) sera fine, plus le graphe sera complexe. Puis nous faisons tourner ces
automates tats finis sur les nouveaux exemples traiter. Ou encore, nous
135
pouvons extraire les rgles propres ces automates tats finis, et les encoder
de faon approximative dans le rseau (en abaissant systmatiquement certains
poids de connexions, et en en remontant systmatiquement certains autres, ce
de manire compatible avec le traitement de telle entre par lautomate). Les
performances sont meilleures quavant dans les deux cas.
Quen tait-il de ces manoeuvres par rapport la thorie de la rcursion ?
Certes, comme lont montr Bochereau, Bourgine et Deffuant, il suffit de
mettre en sortie dun rseau une fonction de dcision qui envoie le rsultat soit
sur 1 soit sur 0 pour avoir transform le rseau en un classifieur, qui est une
machine logique. On a ainsi une quivalence entre rseau et machine logique.
Le problme, cest quon ne sait pas quelle est la machine logique dont le
rseau est lmulation. Or cest ncessaire de le savoir, pour sassurer si cest
bien une fonction rcursive, et non pas seulement rcursivement numrable, et
pouvoir appliquer le thorme de la rcursion. Mais, comme le rappellent les
mmes auteurs, le problme de lextraction des rgles (le problme que traitent
de manire approche ceux qui extraient des automates tats finis des
rseaux) est NP-complet - il nexiste pas dalgorithmes qui puisse rsoudre ce
genre de problme en un temps born par un polynme de degr donn. Sans
doute, on sait que les rseaux couches (ou mme forme buissonnante )
approximent des fonctions qui ne prsentent pas des ruptures de pentes trop
importantes (les fonctions lipzitschiennes ). Mais justement ils nen sont
que des approximations. Hornik a montr que si la fonction dactivation du
rseau est continue, borne et non constante, la distance entre les valeurs de la
fonction calcule par le rseau et les valeurs de la fonction relle peut tre
rendue arbitrairement petite si on peut toujours ajouter de nouvelles units
caches au rseau3 . Mais pour cela, il faut que les fonctions dactivation soient
non polynomiales4. La stratgie dextraction des automates se heurte aussi
un problme : la performance relle (en fait virtuelle, sur dautres bases
dexemples) nest celle des automates tats finis qu la limite, et elle comprend celle de tous les automates, en incluant ceux qui ont des rsultats
inconsistants avec la base dapprentissage, cest--dire qui ne donnent pas les
sorties souhaites. Bien entendu, on va se restreindre aux automates consistants
avec les sorties souhaites, et mme on va prfrer le plus petit de ces automates. Mais cest l une dcision pragmatique, dont on ne connat pas les effets.
Au total, on ne peut pas dire si un rseau calcule telle fonction. Il
lapproche. videmment cela implique (comme en principe les variations des
poids des connexions peuvent tre continues) quil existe une infinit de
rseaux qui approchent cette fonction (mais certains deux pourraient aussi tre
dits en approcher dautres). Or une fonction approche , dans sa singularit,
nest justement pas, en gnral, une fonction rcursive. A fortiori, on ne peut
rien dire de la squence de fonctions ou de la fonctionnelle que pourrait approcher un rseau sous diffrents apprentissages, sous diffrentes volutions. Les
rseaux connexionnistes vont donc au del des fonctions rcursives, alors
mme quils sont aussi en de, puisquils ne garantissent jamais totalement le
respect de la structuration des symboles ncessaire la rcursivit.
136
Pierre LIVET
Yves-Marie Visetti a cependant fait remarquer que le but des connexionnistes, pas plus que ne ltait celui de von Foerster, nest de garantir que les
rseaux retrouveront des fonctions que nous pouvons identifier par dautres
moyens, ni de servir eux-mmes comme moyens pour identifier des classes de
fonctions (celles quils permettent dapprocher et les autres, celles que les
rseaux trois couches et sans rcurrence permettent dapprocher, celles que
les rseaux trois couches et avec rcurrence approximent, etc.). Le but des
connexionnistes est simplement de produire de la complexit, donc de ne pas
se borner des fonctions qui dcrivent un espace born, mais de dplacer les
bornes tout en dveloppant la fonction, pour dcouvrir de nouveaux espaces.
De mme von Foerster navait pas pour ambition ni pour souci de relier les
comportements de ses fonctions rcursives une thorie de la rcursion qui
permettait de savoir davance dans quel espace de fonctions il se dplaait,
mais il voulait tout simplement produire des comportements complexes.
Cest bien une tendance du connexionnisme, mais il ne pourra devenir autre
chose quune technique de simulation de la complexit que si lon peut utiliser
les rseaux pour mettre lpreuve des classifications mathmatiques, donc si
on se repose la question de savoir quelle classe de fonctions tel type de rseau
peut approximer (et non pas vraiment calculer). Bien des travaux vont depuis
10 ans dans ce sens, mais bien dautres se bornent simplement combiner des
rseaux avec diverses formes de systmes symboliques, de manire pallier les
difficults de stabilit catgorielle des rseaux.
Finalement, les premiers cybernticiens aussi bien que leurs descendants
successifs ont toujours tourn autour de la thorie de la rcursion, que ce soit
en de ou au del, tout en tant toujours en dphasage avec elle. Il devient
maintenant ncessaire de ne plus dsigner la complexit comme un horizon ou
comme des lendemains qui chantent. Nous ne pouvons pas ltudier directement, puisquelle se dfinit par ce qui chappe une analyse effective. Mais les
travaux danalyse des outils artificiels comme les systmes connexionnistes ont
pour but de relier certaines formes complexes des catgorisations mathmatiques, pour nous donner des repres dexploration de ce domaine que nous
savons ne pas pouvoir puiser.
Rfrences
Ashby, W.R. (1962). Principles of the self-organizing system. in H. von Foerster et
G.W. Zopf (eds.), Principles of self-organization. Pergamon Press: 255-278.
Bell J. L. et Machover M., 1975, A course in mathematical logic, Amsterdam, New
York, North Holland : 259, 269, 273-5, 282, 313.
Bochereau, L., Bourgine, P., Defuant, G. (1991). quivalence entre classificateurs
connexionnistes et classificateurs logiques. Intellectica, 1991/2, 12 : 139-158.
Elman, J.L. (1991). Distributed representations, simple recurrent networks, and
grammatical structure. Machine Learning, 7: 195-225.
Giles C. Lee, Omlin Christian. W. (1993). Extraction, Insertion and Refinement of
Symbolic rules in dynamically driven recurrent neural networks , Connection
Science, Vol. 5, n 3 et 4 : 307-334.
Hornik Kurt, 1991, Approximation Capabilites of Multilayer Feedforward
Networks , Neural Network, vol 4 : 251-257.
Hornik Kurt Some new results on Neural network Approximation , in Neural
Networks, Vol. 6, pp. 1069-1072, 1993, p. 1070.
Kwasny, Stan C., Kalman Barry L. (1995). Tail-recursive Distributed representations
and Simple recurrent networks. Connection Science, vol 7, n1: 61-80.
Pollack, J. (1990). Recursive distributed representations. Artificial Intelligence, 46: 77105.
137
Rosenblueth Arturo, Wiener Norbert, Bigelow Julian, (1943). Behavior, Purpose and
Teleology. Philosophy of science, vol. 10, January: 18-24.
Varela, Francisco (1979). Principles of biological organization. Amsterdam, New
York: North Holland.
von Foerster, Heinz (1969). What is memory that it may have hindsight and foresight
as well. The Future of brain sciences, Bogoch ed, Plenum Press: 19-64
von Foerster, Heinz (1970). Molecular ethology, an immodest proposal for semantic
clarification. in Molecular mechanism in memory and learning, G. Hungar ed.,
Plenum Press: 213-248,
von Foerster, Heinz (1973). On constructing a reality. in Environmental design
research, vol. 2., F.E. Preiser ed. Dowden, Hutchinson and Ross, Strousburg : 3546.
Webb, Judson C., Mechanism, Mentalism, and Metamathematics: an essay on Finitism,
Reidel, Dordrechte, 1980.