Connexionisme

El connexionisme és una teoria sobre l’arquitectura cognitiva—la manera d’entendre l’estructura i el funcionament dels sistemes cognitius—que va aparéixer en els anys 80. En certa manera, el connexionisme va suposar un desafiament per a la teoria dominant en les ciències cognitives i per a la intel·ligència artificial de l’època i va oferir noves eines per a entendre la forma en la qual els processos cognitius (p. ex., percepció, atenció, memòria, llenguatge) poden estar implementats o poden emergir de sistemes neuronals.

Els debats propiciats per l’aparició del connexionisme continuen vigents en la ciència cognitiva contemporània i en la seua filosofia. A més, la investigació més capdavantera en models de xarxes neuronals manté la seua inspiració en propostes connexionistes i comparteix molts dels seus principis bàsics. El connexionisme és, per tant, una teoria que ajuda a comprendre tant el desenvolupament històric de les ciències cognitives com el seu estat actual.

1. Breu Història

Des de la revolució cognitiva a la fi dels anys cinquanta (Miller, 2003), tant les ciències cognitives com la investigació en intel·ligència artificial han estat dominades per un paradigma basat en principis representacionalistes i computacionals que ha estat anomenat cognitivisme (Garnham, 2009). El cognitivisme es fonamenta en la metàfora computacional: el sistema ment-cervell és una computadora. Més concretament, la ment és el programari (software) que funciona sobre el maquinari (hardware) cerebral (Thagard, 2005).

Entre altres factors, el cognitivisme va trobar el seu èxit gràcies al fet que la metàfora computacional permetia l’estudi de la ment des de coordenades purament físiques. Els estats mentals, restringits abans a l’esfera privada que no era accessible des dels mètodes de la ciència contemporània, podien ara ser entesos com a estats d’un sistema computacional mitjançant l’ús d’eines formals (Anderson, 1983, 2007; Newell, 1990; Russell i Norvig, 2003). A més, la metàfora computacional resolia el problema ment-cervell: els estats mentals són estats semàntics que es processen en termes purament sintàctics (formals) en els mecanismes cerebrals. D’aquesta manera, així com no hi ha problemes per a reconciliar programari i maquinari en una computadora, tampoc no n’hi ha per a reconciliar ment i cervell.

El cognitivisme enfrontava i enfronta seriosos problemes tant teòrics com empírics (McCarthy i Hayes, 1969; Searle, 1980). Tanmateix, prompte es va convertir en el paradigma dominant en les ciències cognitives. Una de les conseqüències d’aquest fet és que els detalls d’implementació dels processos cognitius van quedar relativament relegats en la investigació cognitiva. Les computadores es poden entendre com a sistemes formals que poden implementar-se físicament de formes molt diverses. De la mateixa manera, si el sistema ment-cervell és una computadora, pot ser estudiat en termes formals i el fet que la seua implementació siga una complexa xarxa neuronal no és, en principi, central per a l’explicació—la idea general després d’aquesta afirmació s’ha anomenat realització múltiple en alguns cercles filosòfics (Polger i Shapiro, 2016): si la metàfora computacional típica del cognitivisme és certa, aleshores la ment és múltiplement realitzable i això comporta que la implementació dels estats mentals no és central per a l’explicació de la naturalesa d’aquests estats. En altres paraules, les computadores són independents del seu mitjà d’implementació i, per tant, el sistema ment-cervell també ho és.

Malgrat la poca atenció que el cognitivisme, en general, para a la implementació dels estats cognitius, aquesta no ha estat l’actitud general al llarg de la història de la psicologia i de les ciències cognitives. Ja des dels anys quaranta, arquitectures que, fins a cert punt, imitaven l’estructura de xarxa del cervell es van començar a desenvolupar—per exemple, les xicotetes xarxes desenvolupades per McCulloch i Pitts (1943) o el pandemònium (Selfridge, 1959). Tanmateix, en ple domini cognitivista, no és fins als anys huitanta que idees sobre la rellevància de la implementació dels processos cognitius tornen a la palestra, a través, per exemple, dels models de memòria associativa en paral·lel (Hinton i Anderson, 1981) o el mateix connexionisme (Rumelhart i McClelland, 1986). Aquests models buscaven desenvolupar arquitectures cognitives inspirades en xarxes neuronals biològiques que pogueren donar compte de diversos processos cognitius. En aquest sentit, es van convertir en desafiaments i fins i tot alternatives al cognitivisme mentre perseguien l’explicació dels mateixos fenòmens des d’assumpcions teòriques diferents en allò que té a veure amb la seua implementació o amb les nocions de computació i representació, per exemple. De totes aquestes, el connexionisme és la més rica i complexa. I, sens dubte, la que ha tingut una major influència en la ciència cognitiva.

2. Principis bàsics

L’element fonamental per a entendre el lloc del connexionisme en la ciència cognitiva, així com els seus principis bàsics, és que és una arquitectura cognitiva que, com el cognitivisme, és computacional. Les xarxes connexionistes estan vagament inspirades en les xarxes neuronals dels cervells biològics. En les xarxes connexionistes, les unitats que imiten les neurones implementen algun tipus de funció computacional. Així, aquestes xarxes es poden entendre com un sistema computacional en paral·lel, és a dir, en el qual les unitats de computació actuen simultàniament.

Amb aquesta idea en ment, les xarxes connexionistes són models computacionals que es basen d’una forma abstracta en allò que sabem sobre el cervell i les xarxes neuronals que el constitueixen. Es creu que el cervell humà conté entre 1010 i 1011 neurones i cadascuna d’aquestes pot arribar a tindre 105 connexions amb altres neurones. Aquestes connexions poden ser excitadores, les que fomenten l’activitat d’altres neurones, o inhibidores, les que frenen l’activitat d’altres neurones o la bloquegen. A més, l’aprenentatge de noves habilitats i continguts es basa en la modificació d’aquestes connexions, usualment entesa com el reforç o la debilitació de les seues sinapsis.

Donats aquests fets sobre el cervell humà, les xarxes connexionistes consisteixen en un nombre d’elements simples, anomenats unitats o nodes, que actuen de manera similar a les neurones biològiques i que estan connectats a través d’unes connexions que els permeten transmetre senyals simples. Aquestes connexions, que pretenen ser anàlogues a les sinapsis i que poden ser tant excitadores com inhibidores, tenen un pes que determina la forma en la qual el node connectat a un dels seus extrems pot influenciar el node connectat en l’altre extrem. Els nodes (o unitats) estan normalment organitzats en capes. Una capa d’entrada, que porta la informació de l’exterior al sistema, una capa d’eixida que retorna el resultat del processament de la informació i una o diverses capes amagades (que no estan sempre presents en les xarxes connexionistes), que se situen entre les capes d’entrada i d’eixida i que no tenen contacte amb l’entorn del sistema (Figura 1). En els models més bàsics de xarxes connexionistes, les capes es connecten unidireccionalment i les connexions van de la capa d’entrada a la d’eixida passant per la capa amagada. En altres models mes avançats, que inclouen retroalimentació, per exemple, les connexions entre nodes poden ser cícliques o d’un altre tipus.

Figura 1. Exemple de xarxa connexionista de tres capes (entrada, amagada i eixida). Els nodes i les connexions, juntament amb la direcció de processament, estan indicats.

En general, els nodes i les connexions en xarxes connexionistes tenen habilitats molt limitades. A través de les seues connexions d’eixida, els nodes solament transmeten valors números que són una funció dels valors numèrics que reben a través de les seues connexions d’entrada (o que reben de l’entorn, en el cas dels nodes de la capa d’entrada). Usualment, cada node pren un grup de valors d’entrada i els transforma, mitjançant un procés computacional, en un únic valor d’eixida que és transmés als nodes de la següent capa. Aquestes transformacions estan normalment limitades a operacions matemàtiques molt simples, com diversos tipus de suma (per a una explicació tècnica dels aspectes bàsics de les xarxes connexionistes, vegeu Rumelhart i McClelland, 1986: p. 45 i següents).

3. Com funciona una xarxa connexionista?

Tenint en compte que tant nodes com connexions tenen un funcionament simple i limitat, la pregunta és: Què fan les xarxes connexionistes per a aconseguir dur a terme processos complexos? La resposta ja ha sigut anticipada: processament paral·lel. Els processos computacionals duts a terme per la xarxa connexionista transcorren en paral·lel al llarg dels nodes en lloc d’ocórrer en sèrie, com és el cas en la computació tradicional. En aquest sentit, els nodes mateixos, com a unitats computacionals, no són individualment responsables de solucionar un problema, sinó que el solucionen de manera col·lectiva.

De manera general, la informació que arriba a la xarxa connexionista és distribuïda per tota la xarxa. En aquest sentit, les xarxes connexionistes instancien allò que es pot anomenar representacions distribuïdes: patrons d’activació simultània de tots els nodes de la xarxa. Així, per exemple, un patró d’activació en particular a través dels 15 nodes de la xarxa connexionista de la Figura 1 pot ser la representació de “zebra”, mentre que un altre patró d’activació a través dels mateixos nodes pot ser la representació de “girafa”. Per tant, una xarxa connexionista podria ser capaç de produir la paraula “zebra”, quan la informació d’entrada fora una fotografia d’una zebra, i aconseguir el patró d’activació de “zebra” en els seus nodes i, de la mateixa forma, produir la paraula “girafa”, quan la informació d’entrada fora la fotografia d’una girafa, i aconseguir el patró d’activació de “girafa” en els seus nodes. Aquest exemple ens porta als dos aspectes fonamentals del funcionament d’una xarxa connexionista: l’activació dels nodes i l’algorisme de retropropagació.

3.1 L’activació dels nodes

Els nodes en una xarxa connexionista implementen una funció de transferència que determina la forma en la qual el valor de cada node s’actualitza en funció de la informació d’entrada que rep des de l’entorn (en el cas dels nodes de la capa d’entrada) o des dels nodes d’una altra capa (en el cas dels nodes de la capa amagada i de la d’eixida). Normalment, la funció de transferència tracta computacionalment la informació que rep i l’aplica a una funció d’activació que és la que determina el valor d’eixida que lliurarà a la següent capa de la xarxa (Figura 2).

Figura 2. Diagrama d’un node o unitat d’una xarxa connexionista. (A) Diagrama d’un node o unitat amb tots els seus components. Les entrades al node (E) que són resultat de la informació entrant des de l’entorn en el cas de la capa d’entrada i de les activacions dels nodes de les capes prèvies en el cas de la capa amagada i la capa d’eixida. (B) Exemples de diferents funcions d’activació: llindar, lineal, gaussiana i sigmoide. La diferència entre aquestes és que el canvi en les entrades (eix X de les gràfiques) afecta de manera diferent l’activació d’eixida del node. Per exemple, en l’activació lineal, els primers valors d’activació d’entrada no canvien l’activació d’eixida. Després, hi ha un grup de valors que incrementen l’activació d’eixida de manera lineal. Al final, el grup de valors alts d’activacions d’entrada torna a no provocar canvis en l’activació d’eixida del node.

Un tipus de processament habitual en la funció de transferència d’un node donat és la multiplicació de les activacions que rep des dels nodes de la capa prèvia pels pesos de les connexions per les quals aqueixes activacions arriben (aquest procés és a vegades referit com a funció d’entrada de xarxa), per a després sumar els resultats d’aqueixes multiplicacions i enviar-les a la funció d’activació (Figura 2A). La funció d’activació, aleshores, aplica algun tipus de computació a aqueixa entrada, i d’aqueixa computació depén el perfil d’activació del node (Figura 2B). Per exemple, la funció d’activació pot requerir un nivell d’entrada mínim per a provocar aleshores un augment sobtat en l’activació del node i així enviar aqueixa activació cap a la següent capa de la xarxa. Aquesta funció d’activació es pot entendre com un llindar d’activació. En altres nodes, la funció d’activació pot simplement requerir un valor específic d’entrada per a provocar la màxima activació del node i enviar-la cap a la següent capa de la xarxa. Aquesta funció d’activació es pot entendre com una activació gaussiana.

3.2 L’algorisme de retropropagació

En les xarxes connexionistes, l’activació de qualsevol node depén de les activacions d’entrada que rep des de les capes prèvies o des de l’entorn de la xarxa. Les funcions de transferència dels nodes—que comprenen la funció d’entrada de xarxa i la funció d’activació—solen ser fixes i no canvien durant el funcionament de la xarxa. Tanmateix, les connexions entre nodes sí que poden canviar el seu pes i, per tant, influir en la informació que arriba als nodes. En aquest sentit, la clau de l’evolució i l’aprenentatge en les xarxes connexionistes té a veure amb els canvis que es produeixen en els pesos de les connexions entre nodes. La forma en la qual aquests canvis es produeixen sol estar basada en algorismes de retropropagació.

El primer algorisme de retropropagació (backpropagation en anglés) en el context de xarxes connexionistes va ser introduït per Rumelhart, Hinton i Williams (1986). Diferents mètodes de retropropagació es desenvolupaven des dels anys seixanta (Bryson, 1961; Kelley, 1960). Entre aquests, el conegut com a regla delta va guanyar rellevància i, a meitat dels anys huitanta, els esmentats fundadors del connexionisme van generalitzar la regla delta per al seu propi model de xarxa connexionista. Fonamentalment, allò que la regla delta i els algorismes de retroprogramació duen a terme és un canvi dels pesos de les connexions entre els nodes usant com a referència la diferència entre els resultats de les operacions de la xarxa i els resultats esperats si la xarxa tinguera un comportament reeixit. La regla delta simple usa una taxa d’error basada en aquesta diferència per a dur a terme els canvis en els pesos de les connexions entre nodes. Per part seua, la regla delta generalitzada du a terme un procés similar, però té en compte les contribucions dels nodes a l’error total i la forma en la qual tal error es distribueix a través de les diferents capes de la xarxa. En aquest sentit, el senyal d’error es retropropaga a través de les capes de la xarxa i guia les modificacions dels pesos de les seues connexions.

Els principis bàsics de la regla delta i de la seua generalització com a algorisme de retropropagació són el reforç sinàptic i l’aprenentatge supervisat. D’una banda, Donald Hebb (1949) va demostrar que les connexions sinàptiques entre neurones en cervells biològics es reforcen quan les neurones connectades estan actives simultàniament. Es creu que aquest fenomen és un dels mecanismes fonamentals de l’aprenentatge i, en aquest sentit, inspira la idea del canvi de pesos de les connexions entre nodes de les xarxes connexionistes com a fonament dels processos d’aprenentatge que s’hi donen. D’altra banda, l’aprenentatge supervisat és una forma bàsica d’aprenentatge tant en humans com en animals. Mares i pares corregeixen les seues filles i els seus fills, professores i professors a les seues alumnes i als seus alumnes, etc. Quan un aprenent comet un error, qui s’encarrega de la supervisió fa aqueix error explícit i intenta provocar un canvi en l’aprenent perquè l’error no es produïsca i la tasca siga reeixida. En els algorismes de retropropagació, la taxa d’error calculada en comparar els resultats obtinguts als resultats esperats en l’activitat de la xarxa connexionista, compleix el paper de supervisió en el seu procés d’aprenentatge. En aquest sentit, el funcionament de les xarxes connexionistes, tant al nivell nodes i connexions individuals com a nivell general en termes d’activitat i aprenentatge, està inspirat en aspectes coneguts dels sistemes cognitius biològics.

4. Alguns problemes del connexionisme

La viabilitat del connexionisme com a paradigma per al desenvolupament de la intel·ligència artificial i, en general, com a paradigma de les ciències cognitives ha estat posada en qüestió des de diverses perspectives. D’una banda, el fet que el connexionisme pose en joc la idea de representacions distribuïdes—o, fins i tot, l’eliminació del concepte de representació (Churchland, 1989)—ha estat vist com un problema per a donar compte d’un dels aspectes essencials de la psicologia popular: la idea que estats mentals funcionalment discrets i semànticament interpretables tenen poders causals (Ramsey, Stich i Garon, 1990). La funcionalitat d’una xarxa connexionista està basada en la distribució dels pesos de les connexions entre els seus nodes de tal manera que una sola distribució pot fer que la xarxa exhibisca la funcionalitat desitjada (p. ex., categorització o aprenentatge del temps passat). En aquest sentit, els estats de les xarxes connexionistes no són funcionalment discrets ni semànticament interpretables, amb la qual cosa una de les intuïcions fonamentals de la psicologia popular és abandonada.

D’altra banda, i sobretot en les albors del connexionisme com a paradigma, les xarxes connexionistes van ser posades en qüestió sobre la base de consideracions biològiques. En particular, la plausibilitat biològica de les xarxes connexionistes va ser altament qüestionada. En aquestes xarxes, els nodes tenien un comportament similar, les capes de nodes eren capes discretes, i el flux d’informació era unidireccional, per exemple. Cap d’aquestes tres característiques dona compte de les propietats anatòmiques i funcionals dels cervells. Per tant, les xarxes connexionistes eren considerades poc realistes. Aquest fet, entre d’altres, va ser el que va portar a l’evolució de les diverses generacions de xarxes connexionistes que han sorgit en les ultimes dècades i que s’acosten més a una situació de realisme biològic.

Més enllà de qüestions de compatibilitat amb la psicologia popular o amb la biologia cerebral, el gran repte teòric que el connexionisme ha hagut d’enfrontar és el repte de la sistematicitat proposat per Jerry Fodor i Zenon Pylyshyn (1988). El repte de la sistematicitat s’emmarca en el debat entre connexionisme i cognitivisme. El connexionisme es presenta com una alternativa al cognitivisme i, per això, ha de donar compte dels mateixos fenòmens. O, almenys, aquesta és la idea d’alguns defensors del cognitivisme, com ho eren Fodor i Pylyshyn. Per a ells, les xarxes connexionistes no poden donar compte del pensament humà perquè el pensament humà és sistemàtic i les xarxes connexionistes no ho són. I, més encara, si les xarxes connexionistes pogueren donar compte de la sistematicitat del pensament humà, es convertirien en mers models d’implementació del cognitivisme.

La sistematicitat es fonamenta en una altra propietat: la composicionalitat. Un sistema és composicional quan està constituït per elements atòmics que poden combinar-se seguint unes determinades regles. Per exemple, la llengua catalana és composicional. La frase “Joan estima Lola” aquesta constituïda per tres parts: “Joan”, “estima”, i “Lola”. I el significat de la frase depén de les parts que la componen i la sintaxi del català. Alguns sistemes composicionals són també sistemàtics, és a dir, són capaços de produir qualsevol combinació legal dels àtoms que els constitueixen. De nou, el llenguatge català és sistemàtic: igual que pot produir “Joan estima Lola”, pot produir “Lola estima Joan”.

D’acord amb Fodor i Pylyshyn, el pensament humà és composicional i sistemàtic: està constituït per representacions/conceptes i és capaç de produir qualsevol combinació legal d’aquests. Tanmateix, les xarxes connexionistes no són sistemàtiques perquè no són composicionals. Les representacions distribuïdes típiques de les xarxes connexionistes no són atòmiques: la representació “Lola estima Joan” consisteix en un patró específic d’activacions de totes les unitats de la xarxa. Aquesta representació no pot canviar a “Joan estima Lola” sense canviar el patró d’activació de tota la xarxa. En aquest sentit, no hi ha elements atòmics que constituïsquen el sistema composicional, per la qual cosa les xarxes connexionistes no són composicionals. I en no ser composicionals, no poden ser sistemàtiques.

Els defensors del connexionisme han respost al repte de la sistematicitat de molt diverses maneres (Calvo i Symons, 2014). D’una banda, n’hi ha que han intentat argumentar que les xarxes connexionistes poden ser sistemàtiques. Per exemple, Smolensky (1987, 1988) defensa que la sistematicitat es pot basar en una noció de composicionalitat feble en la qual els estats d’una xarxa connexionista es poden entendre com a vectors definits per les matrius dels pesos de les connexions de la xarxa i els components d’aqueixos estats (p. ex., “Joan” en “Joan estima Lola”) com els vectors individuals que componen el vector de la xarxa. Aquests vectors es poden combinar seguint certes normes i depenent del context. En aquest sentit, la combinació de vectors individuals dona compte de la composicionalitat sense necessitat d’apel·lar a estats funcionalment discrets i, per tant, les xarxes connexionistes poden ser sistemàtiques.

D’altra banda, n’hi ha que argumenten que el pensament humà no és sistemàtic i que, per tant, les xarxes connexionistes no necessiten ser-ho. Aquest és el cas de Chemero (2014), que analitza la noció de sistematicitat usada per Fodor i Pylyshyn i que conclou que no hi ha suport empíric per a aquesta després d’un recorregut pels usos de la paraula “sistematicitat” en les ciències cognitives. En aquest sentit, el repte de la sistematicitat és un argument hegelià: un argument basat en pura especulació, però sense suport en la ciència cognitiva. Chemero (2009) considera que els arguments hegelians són poc convincents, la qual cosa va en contra del repte de la sistematicitat. Malgrat això, és un fet constatable que el repte de la sistematicitat continua vigent en les disputes teòriques respecte al connexionisme.

5. Connexionisme hui

Les xarxes connexionistes han sigut aplicades a tasques cognitives molt diverses, tals com tasques lingüístiques, de percepció, o de presa de decisions. Amb el seu èxit, el connexionisme ha demostrat que certes assumpcions del cognitivisme no són necessàries per a comprendre i explicar la forma en la qual els sistemes cognitius funcionen—per exemple, les xarxes connexionistes no necessiten una descripció formal o regles explícites de processament computacional. Aquest fet diferenciador ha provocat un ampli desenvolupament del paradigma connexionista des que va aparéixer en els anys huitanta i, hui dia, podem parlar d’una segona, una tercera, i fins i tot una quarta generació del connexionisme (les generacions són també conegudes com a “onades del connexionisme”).

Un important exemple de les xarxes connexionistes de segona generació és el predictor d’oracions d’Elman (1990). La major novetat d’aquest predictor de segona generació respecte a les xarxes connexionistes de primera generació és que està basat en una xarxa recurrent. Les xarxes recurrents es distingeixen per incloure una capa de nodes de context que actuen com una forma de memòria (Figura 3). Normalment, la capa de context copia els estats de la capa amagada i els reintrodueix en aqueixa capa en el següent cicle d’activació. En aquest sentit, les xarxes recurrents exploten les propietats temporals de l’activitat de les xarxes connexionistes per a així proporcionar a la xarxa major capacitat de processament.

Figura 3. Exemple de xarxa connexionista recurrent. És una xarxa connexionista estàndard a la qual s’afig una capa extra, o capa de context. La capa amagada es copia en cada cicle (fletxes discontínues blaves). En el següent cicle la capa de context és, juntament amb la capa d’entrada, la que alimenta a la capa amagada.

La tercera generació de connexionisme, el connexionisme dinàmic (McClelland et al., 2010), introdueix en les xarxes connexionistes algunes característiques que augmenten la seua plausibilitat biològica; per exemple, permetent diferències entre els nodes per a usar-ne alguns amb propòsits especials, i inclou una connectivitat més complexa, retards, processament en temps continu, entrades analògiques, soroll, etc. I la quarta generació, encara més actual, és la que introdueix principis del processament predictiu (Friston, 2010) en l’arquitectura connexionista, permetent el processament bidireccional basat en probabilitat bayesiana. En aquestes xarxes, l’aprenentatge s’aconsegueix mitjançant la combinació de fluxos informatius bidireccionals—això és, de la capa d’entrada a la d’eixida i viceversa.

El connexionisme, per tant, continua sent un paradigma rellevant dins de les ciències cognitives i continua proposant alternatives als models clàssics tant en psicologia i neurociència cognitiva com en intel·ligència artificial. A més, cal esperar que l’avenç en el coneixement dels sistemes neuronals biològics repercutisca en els models connexionistes i que aquests siguen cada vegada més refinats i puguen continuar contribuint a l’avanç del coneixement dels processos cognitius.

Vicente Raja
(Rotman Institute of Philosophy, Western University)

Traducció: Marisa Serra
Revisió tècnica: Marc Artiga

Referències

  • Anderson, J. R. (1983) The Architecture of Cognition, Cambridge (Mass.), Harvard University Press.
  • ———— (2007) How Can the Human Mind Occur in the Physical Universe? Oxford, Oxford University Press.
  • Bryson, A. E. (1961) “A gradient method for optimizing multi-stage allocation processes”, en Proceedings of the Harvard University Symposium on Digital Computers and their Applications, Cambridge (Mass.), Harvard University.
  • Calvo, P. i Symons, J. (2014) The Architecture of Cognition, Cambridge (Mass.), MIT Press.
  • Chemero, A. (2009) Radical Embodied Cognitive Science, Cambridge (Mass.), MIT Press.
  • ———— (2014) “Systematicity and interaction dominance”, en P. Calvo i J. Symons (editors), The Architecture of Cognition, 353-369, Cambridge (Mass.), MIT Press.
  • Churchland, P. M. (1989) A Neurocomputational Perspective: The Nature of Mind and the Structure of Science, Cambridge (Mass.), MIT Press.
  • Elman, J. (1990) “Finding structure in time”, Cognitive Science, 14: 179-211.
  • Fodor, J. i Pylyshyn, Z. (1988) “Connectionism and cognitive architecture: A critical analysis”, Cognition, 28: 3-71.
  • Friston, K. (2010) “The free-energy principle: A unified brain theory?”, Nature Reviews Neuroscience, 11(2): 127-138.
  • Garnham, A. (2009) “Cognitivism”, en J. Symons i P. Calvo (editors), The Routledge Companion to Philosophy of Psychology, 99-110, Nova York, Routledge.
  • Hebb, D.O. (1949) The Organization of Behavior, Nova York, Wiley.
  • Hinton, G. i Anderson, J. (1981) Parallel Models of Associative Memory, Hillsdale (Nova Jersey), Lawrence Erlbaum Assoc.
  • Kelley, H. J. (1960) “Gradient theory of optimal flight paths”, ARS Journal, 30(10): 947–954.
  • McCarthy, J. i Hayes, P. (1969) “Some philosophical problems from the standpoint of artificial intelligence”, en B. Meltzer i D. Michie (editors), Machine Intelligence 4, 463-502, Edimburg, Escòcia: Edinburgh Univerisity Press.
  • McClelland, J. L., Botvinick, M. M., Noelle, D. C., Plaut, D. C., Rogers, T. T., Seidenberg, M. S. i Smith, L. B. (2010) “Letting structure emerge: Connectionist and dynamical systems approaches to cognition”, TRENDS in Cognitive Sciences, 14(8): 348-356.
  • McCulloch, W. i W. Pitts. (1943) “A logical calculus of the ideas immanent in nervous activity”, Bulletin of Mathematical Biophysics, 5: 115-133.
  • Miller, G. A. (2003) “The cognitive revolution: A historical perspective”, TRENDS in Cognitive Sciences, 7(3): 141-144.
  • Newell, A. (1990) Unified Theories of Cognition, Cambridge (Mass.), Harvard University Press.
  • Polger, T. i Shaprio, L. (2016) The Multiple Realization Book Oxford (Regne Unit), Oxford University Press.
  • Ramsey, W., Stich, S. i Garon, J. (1990) “Connectionism, eliminativism and the future of folk psychology”, Philosophical Perspectives, 4: 499-533.
  • Rumelhart, D. E., Hinton, G. E. i Williams, R. J. (1986) “Learning internal representations by error propagation”, en D. E. Rumelhart, i J. L. McClelland (editors), Parallel Distributed Processing: Explorations in the Microstructure of Cognition. Volume 1: Foundations, 318-362, Cambridge (Mass.), MIT Press.
  • Rumelhart, D. E., McClelland, J. L., i PDP Research Group (1986) Parallel Distributed Processing (Vol. 1 & 2), Cambridge (Mass.), MIT Press.
  • Russell, S. J. i Norvig, P. (2003) Artificial Intelligence: A Modern Approach, Upper Saddle River (Nova Jersey), Prentice Hall.
  • Searle, J. (1980) “Minds, brains, and programs”, Behavioral and Brain Sciences, 3: 417-457.
  • Selfridge, O. G. (1959) “Pandemonium: A paradigm for learning”, en D. V. Blake i A. M. Uttley (editors), Proceedings of the Symposium on Mechanisation of Thought Processes, 511–529, Londres (Regne Unit).
  • Smolensky, P. (1987) “The constituent structure of mental states: A reply to Fodor and Pylyshyn”, Southern Journal of Philosophy, 25: 137-460.
  • ———— (1988) “On the proper treatment of connectionism”, Behavioral and Brain Sciences, 2: l-23.
  • Thagard, P. (2005) Mind: Introduction to Cognitive Science, Cambridge (Mass.), MIT Press.

Lectures Recomanades (Anglés i Castellà)

  • Bechtel, W. i Abrahamsen, A. (2002) Connectionism and the Mind: An Introduction to Parallel Processing in Networks (2nd Edition), Cambridge (Mass.), Basil Blackwell.
  • Bishop, C. M. (1995) Neural Networks for Pattern Recognition, Oxford (Regne Unit), Oxford University Press.
  • Campanario, J. M. (2004) “El enfoque conexionista en psicología cognitiva y algunas aplicaciones sencillas en didáctica de las ciencias”, Enseñanza de las Ciencias, 22(1): 93-104.
  • Clark, A. (1993) Associative Engines: Connectionism, Concepts and Representational Change, Oxford, Oxford University Press.
  • Clark, A. (2014) Mindware: An Introduction to the Philosophy of the Cognitive Science (2nd Edition), Oxford, Oxford University Press.
  • Haykin, S. (1994) Neural Networks: A Comprehensive Foundation, Upper Saddle River (Nova Jersey), Prentice Hall.
  • McClelland, J. L. i Rumelhart, D. E. (1989) Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises, Cambridge (Mass.), MIT Press.
  • Pineda, D. (2012) La Mente Humana: Introducción a la Filosofía de la Psicología, Madrid (Espanya), Ediciones Cátedra.
  • Pons Parra, R. M., i Serrano Gonzalez-Tejero, J. M. (2011) “Conexionismo e Instrucción”, Educación y Humanismo, 13(21): 51-82.
Com citar aquesta entrada

Raja, Vicente (2019). “Connexionisme”. Enciclopèdia de la Societat Espanyola de Filosofia Analítica (URL: http://catedrablasco.cat/connexionisme/).
Versió original en castellà: http://www.sefaweb.es/conexionismo/.