Précis d'épistémologie/L'instinct, l'apprentissage et la mémoire

Qu'est-ce que l'apprentissage ?

Un agent a un savoir-faire lorsqu'il est capable de s'adapter à son environnement pour atteindre ses fins. Un savoir-faire est un comportement intelligent, ou une capacité à se comporter intelligemment.

Un savoir-faire est instinctif lorsqu'il est commun à tous les individus d'une même espèce et qu'il fait partie de leurs traits phylogénétiques, c'est à dire qu'il est transmis par une hérédité biologique commune (Lorenz 1981, Tinbergen 1951). Un tel savoir-faire apparaît naturellement au cours du développement normal des individus de l'espèce. C'est un savoir inné, même s'il se manifeste seulement longtemps après la naissance.

Pour qu'un savoir soit appris il faut que son acquisition passe par la mémorisation des expériences. Pour que les animaux soient capables d'apprendre il faut que leurs systèmes nerveux sont capables de conserver des traces de ce qu'ils ont vécu. Ce critère ne suffit pas pour distinguer l'appris de l'instinctif, parce qu'à peu près tous les comportements instinctifs apparaissent à la suite d'une période de maturation cérébrale, pendant laquelle l'expérience détermine la constitution des circuits neuronaux. La régulation des battements du cœur, par exemple, est instinctive, mais l'expérience des premiers battements est cruciale pour le développement ultérieur des réseaux de neurones qui les réguleront. De façon générale le développement du système nerveux est épigénétique, c'est à dire qu'il n'est pas déterminé seulement par les gènes mais aussi et surtout par l'expérience. En particulier, les synapses peuvent être modifiées par les signaux qu'elles transmettent. De cette façon une expérience de stimulation d'un réseau peut être déterminante pour son développement ultérieur. De même qu'en forgeant on devient forgeron, on devient capable de vivre en vivant.

Pour comprendre la différence entre l'inné et l'acquis, il faut considérer les différences de comportement. Celles-ci ont parfois une explication génétique, parce qu'il y a de petites différences génétiques entre les individus d'une même espèce. Mais le plus souvent les différences de comportement sont causées seulement, ou surtout, par des différences d'expérience. Nous disons alors qu'elles sont acquises ou apprises. Un comportement est appris lorsque ses particularités dépendent des particularités de l'expérience antérieure et non d'un héritage génétique. Pour nous les comportements appris sont les plus importants, parce que nos facultés naturelles et nos talents particuliers ne sont rien si nous n'apprenons pas à les développer.

L'instinct d'apprendre

Les facultés animales d'apprentissage sont elles-mêmes d'origine instinctive. Le savoir-apprendre est un savoir-faire et pour qu'il y ait apprentissage il faut qu'il y ait au préalable un savoir-apprendre instinctif. Nous pouvons apprendre à apprendre et donc acquérir du savoir-apprendre, mais nous ne pourrions pas apprendre si nous n'avions pas naturellement la capacité d'apprendre. Cet instinct d'apprendre repose sur la capacité des systèmes nerveux à profiter de leur expérience pour orienter leur développement.

La plasticité neuronale

Pour qu'il y ait mémorisation il faut un matériau plastique, c'est à dire capable de conserver des traces de son expérience (plastique s'oppose ici à élastique : un matériau élastique ne conserve pas de traces des déformations qu'il subit). Il semble que la plasticité des neurones est surtout celles de leurs synapses. L'expérience de transmission des signaux peut renforcer ou affaiblir une synapse (Kandel 1999). Elle peut également conduire à la formation d'autres synapses voisines qui connectent les mêmes neurones. De cette façon l'expérience des neurones modifie leur connectivité. De nouveaux réseaux peuvent être formés et de nouvelles fonctionnalités peuvent apparaître. Dans le même temps de nombreux neurones disparaissent, vraisemblablement parce qu'ils n'ont pas fait les preuves de leur utilité, parce que leurs synapses n'ont pas été renforcées par l'expérience.

Donald Hebb a proposé une règle simple qui explique de nombreux apprentissages neuronaux : deux neurones connectés renforcent leur connexion lorsqu'ils sont excités ensemble. C'est une sorte de renforcement par la réussite : lorsqu'un neurone A transmet un signal d'excitation à un autre neurone B, il n'est pas sûr de réussir. L'excitation de A à elle-seule n'est pas forcément suffisante pour déclencher l'excitation de B. Souvent il faut plusieurs signaux d'excitation en provenance d'autres neurones que A pour que B soit excité. La règle de Hebb énonce qu'une synapse d'un neurone excitateur est récompensée par la réussite. Elle est renforcée lorsque le neurone visé est vraiment excité.

Le développement des instincts

Pour qu'il y ait un savoir-faire il faut qu'il y ait un réseau de neurones fonctionnel, c'est à dire capable de se servir des signaux de la perception pour donner les signaux d'action appropriés. Le savoir-faire instinctif n'est pas appris, mais il est tout de même acquis, au sens où il apparaît au cours du développement naturel de l'individu. Comment les gènes peuvent-ils contrôler le développement d'un réseau de neurones fonctionnel ?

Le mystère du contrôle génétique du développement de l'organisme et de son système nerveux est partiellement élucidé : les gènes contrôlent le métabolisme (la synthèse et la dégradation des molécules de l'organisme) par l'intermédiaire de la synthèse des ARN et des protéines. La différenciation cellulaire dépend de l'activation de gènes particuliers qui synthétisent des protéines spécifiques au type cellulaire. Les gènes contrôlent la différenciation cellulaire en contrôlant la synthèse des ARN ou des protéines qui activent ou inhibent des gènes. Les propriétés des cellules et leurs interactions dépendent de leur type cellulaire. Les gènes peuvent ainsi contrôler la prolifération, la différenciation et la migration de toutes les cellules de l'organisme lors de son développement (Wolpert, Tickle & Martinez 2015). Pour les cellules nerveuses, ils peuvent aussi déterminer la migration des terminaisons de leurs axones et construire ainsi des réseaux de neurones. Mais ils ne contrôlent ainsi que le plan d'ensemble du système. La structure fine des connexions entre neurones est épigénétique, elle dépend de l'expérience. Là encore les gènes peuvent exercer une influence sur le développement, parce que la plasticité des synapses, la façon dont elles réagissent aux divers signaux qu'elles reçoivent, peut varier en fonction du type cellulaire.

La mémoire procédurale

La mémoire procédurale est la mémoire d'un savoir-faire appris. L'apprentissage d'un savoir-faire consiste à construire un réseau de neurones fonctionnel. Tant que le réseau est conservé, et qu'il reste fonctionnel, le savoir-faire est conservé. La mémoire procédurale est donc la conservation des réseaux de neurones fonctionnels construits par un apprentissage.

Un modèle neuronal pour la mémoire épisodique : les zones de convergence-divergence

La mémoire épisodique est la mémoire des souvenirs. Quand on se souvient on simule par l'imagination une expérience qu'on a déjà vécue. Comment un réseau de neurones peut-il accomplir une telle performance, enregistrer une expérience, la conserver et la reproduire par l'imagination ?

Une zone de convergence-divergence (ZCD) est un réseau de neurones, qui reçoit des projections convergentes en provenance des sites dont l'activité doit être mémorisée, et qui renvoie des projections divergentes vers ces mêmes sites (Damasio 1989, 2009). Lorsqu'une expérience est mémorisée, les signaux qui convergent sur la ZCD y excitent des neurones qui renforcent alors leurs connexions réciproques, en suivant la règle de Hebb, et forment ainsi un réseau auto-excitateur. Il suffit alors d'exciter à nouveau le réseau ainsi formé pour reproduire la combinaison de signaux initialement reçus. Dans un réseau auto-excitateur l'excitation d'une partie se propage à toutes les autres. De même un fragment de souvenir suffit pour réveiller l'intégralité d'une expérience mémorisée (Proust 1927). Une ZCD peut être ainsi un lieu d'enregistrement et de reproduction des souvenirs.

En plus des voies convergentes-divergentes, une ZCD peut être connectée au reste du cerveau de toutes les façons imaginables, par des signaux en entrée qui l'activent ou l'inhibent, et des signaux en sortie avec lesquels elle fait son effet sur le reste du système. En particulier les ZCD peuvent s'organiser en une arborescence. Une ZCD peut recruter en entrée des voies convergentes issues de nombreuses autres ZCD. Elle peut ainsi faire une synthèse des capacités de détection et de production de toutes les ZCD ainsi recrutées.

Pour faire un modèle du système des ZCD, on distingue dans le système nerveux une partie périphérique et une partie centrale. La périphérie réunit les régions dédiées à la perception, à l'émotion et à l'action. L'arborescence des ZCD est organisée d'une façon hiérarchique, de la périphérie vers le centre. Les ZCD les plus périphériques ont des voies convergente issues directement de la périphérie. On se rapproche du centre en remontant les arborescences de ZCD. On peut songer à des racines qui plongent dans la terre, la périphérie, et qui se rapprochent de la base du tronc, le centre. Mais dans le cerveau, il y a de très nombreux centres. Les ZCD les plus centrales ont des voies convergentes issues d'autres ZCD, et ne sont pas recrutées par des ZCD plus centrales. Le souvenir d'un épisode de notre vie pourrait être conservé par une telle ZCD centrale. Lorsque nous revivons les perceptions, les émotions et les actions d'une expérience passée, l'excitation de cette ZCD centrale activerait toutes les ZCD subordonnées, jusqu'aux aires périphériques, et simulerait ainsi l'expérience préalablement vécue.

Apprendre à percevoir

La perception est évidemment nécessaire pour agir sur le présent. Mais son effet ne s'arrête pas aux actions sur l'environnement perçu, parce que nous apprenons en permanence à partir de ce que nous percevons ou imaginons. Chaque expérience, réelle ou imaginaire, peut modifier nos façons de percevoir et d'imaginer.

Les réseaux de neurones dédiés à la perception de bas niveau, proche des organes sensoriels, sont vraisemblablement peu modifiables par l'expérience, dès qu'ils ont fini leur période de maturation initiale. Une fois qu'ils sont fonctionnels, ils ne doivent plus être modifiés, ou seulement un peu, parce qu'ils sont devenus nécessaires à l'accomplissement des fonctions de niveau supérieur. Si on modifie un réseau de bas niveau, on risque de perturber tous les réseaux de niveau supérieur qui se servent de lui.

Les agitations intérieures ressemblent parfois un peu aux mouvements d'un fluide, comme s'il y avait des forces de pression qui nous poussent à pervevoir, ou à imaginer. Pour expliquer comment nos expériences nous transforment on peut alors songer à la façon dont une rivière creuse son lit, au modelage des dunes par le vent, et plus généralement aux façons dont l'air, l'eau, ou tout autre fluide, peuvent modifier les solides au contact desquels ils s'écoulent. Les influx nerveux sont comme des courants fluides, les réseaux de neurones sont comme des canalisations dans lesquels ils s'écoulent et qu'ils peuvent creuser, élargir ou obstruer. Bien sûr ce n'est qu'une analogie. Les influx nerveux sont des courants électriques dans les neurones et à travers leurs membranes. Ils "creusent leur lit" dans les réseaux principalement en agissant sur leurs synapses.

Ce modèle de mémorisation fluide, où les influx nerveux peuvent modifier en permanence les voies dans lesquelles ils s'écoulent, ne peut pas suffire pour expliquer comment nous sommes transformés par nos expériences, parce qu'il donne une trop grande importance à l'oubli. Chaque nouvelle expérience pourrait effacer les traces laissées par les anciennes. Les souvenirs seraient comme des traces sur le sable d'une plage balayée par les vagues.

Notre mémoire fonctionne souvent d'une façon accumulative. Les souvenirs, les compétences et toutes les informations mémorisées sont acquis et conservés indépendamment les uns des autres. En général les nouveaux items mémorisés n'effacent pas les plus anciens. Comment les cerveaux développent de telles facultés de mémorisation est assez mystérieux. Les ZCD, qui requièrent au minimum la constitution d'un nouveau réseau, avec des neurones jusque là inutilisés, pour chaque nouvel item mémorisé, sont probablement une partie de l'explication, mais seulement une partie.

Nous apprenons à percevoir et à imaginer en apprenant à faire des inférences muettes à partir des informations fournies par les sens. Quand on mémorise une inférence muette, on retient une combinaison entre une condition et une conséquence. Pour cela il suffit en principe de conserver une liaison excitatrice entre le réseau qui représente la condition et celui qui représente la conséquence. Comme nos facultés d'inférence se développent d'une façon cumulative, il faut supposer que nos cerveaux savent construire de telles liaisons sans modifier les anciennes, qu'ils ont une mémoire qui ressemble parfois à celle des ordinateurs, où les liaisons entre les conditions, c'est à dire les adresses en mémoire, et les conséquences, les contenus conservés à ces adresses, sont apprises d'une façon cumulative.

Une expérience vécue réunit toujours de très nombreux éléments, d'une façon qui peut sembler parfois très désordonnée. Pour que l'inférence d'une condition à une conséquence soit légitime il ne suffit pas qu'elles aient été réunies lors d'une expérience, parce que leur association pourrait être fortuite. Comment reconnaissons-nous les inférences légitimes, celles qui augmentent vraiment notre savoir ? Par exemple de nombreux animaux savent identifier la cause de leur malaise s'ils ont ingéré un mauvaise nourriture. Qu'ils évitent d'en manger à nouveau montre qu'ils ont identifié correctement la source de leur souffrance. Mais comment font-ils ? De nombreuses autres perceptions ont précédé leur malaise. Pourquoi sélectionnent-ils comme cause précisément la nourriture et non les autres perceptions qui faisaient elles aussi partie de la même expérience ?

La perception ne s'arrête pas à la sensation. Elle construit des modèles de la réalité qui vont au delà du savoir fourni directement par les sens et qui guident l'identification des relations de condition à conséquence. Par exemple, nous reconnaissons les objets solides et leur attribuons spontanément des qualités de permanence. Nous savons qu'ils ne disparaissent pas et que leur forme reste inchangée, tant qu'il n'y a pas de cause capable de les faire disparaître ou de les déformer. Cette connaissance de la solidité est une source inépuisable d'inférences muettes, avec lesquelles nous connaissons le futur, le présent qui n'est pas perçu par les sens, et le passé qu'on n'a pas vécu. De façon générale nous savons naturellement percevoir des qualités de permanence, des relations de causalité, ou d'autres qualités et relations qui conduisent à des inférences légitimes. Nous savons naturellement identifier des causes et des effets, nous savons reconnaître ce qui agit et ce qui subit, nous percevons des traces et des signes annonciateurs... De telles facultés de perception alliées à la mémoire épisodique permettent de développer l'imagination déductive.

Nous savons instinctivement percevoir la causalité, ou d'autres qualités et relations qui conduisent à des inférences légitimes, seulement dans des cas simples, comme la solidité, l'action par contact ou la nourriture comme cause de malaise. De façon générale, l'identification correcte des inférences légitimes est un problème très difficile que notre savoir instinctif n'est pas capable de résoudre à lui seul. De fait nous sommes naturellement portés à percevoir des relations causales là où il n'y en a pas. Toutes les formes de superstition et de divagation montrent que nos facultés naturelles de perception de la causalité sont d'une fiabilité très limitée.