Précis d'épistémologie/Version imprimable

Un livre de Wikilivres.
Sauter à la navigation Sauter à la recherche
Nuvola-inspired File Icons for MediaWiki-fileicon-ps.png

Ceci est la version imprimable de Précis d'épistémologie.

  • Si vous imprimez cette page, choisissez « Aperçu avant impression » dans votre navigateur, ou cliquez sur le lien Version imprimable dans la boîte à outils, vous verrez cette page sans ce message, ni éléments de navigation sur la gauche ou en haut.
  • Cliquez sur Rafraîchir cette page pour obtenir la dernière version du wikilivre.
  • Pour plus d'informations sur les version imprimables, y compris la manière d'obtenir une version PDF, vous pouvez lire l'article Versions imprimables.


Précis d'épistémologie

Une version à jour et éditable de ce livre est disponible sur Wikilivres,
une bibliothèque de livres pédagogiques, à l'URL :
https://fr.wikibooks.org/wiki/Pr%C3%A9cis_d%27%C3%A9pist%C3%A9mologie

Vous avez la permission de copier, distribuer et/ou modifier ce document selon les termes de la Licence de documentation libre GNU, version 1.2 ou plus récente publiée par la Free Software Foundation ; sans sections inaltérables, sans texte de première page de couverture et sans Texte de dernière page de couverture. Une copie de cette licence est incluse dans l'annexe nommée « Licence de documentation libre GNU ».

Sections

Science de l'âme ou science de la matière ?

La cognition est la production et l'utilisation de représentations internes qui préparent à l'action.


Un préjugé courant veut qu'une science soit matérialiste pour être vraiment une science, ce qui conduit à récuser l'ancienne définition, aristotélicienne, de la psychologie, la science de l'âme.

Il faut rappeler que ce préjugé, ou d'autres semblables, sur ce que doit être la science, sont des obstacles au développement du savoir scientifique. Pour faire un travail scientifique il n'est ni nécessaire ni souhaitable de se lier les mains par avance avec de tels a priori, il suffit de chercher honnêtement des vérités et leurs preuves. Aucun autre principe n'a priorité devant celui-ci.

La science de l'âme[modifier | modifier le wikicode]

Parler des âmes, c'est d'abord parler de nous-mêmes, de ce que nous sommes, de ce que nous vivons quand nous percevons, imaginons, ressentons, pensons, voulons ou pendant toute autre activité intérieure dont nous prenons conscience. Nous ne savons pas très bien ce qu'est l'âme ni pourquoi elle vit avec un corps, mais nous savons qu'elle est là, et nous pouvons travailler honnêtement pour développer un véritable savoir à son sujet. Il n'en faut pas plus pour justifier cette vénérable expression, science de l'âme.

Le mystère de l'alliance du corps et de l'âme[modifier | modifier le wikicode]

L'alliance de l'âme et du corps est tellement mystérieuse que nous ne savons même pas si nous l'exprimons correctement : faut-il dire que nous sommes des âmes et que nous avons un corps ? Ou que nous sommes des corps ? Habités par une âme ? L'âme est-elle seulement une façon d'être du corps ?

Mais il n'est pas nécessaire de résoudre ces mystères pour progresser dans le savoir.

Une chose est sûre du point de vue de la science empirique, c'est que pour connaître les âmes, nous pouvons et devons observer leurs corps. Étudier des âmes, en tant que scientifique observateur ou expérimentateur, c'est toujours étudier des corps.

La science de la matière est-elle en principe suffisante pour expliquer nos existences d'êtres conscients ? Nous ne savons pas. On peut croire que la conscience émerge à partir de la vie cérébrale, mais nous ne savons pas l'expliquer (Chalmers 1996). Les influx nerveux sont produits par des courants électriques dans les neurones et à travers leurs membranes. Ce sont des courants ioniques très ordinaires. Rien ne suggère qu'ils doivent être les messagers de l'esprit. Et si on tient à une cosmologie strictement matérialiste - seulement des atomes et du vide - il semble que l'Univers devrait être sans âmes. Les atomes n'ont pas besoin des âmes pour être des atomes.

Nous ne savons pas comment la vie du corps fait apparaître celle de l'âme, nous savons seulement qu'une âme a besoin de son corps pour être ce qu'elle est. Toutes les facultés de l'âme dépendent de son corps. Pour voir il faut des yeux, et un cerveau qui interprète les informations visuelles. Pour agir il faut des pieds et des mains, ou d'autres effecteurs, et un cerveau qui les commande. Pour se souvenir, il faut conserver des enregistrements quelque part dans la tête. Les émotions sont des affections du corps autant que de l'âme. La pensée ne pourrait pas exister sans la parole, et donc sans les langues qui la font entendre. Tout se passe comme si les corps donnaient aux âmes les moyens de faire ce qu'elles font. Nous connaissons ce qu'elles sont en comprenant ce qu'elles font avec leur corps. Plus nous en savons sur le corps, tout particulièrement le cerveau, plus nous pouvons comprendre ce qu'elles sont.

La connaissance de soi comme une âme[modifier | modifier le wikicode]

Il n'est pas nécessaire de connaître le fonctionnement de son cerveau, ni même de savoir que nous en avons un, pour se connaître soi-même comme une âme, parce que l'âme est toujours capable de réfléchir : quand on voit, on ne connaît pas seulement l'objet vu, on se connaît aussi soi-même en train de le voir. Quand on le voit, on sait qu'on le voit. Il en va de même pour toutes les activités conscientes. Quand on se souvient, on sait qu'on se souvient. Quand on veut, on sait qu'on veut. On ne peut pas vivre consciemment sans savoir qu'on vit consciemment. Par la réflexion l'âme est informée directement de sa propre activité. Elle ne peut pas être une âme sans se connaître ainsi. Sa nature est d'être en permanence un témoin d'elle-même.

Parce qu'il est naturel et spontané, on croit parfois que le savoir de soi-même acquis par la réflexion n'a pas sa place dans la science. Il serait seulement préscientifique, comme si la science avait besoin de moyens beaucoup plus sophistiqués pour être vraiment la science. Mais c'est se tromper sur la nature de la science. Comment pourrait-on développer un véritable savoir si on renonçait à la réflexion ? On ne pourrait pas faire un seul pas en avant. Même les scientifiques qui affirment que le savoir réflexif n'est pas scientifique n'ont pas pour autant renoncé à la réflexion, sinon ils ne pourraient même plus penser.

La science fait feu de tout bois. Toutes les sources du savoir sont a priori bienvenues. Toutes les pensées, les observations, les principes, les définitions, les hypothèses, les arguments, les raisonnements, les objections, sont accueillis et encouragés, pourvu qu'il s'agisse de chercher honnêtement des vérités et des preuves. L'honnêteté scientifique exige seulement qu'on se soumette volontairement à la critique, pas que l'on renonce à nos facultés naturelles.

La cognition[modifier | modifier le wikicode]

Toutes les facultés de l'âme repose sur sa capacité à produire et utiliser des représentations. Les images visuelles sont des représentations des objets vus. Quand on imagine, on se représente ce qu'on imagine. Quand on veut, on se représente ce qu'on veut. Même quand on ressent, on se représente les êtres qui ont provoqué nos émotions. L'étude des représentations semble donc être un bon point de départ pour étudier les facultés de l'âme. Mais la définition du concept nous laisse sur notre faim, parce que n'importe quoi peut être considéré comme une représentation. Pour être une représentation il suffit de porter des informations, quelle que soit leur nature et la façon dont elles sont portées, sur un autre être. Comme tous les êtres sont toujours porteurs de telles informations, ils peuvent toujours être considérés comme des représentations. Savoir interpréter les signaux qu'ils portent suffit pour qu'ils servent comme représentations. C'est justement ce point qui est essentiel. Les âmes se servent des représentations qu'elles produisent pour agir sur leur environnement et sur elles-mêmes. Mais la capacité à utiliser des représentations n'est pas réservée aux âmes. Les êtres vivants, même les plus simples, et les robots, se servent également de représentations internes pour agir.

La cognition est la production et l'utilisation de représentations internes qui préparent à l'action. Les sciences cognitives sont toutes les disciplines concernées par l'étude de la cognition : psychologie, neurosciences, éthologie, intelligence artificielle, robotique, épistémologie, linguistique ...

L'usage des représentations ne suffit pas pour expliquer l'existence de la conscience - les robots utilisent des représentations sans avoir conscience de ce qu'elles représentent - mais il est quand même fondamental pour connaître les âmes, parce qu'elles ne pourraient pas être ce qu'elles sont si elles ne se servaient pas des représentations qu'elles produisent. Pour exister elles ont justement besoin d'un corps qui les rend capables de produire des représentations qui les préparent à l'action. Une âme se donne des représentations, elle est ce qui se représente, ce qui perçoit et imagine. Chercher l'âme, ou la conscience, dans le cerveau, c'est chercher les représentations qu'elle se donne (Changeux 2002, Shallice & Cooper 2011, Dehaene 2014). Étudier la capacité des corps à produire et utiliser des représentations est donc une bonne approche pour comprendre les facultés de l'âme.

La liaison entre les capteurs et les effecteurs[modifier | modifier le wikicode]

Pour utiliser des représentations, il faut être capable d'agir, il faut être un agent, c'est à dire un corps animé : un être vivant ou un robot. Un agent est toujours un système qui interagit avec son environnement par l'intermédiaire de capteurs et d'effecteurs (Turing 1936, Russell & Norvig 2010).

Les capteurs (les organes sensoriels) sont reliés par un système nerveux (le cerveau, la moelle épinière...) aux effecteurs (les muscles, les glandes excrétrices...) afin de produire un comportement intelligent (Churchland & Sejnowski 1992, Gazzaniga & Ivry 2001).

La perception sensorielle consiste à produire des représentations internes à partir des signaux fournis par les capteurs. Elle prépare à l'action en rendant l'agent capable de s'adapter à son environnement présent. Mais les sens ne sont pas les seules sources des représentations internes. Toutes les formes de perception et d'imagination sont des façons de produire des représentations internes qui préparent à l'action.

Un prochain chapitre présentera un modèle d'administration centralisée sans administrateur central qui explique comment le cerveau nous rend capable d'avoir une volonté autonome, de faire attention, de former des croyances et de contrôler volontairement la perception, l'imagination et la pensée. Il s'agit bien d'une théorie qui explique le fonctionnement de nos cerveaux quand nous sommes conscients, mais elle ne suffit pas pour expliquer l'apparition de la conscience à partir de l'activité cérébrale. L'attention consiste à sélectionner des représentations pour prendre des décisions, mais la sélection à elle seule n'explique pas pourquoi les représentations ainsi sélectionnées deviennent particulièrement conscientes. Un robot aussi peut sélectionner des représentations pour prendre des décisions, sans que cela implique la moindre conscience.


Chapitre suivant >>>


La perception et l'imagination

La perception est l'imagination du présent[modifier | modifier le wikicode]

L'imagination est la production de représentations internes.

La perception sensorielle est une forme de l'imagination, stimulée et guidée par les sens. Les représentations internes sont produites à partir des signaux fournis par les organes sensoriels.

Les représentations de l'environnement présent ne sont pas forcément d'origine sensorielle. Si par exemple je suis dans un endroit familier, je peux me représenter la disposition des lieux même dans l'obscurité. Je sais que divers objets sont présents et où ils sont alors que je ne les perçois pas directement.

De façon générale nos représentations du présent sont issues à la fois d'informations sensorielles et d'informations mémorisées. Par exemple lorsque nous saisissons un objet familier, le geste est préparé de façon à s'adapter au poids de l'objet. Si nous anticipons mal le poids le geste n'est pas adapté. Cela montre que nous avons une représentation interne du poids avant que nous tenions l'objet dans la main. Le poids est donc représenté avant que les capteurs de tension musculaire ne fournissent cette information. On peut dire que le poids a été imaginé, mais on peut aussi dire qu'il a été perçu indirectement à partir de l'image visuelle, grâce à un savoir mémorisé sur le poids ordinaire d'un tel objet.

La perception et l'imagination sont souvent pensées en opposition. Ce qui est perçu est présent, ce qui est imaginé ne l'est pas. Mais cette opposition interdit de parler de l'imagination du présent et de définir la perception comme une forme de l'imagination.

Au sens strict retenu dans ce livre, la perception est seulement l'imagination du présent. Mais on peut aussi définir la perception en un sens plus général et parler de la perception du passé (la remémoration, et plus généralement toute forme d'imagination du passé), du futur (l'anticipation), de l'imaginaire (rêver à des êtres qui n'existent pas) et même des êtres abstraits (le savoir abstrait, mathématique par exemple). Ainsi entendues la perception et l'imagination sont synonymes.

Les associations et les inférences muettes[modifier | modifier le wikicode]

La plupart des représentations internes influencent les actions non directement en commandant les muscles mais indirectement, en participant à la production d'autres représentations. Les représentations internes, sauf peut-être celles qui servent directement à commander les effecteurs, ont toujours pour fonction de produire, modifier ou supprimer d'autres représentations internes, ou au moins de participer à la dynamique de production des représentations internes.

Comme le cerveau est une machine massivement parallèle, une représentation peut exciter ou inhiber de nombreuses autres représentations. C'est pourquoi les représentations sont en général produites en associations. Des représentations qui s'excitent mutuellement sont éveillées simultanément.

Une inférence consiste à passer d'une condition à une conséquence. La conséquence est une représentation produite, inférée, à partir des représentations qui déterminent la condition. Si ces représentations sont verbales, une inférence est une étape d'un raisonnement, mais il n'est pas nécessaire que les représentations soient verbales. La perception procède par inférence muette dès qu'elle relie des conséquences et des conditions.

Une inférence est une sorte particulière d'association. Il faut que le lien d'excitation de la conséquence par la condition soit suffisamment fort pour que la conséquence soit toujours éveillée lorsque la condition l'est.

Les inférences peuvent être enchaînées parce que les conséquences peuvent être elles-mêmes des conditions qui ont des conséquences, et ainsi de suite. Les enchaînements d'inférences muettes ressemblent beaucoup à un raisonnement. La suite des représentations des conditions et de leurs conséquences est semblable à celle de leurs descriptions verbales enchaînées dans un raisonnement.

La perception sensorielle est à la sensation ce que la raison est à l'intuition. Les intuitions viennent spontanément mais il faut raisonner à partir d'elles pour développer le savoir rationnel auquel elles conduisent parfois. De même les sensations sont produites spontanément par les sens mais il faut procéder par inférence, produire de nouvelles représentations internes, pour développer une perception bien informée de l'être perçu. La perception sensorielle est comme un raisonnement sur les sensations.

Les associations et les inférences muettes font qu'il n'y a pas de frontière nette entre la perception sensorielle et l'imagination du présent. Lorsqu'une représentation a été produite par inférence, comme conséquence d'une condition déjà perçue, on peut dire qu'elle est imaginée mais on peut aussi dire qu'elle est perçue indirectement à partir de la perception de la condition.

Imaginer pour simuler les autres âmes[modifier | modifier le wikicode]

L'imagination du passé, du futur et de mondes purement imaginaires est une simulation de la perception et de l'action. Une partie des ressources de la perception est mobilisée pour représenter un environnement qui n'est pas présent, seulement imaginé. On peut ainsi imaginer ce qu'on percevrait, ce qu'on ressentirait et ce qu'on ferait si on était ailleurs, à un autre moment, ou à la place d'un autre (Goldman 2006, Rizzolatti & Sinigaglia 2006).

Simuler la perception consiste à simuler l'activation de nos systèmes de détection. On peut simuler la perception sensorielle et reconstituer partiellement des images ou des impressions d'origine sensorielle, mais l'imagination n'est pas forcément associée à des images sensorielles. Pour imaginer un être dangereux il n'est pas nécessaire de s'en faire une image visuelle, ou d'imaginer sa voix, ou toute autre forme de perception sensorielle simulée, il suffit de simuler l'activation d'un détecteur de danger. On peut s'imaginer à proximité d'un être dangereux même si on ne perçoit rien de lui, sauf qu'il est dangereux.

On connaît l'âme d'abord par l'expérience de soi-même. En se souvenant de tout ce qu'on a vécu, on se reconnaît soi-même comme une âme. Mais on étend sa connaissance, par l'imagination, en se mettant à la place des autres âmes, de toutes les âmes que l'on peut imaginer.

Connaître autrui comme une âme, comme un être qui imagine, qui ressent et qui veut, en se mettant à sa place par l'imagination, permet d'anticiper les conséquences immédiates et les effets à long-terme de nos actes présents sur son comportement.

La perception est conceptuelle[modifier | modifier le wikicode]

Les concepts sont des propriétés ou des relations. Une propriété, ou une qualité, est attribuée à un objet. Une relation est entre plusieurs objets. Lorsqu'une relation est entre deux objets, on peut considérer qu'elle est une propriété du couple. Une relation entre trois objets est une propriété du triplet, et ainsi de suite pour les relations entre davantage d'objets.

La perception attribue automatiquement des concepts aux objets perçus. La perception visuelle attribue des qualités visuelles (couleur, luminosité, texture, forme...) aux objets vus. Il en va de même pour les autres formes de perception sensorielle.

On distingue parfois les représentations iconiques, telles que les images visuelles, et les représentations conceptuelles, qui peuvent être formulées avec des mots. Mais cette distinction n'est pas fondamentale. Une image visuelle attribue des qualités visuelles à tous ses points, elle est donc déjà conceptuelle. Inversement une description verbale telle que bleu-blanc-rouge peut être considérée comme une image du drapeau français, parce que les mots sont alignés comme les parties qu'ils représentent.

Percevoir, c'est déjà concevoir. Percevoir, imaginer et concevoir sont essentiellement la même chose. Il s'agit toujours de produire des représentations internes qui préparent à l'action.

Lorsqu'un être est perçu, il est toujours perçu avec des qualités ou des relations. Un être sans concepts, une sorte de chose en soi, à laquelle on n'attribue aucun concept, ne peut pas être perçu. Les êtres ne viennent jamais complètement nus. Ils sont toujours habillés avec les concepts que la perception leur a attribués (Kant 1787).

Pour qu'un objet soit perçu, il faut au minimum un détecteur qui signale la présence de l'objet. Le signal émis par le détecteur est une représentation interne de l'objet perçu. Il détermine également un concept attribué à l'objet : la qualité d'être détectable par ce détecteur, ou même plus précisément, la qualité de pouvoir déclencher le signal de détection émis par le détecteur. Une détection attribue automatiquement à l'objet détecté la qualité d'être un objet qui peut être ainsi détecté. Le même signal de détection peut servir de représentation de l'objet détecté et en même temps de représentation du concept attribué à cet objet, parce que l'objet est identifié par son concept. Les êtres sont représentés par les concepts qui leur sont attribués. Par exemple « l'arbre dans la cour » est une expression qui se sert du concept d'être un arbre dans la cour pour représenter un arbre.

Un concept est déterminé par l'ensemble des systèmes de détection qui signalent la présence d'un objet en lui attribuant ce concept. Cette définition ne vaut pas seulement pour la perception sensorielle et les concepts empiriques. Elle peut être généralisée parce que toute unité de traitement de l'information peut être considérée comme un système de détection. Une unité de traitement de l'information produit des signaux en sortie à partir de signaux reçus en entrée. Un signal en sortie peut être considéré comme un signal de détection des signaux en entrée qui l'on produit.

Lorsqu'un concept est défini par une série de conditions, qui ensemble sont nécessaires et suffisantes pour le déterminer, un système de détection de la présence du concept est défini du même coup, parce qu'on détecte le concept défini en détectant les conditions qui le définissent.

Lorsqu'un concept est défini par les ressemblances avec un ou plusieurs exemples, détecter le concept consiste à détecter des ressemblances et des différences.

Même un être unique peut être identifié par un concept, dès que nous sommes capables de le percevoir ou de l'imaginer en tant qu'être unique, parce que le percevoir ou l'imaginer requiert un système de détection, et parce qu'un tel système définit un concept. Par exemple je peux avoir le concept d'une personne qui m'est familière parce que je peux la percevoir et la distinguer parmi toutes les autres personnes.

On conçoit souvent les concepts comme des produits du langage. Les concepts sont signifiés par les expressions qui servent à les nommer et ils ne sont pas connus avant d'avoir un nom. Selon l'acception retenue dans ce livre les concepts précèdent le langage. Dès qu'un système de perception est capable de détecter des objets, il leur attribue automatiquement des concepts. Les concepts sont très généralement utilisés par les animaux, qu'ils se servent ou non d'un langage (Gould & Gould 1994). Par exemple tous les animaux capables d'avoir peur attestent par leur comportement qu'ils sont capables de détecter le danger. Le concept de danger est donc une de leurs représentations internes.

Les concepts sont-ils des êtres concrets ?[modifier | modifier le wikicode]

« la Forme se retrouve une et identique en même temps en plusieurs endroits. C'est comme si tu étendais un voile sur plusieurs êtres humains et que tu disais « Le voile reste un en sa totalité, lorsqu'il est étendu sur plusieurs choses. » (Platon, Parménide, 131b, traduit par Luc Brisson)

Les êtres sont concrets lorsqu'ils existent dans l'espace et dans le temps. Les objets perçus directement avec nos sens, ou indirectement par l'intermédiaire d'autres êtres matériels (des systèmes d'observation et de mesure) sont tous concrets. Y a-t-il d'autres modes d'existence ? Y a-t-il des êtres qui ne sont pas concrets ?

Les concepts que nous attribuons aux êtres concrets sont-ils des objets ? Faut-il les considérer comme des êtres ? Et si oui, comme des êtres concrets ? Existent-ils dans l'espace et dans le temps ?

Les êtres, ou les objets, sont tout ce qui peut être perçu, représenté ou pensé. Comme les concepts peuvent être représentés et pensés, ils sont des êtres comme les autres. Mais peut-on percevoir leur présence dans l'espace et dans le temps ?

On peut soutenir que les concepts sont présents à chaque fois que les objets dont ils sont vrais sont présents. L'existence du concept de cheval est simplement celle de tous les chevaux. Les concepts sont manifestés et révélés par l'existence des êtres dont ils sont vrais et ils existent en même temps. Ainsi conçu un concept existe concrètement dès qu'il est vrai d'un être concret.

Plus couramment les concepts sont conçus comme des êtres abstraits. Seuls les êtres qui peuvent être identifiés à un substrat matériel, un corps, sont considérés comme des êtres concrets. Or un concept n'est pas un corps, il peut être vrai de très nombreux êtres concrets, qui ont tous un corps, mais il est différent de chacun d'eux. Un corps ne peut pas prétendre être à lui tout seul un concept qui est vrai de lui, même si c'est un concept qui n'est vrai que de lui, parce que le concept peut être présent dans la tête alors que que le corps est absent, seulement imaginé. Le concept peut demeurer, Socrate, par exemple, alors que le corps qu'il représente a disparu depuis longtemps.

On peut aussi soutenir que les concepts sont présents à chaque fois qu'ils sont conçus, c'est à dire à chaque fois qu'ils sont détectés, ou que cette détection est simulée. L'existence concrète du concept peut être identifiée à celle du signal qui le détecte. Ainsi conçus les concepts existent concrètement dans l'espace et dans le temps, mais pas à la façon des corps, puisqu'ils existent de façon transitoire et dispersée, seulement quand un corps les détecte ou les imagine.

Les schémas[modifier | modifier le wikicode]

Une modélisation simpliste et partiellement fausse de la perception suppose qu'elle est unidirectionnelle. Les informations sont d'abord produites par les détecteurs sensoriels puis synthétisées, par étapes successives, jusqu'aux représentations de haut-niveau, qui déterminent les principaux objets perçus et les principaux concepts qui leur sont attribués. On suppose que les représentations complexes émergent à partir des perceptions élémentaires, comme dans une peinture pointilliste. Une telle dynamique de production des représentations est dite ascendante, ou bottom-up, parce que les signaux sensoriels sont considérés comme des représentations de bas-niveau, tandis que les concepts attribués aux objets complexes sont de haut-niveau. Mais cette modélisation est insuffisante parce qu'elle n'explique pas les effets de préparation à la perception.

Ce qui est perçu n'est pas seulement déterminé par les sens mais aussi par les attentes et les désirs, par les perceptions antérieures, les souvenirs, les préjugés, la culture et le savoir. Les effets d'attente peuvent être si forts qu'il arrive que nous croyons avoir vu ce que nous n'avons pas pu voir, parce que cela n'a pas existé. Nos perceptions ont donc des sources intérieures, elles ne sont pas seulement élaborées à partir des sens. La dynamique des représentations n'est pas seulement ascendante, mais également descendante, top-down. Les système de détection qui reçoivent les informations sensorielles reçoivent aussi des informations de plus haut niveau. Il faut modéliser une sorte de dialogue permanent entre les divers étages de la perception. L'information peut circuler dans toutes les directions, du bas vers le haut, du haut vers le bas, et horizontalement (Hofstadter & FARG 1995). N'importe quelle représentation peut avoir une influence sur la production des autres, quel que soit leur niveau de complexité.

Un schéma, ou un cadre conceptuel, est un système de préconceptions, c'est à dire ce qu'on tient pour vrai avant de l'avoir vérifié. Un schéma détermine les êtres que l'on s'attend à percevoir avec les concepts qu'on croit devoir leur attribuer et les règles d'inférence que l'on croit pouvoir leur appliquer.

Les sensations sont les sources des processus ascendants de la perception, les schémas sont les sources des processus descendants. Ils font partie du fonctionnement normal de la perception. Ils sont nécessaires pour s'adapter rapidement à son environnement, parce que pour agir on n'a souvent pas le temps de tout vérifier.

La connaissance des bons schémas fait toute la différence entre l'expert et le néophyte. Un expert n'a souvent besoin que d'un coup d'œil pour analyser correctement une situation et tirer les conclusions qui s'imposent, parce qu'il connaît déjà les schémas qui permettent de la comprendre et il n'a qu'à vérifier leur adaptation. Un néophyte est submergé par le flot de nouvelles informations, ne sait pas quoi regarder, ne distingue pas l'essentiel du négligeable et se pose rarement les bonnes questions, parce qu'il ne connaît pas les schémas qui lui permettraient d'organiser sa perception de la situation.

Pour comprendre comment les schémas sont utilisés pour contrôler la perception et l'imagination, on a besoin d'un modèle qui explique la volonté, l'attention et la formation des croyances. Il sera présenté dans un prochain chapitre.

L'imagination créatrice[modifier | modifier le wikicode]

Par l'imagination nous pouvons combiner des représentations dans des configurations nouvelles que nous n'avons jamais perçues. Les parties ont été perçues, mais leur assemblage est inventé, il est purement imaginaire, il représente un être fictif, une sorte de chimère. En assemblant des fragments d'images sensorielles, comme un patchwork, nous pouvons créer une image d'un être qui n'existe pas. De même en assemblant des concepts nous pouvons créer des représentations d'êtres qui n'ont jamais existé et qui n'existeront peut-être jamais. Par l'abstraction nous séparons les concepts des réalités qu'ils représentent. Par l'imagination nous les assemblons dans des configurations nouvelles et créons ainsi des fictions. L'imagination et l'abstraction sont créatrices. Par séparation et composition nous pouvons inventer toutes les possibilités conceptuelles que nous voulons. Nous découvrons ainsi la richesse des concepts et la liberté créatrice qu'ils nous donnent.

Toutes ces fictions de l'imagination sont en principe parfaitement connaissables, parce qu'elles ne sont rien de plus que des êtres imaginés. Nous connaissons nos fictions simplement en nous connaissant nous-mêmes, en tant qu'êtres qui imaginent.

On peut dire des représentations des êtres fictifs qu'elles sont toujours fausses ou toujours vraies. Elles sont toujours fausses parce que pour être vraie une représentation doit représenter ce qui existe vraiment. Elles sont toujours vraies parce qu'elles font exister les êtres fictifs en tant qu'objets de l'imagination ou de la pensée et qu'en affirmant leur vérité on dit seulement que les objets sont ainsi représentés ou pensés. Les êtres imaginaires existent en tant qu'objets de l'imagination, tout simplement parce qu'il est vrai que nous les imaginons. Les représentations des êtres fictifs sont automatiquement vraies parce qu'elles définissent les êtres dont elles sont vraies.

L'importance des représentations du présent et du futur pour la préparation de l'action est évidente, celle des représentations du passé l'est un peu moins. La remémoration nous prépare à l'action indirectement, ne serait-ce qu'en nous aidant à percevoir le présent et le futur, par inférence à partir de la connaissance du passé. Mais l'imagination des fictions, comment peut-elle préparer à l'action ? Il semble qu'elle nous en éloigne. Pour bien agir il faut avoir les pieds sur terre, il faut s'adapter à ce qui existe réellement. A quoi bon imaginer des êtres qui n'existent pas ?

Les buts que nous nous fixons commencent par n'être que des fictions. Ils n'existeront réellement que si nous les atteignons. De cette façon les fictions nous préparent à l'action en tant qu'anticipations de tout ce que nous pourrions faire. Nous découvrons nos capacités par l'imagination. Mais nous imaginons également des êtres qui n'existeront jamais, des fictions qui ne seront jamais des buts de l'action, des êtres purement imaginaires et qui le resteront.

Le travail du romancier est semblable à celui du mathématicien. Il pose des conditions, une situation initiale et des contraintes, puis il expose leurs conséquences, souvent inéluctables, de la même façon qu'un mathématicien démontre des théorèmes à partir d'axiomes et d'hypothèses. Quand nous imaginons des fictions, nous pouvons utiliser pleinement nos capacités à inférer. Il ne s'agit pas seulement d'inventer des assemblages de représentations, il s'agit surtout d'imaginer tout ce qui en résulte, tout ce que notre dynamique intérieure de production de représentations par inférence peut fournir à partir de ces inventions. De cette façon l'imagination des fictions est une exploration de soi-même. Nous découvrons nos capacités de connaissance par inférence.

Toute connaissance d'un être peut aider à connaître ceux qui lui sont semblables, parce qu'une partie de ce qui est vrai de lui est également vrai des autres. Comme les fictions sont toujours plus ou moins semblables à des êtres réels, elles peuvent servir à les connaître. En imaginant des fictions, nous pouvons exercer et développer nos facultés de représentation et d'inférence sur des êtres typiques, fictifs mais suffisamment semblables à certaines réalités pour servir à la connaissance du réel.

La réflexion[modifier | modifier le wikicode]

Pour se préparer à l'action, connaître son environnement ne suffit pas, il faut aussi se connaître soi-même, ne serait-ce que pour connaître sa position et ses capacités.

La perception de son propre corps peut être considérée comme une sorte de perception de soi-même. Par exemple les informations fournies par les capteurs de tension musculaire permettent de construire un modèle interne du corps, de la position des membres et des efforts auxquels ils sont soumis.

Mais la connaissance de soi-même est plus que la perception de son corps, parce que l'âme est en permanence un témoin d'elle-même.

Si je vois que le ciel est bleu, je suis pas seulement informé sur l'état du ciel, je suis également informé sur moi-même, à savoir que je vois le ciel, je me connais moi-même en tant qu'être qui perçoit le ciel.

La réflexion est la connaissance de soi-même en tant qu'âme, c'est à dire en tant qu'être qui perçoit, imagine, ressent et veut.

La réflexion requiert-elle des organes sensoriels ? Y a-t-il une interface sensorielle entre le moi perçu et le moi qui perçoit ? Lorsque je sais que je vois le ciel, est-ce un œil introspectif qui me montre que je vois le ciel ?

Un organe sensoriel est toujours une interface entre un intérieur, le système nerveux, et un extérieur, l'environnement au delà de la peau ou le milieu intérieur en deçà. Les signaux extérieurs sont reçus par l'interface sensorielle et traduits en signaux intérieurs, utilisables par le système nerveux.

La réflexion ne requiert pas d'organe sensoriel parce qu'il n'y a pas de signaux extérieurs à traduire en signaux intérieurs, pas de séparation entre un moi qui perçoit et un moi perçu. Tout se passe à l'intérieur. Toutes les informations sur l'agent, en tant qu'il perçoit, qu'il imagine, qu'il ressent ou qu'il veut, sont déjà présentes à l'intérieur de l'agent. Pour développer ses facultés de réflexion il lui suffit d'exploiter ces sources intérieures d'information. Un organe sensoriel de réflexion n'est pas nécessaire parce que les informations recherchées sont déjà présentes à l'intérieur.

Pour se connaître soi-même il faut se percevoir soi-même, donc se représenter soi-même. Mais où trouve-t-on ce moi que l'on doit percevoir ? Et comment fait-il pour se représenter lui-même ?

La Joconde n'est pas seulement une représentation de Mona Lisa, elle est aussi une représentation de Léonard de Vinci, parce qu'elle porte beaucoup d'informations sur lui. Mes représentations n'apporte pas que des informations sur les êtres représentés, elles peuvent aussi en dire beaucoup sur ma façon de les représenter, et donc sur moi. Elles sont donc aussi des représentations de moi. Mes représentations du monde ne font pas que représenter le monde, elles représentent aussi le moi. On se connaît soi-même en connaissant sa relation à l'être qu'on se représente. Quand on se souvient, on sait qu'il s'agit d'une représentation du passé et on se connaît ainsi soi-même en tant qu'être qui se souvient.

La réflexion permet de développer un savoir muet sur le savoir, parce qu'on connaît le savoir en se connaissant soi-même comme un être qui sait.

La réflexion est fondamentale pour développer l'intelligence. Par exemple, un agent peut souvent imaginer comment agir avant d'agir. Dès qu'il anticipe correctement les résultats des actions qu'il pourrait entreprendre il se rend capable de les atteindre. En se connaissant lui-même comme un être qui imagine, donc en réfléchissant à ses capacités, il découvre comment les développer. Réfléchir à nos capacités nous rend capable.

La nature de la matière et la vérité de la perception[modifier | modifier le wikicode]

Lorsque nous percevons un objet avec nos sens nous croyons le connaître ainsi. Par exemple, si nous voyons que le mur est jaune, nous croyons naturellement qu'il est vraiment jaune. Mais n'est-ce pas une erreur ? Tout ce que nous savons c'est que nos yeux nous donnent une sensation de jaune. Le jaune semble être sur le mur mais il est surtout sur nos yeux. Il se pourrait même que le mur n'existe pas, que nous ayons seulement l'illusion d'un mur jaune. Faut-il en conclure que nous ne connaissons jamais le monde extérieur, que nous pouvons seulement connaître nos sensations et nous-mêmes, que la perception est toujours introspective ?

La nature de la matière est d'interagir avec la matière. Les propriétés d'un morceau de matière (particule élémentaire, atome, molécule, matériau solide, liquide ou gazeux...) sont toujours déterminées par ses façons d'interagir avec les autres morceaux de matière. La matière fait toujours ça, interagir avec la matière, et rien d'autre. Il n'y a rien de plus à connaître sur la matière que ses interactions. Quand on sait comment des êtres matériels interagissent, on sait tout ce qu'il y a à savoir sur eux.

On est sensible à un être quand il agit sur nos sens. Nos organes sensoriels sont spécialisés pour subir l'action des objets extérieurs. Ils ne suffisent pas pour connaître tous les êtres matériels et toutes leurs interactions, mais ils apportent tout de même beaucoup d'informations très utiles. Les instruments d'observation et de mesure, et tous les systèmes de détection que nous pouvons construire, sont comme des prothèses sensorielles. Ils étendent le champ de la perception. Ils nous font connaître des êtres matériels auxquels les sens ne sont pas directement sensibles. Ils nous révèlent d'autres formes d'action et de sensibilité.

La matière peut toujours être détectée parce que sa nature est d'interagir. Dès qu'elle agit sur un autre morceau de matière, celui-ci est un détecteur. Nos sens, complétés par tous les systèmes de détection concevables, nous permettent donc en principe de connaître tous les êtres matériels et toutes leurs propriétés. Rien ne peut rester caché. Tout peut être perçu, parce que la nature de la matière est d'être perceptible (Dugnolle 2017).

Le mur est vraiment jaune simplement parce qu'il est capable d'exciter la sensation de jaune sur nos yeux, ou sur tout autre détecteur sensible à la lumière jaune. Plus généralement toutes les qualités et toutes les relations qui déterminent l'existence d'un être matériel sont détectables par d'autres êtres matériels. Nous n'avons donc pas à craindre que la perception nous prive malicieusement de ce qu'elle semble nous donner, des représentations vraies des êtres perçus.

Mais cet argument en faveur de la vérité des perceptions semble prouver beaucoup trop, puisqu'il suggère que toutes les perceptions devraient être vraies. Si la qualité détectée est toujours la qualité d'être détectable ainsi, il s'en suit que toute détection est vraie, puisque ce qui est détecté est nécessairement détectable. Comment les fausses perceptions peuvent-elles alors exister ?

La possibilité de la fausseté vient de l'existence d'une norme de vérité. Si un instrument de mesure n'a pas été correctement étalonné, il fournit un résultat faux. Le résultat est faux seulement par référence à l'étalon de mesure. Il en va de même pour la perception. Elles ne peuvent être fausses que s'il y a une norme qui détermine ce qui doit être perçu. En l'absence de norme, elles sont toujours vraies, parce qu'elles révèlent toujours l'effet de l'objet sur nos sens. Même une perception fausse révèle une vérité sur l'objet, parce qu'il est vrai qu'il peut être ainsi perçu.

Chapitre suivant >>>


L'instinct, l'apprentissage et la mémoire

Qu'est-ce que l'apprentissage ?[modifier | modifier le wikicode]

Un agent a un savoir-faire lorsqu'il est capable de s'adapter à son environnement pour atteindre ses fins. Un savoir-faire est un comportement intelligent, ou une capacité à se comporter intelligemment.

Un savoir-faire est instinctif lorsqu'il est commun à tous les individus d'une même espèce et qu'il fait partie de leurs traits phylogénétiques, c'est à dire qu'il est transmis par une hérédité biologique commune (Lorenz 1981, Tinbergen 1951). Un tel savoir-faire apparaît naturellement au cours du développement normal des individus de l'espèce. C'est un savoir inné, même s'il se manifeste seulement longtemps après la naissance.

Pour qu'un savoir soit appris il faut que son acquisition passe par la mémorisation des expériences. Pour que les animaux soient capables d'apprendre il faut que leurs systèmes nerveux sont capables de conserver des traces de ce qu'ils ont vécu. Ce critère ne suffit pas pour distinguer l'appris de l'instinctif, parce qu'à peu près tous les comportements instinctifs apparaissent à la suite d'une période de maturation cérébrale, pendant laquelle l'expérience détermine la constitution des circuits neuronaux. La régulation des battements du cœur, par exemple, est instinctive, mais l'expérience des premiers battements est cruciale pour le développement ultérieur des réseaux de neurones qui les réguleront. De façon générale le développement du système nerveux est épigénétique, c'est à dire qu'il n'est pas déterminé seulement par les gènes mais aussi et surtout par l'expérience. En particulier, les synapses peuvent être modifiées par les signaux qu'elles transmettent. De cette façon une expérience de stimulation d'un réseau peut être déterminante pour son développement ultérieur. De même qu'en forgeant on devient forgeron, on devient capable de vivre en vivant.

Pour comprendre la différence entre l'inné et l'acquis, il faut considérer les différences de comportement. Celles-ci ont parfois une explication génétique, parce qu'il y a de petites différences génétiques entre les individus d'une même espèce. Mais le plus souvent les différences de comportement sont causées seulement, ou surtout, par des différences d'expérience. Nous disons alors qu'elles sont acquises ou apprises. Un comportement est appris lorsque ses particularités dépendent des particularités de l'expérience antérieure et non d'un héritage génétique. Pour nous les comportements appris sont les plus importants, parce que nos facultés naturelles et nos talents particuliers ne sont rien si nous n'apprenons pas à les développer.

L'instinct d'apprendre[modifier | modifier le wikicode]

Les facultés animales d'apprentissage sont elles-mêmes d'origine instinctive. Le savoir-apprendre est un savoir-faire et pour qu'il y ait apprentissage il faut qu'il y ait au préalable un savoir-apprendre instinctif. Nous pouvons apprendre à apprendre et donc acquérir du savoir-apprendre, mais nous ne pourrions pas apprendre si nous n'avions pas naturellement la capacité d'apprendre. Cet instinct d'apprendre repose sur la capacité des systèmes nerveux à profiter de leur expérience pour orienter leur développement.

La plasticité neuronale[modifier | modifier le wikicode]

Pour qu'il y ait mémorisation il faut un matériau plastique, c'est à dire capable de conserver des traces de son expérience (plastique s'oppose ici à élastique : un matériau élastique ne conserve pas de traces des déformations qu'il subit). Il semble que la plasticité des neurones est surtout celles de leurs synapses. L'expérience de transmission des signaux peut renforcer ou affaiblir une synapse (Kandel 1999). Elle peut également conduire à la formation d'autres synapses voisines qui connectent les mêmes neurones. De cette façon l'expérience des neurones modifie leur connectivité. De nouveaux réseaux peuvent être formés et de nouvelles fonctionnalités peuvent apparaître. Dans le même temps de nombreux neurones disparaissent, vraisemblablement parce qu'ils n'ont pas fait les preuves de leur utilité, parce que leurs synapses n'ont pas été renforcées par l'expérience.

Donald Hebb a proposé une règle simple qui explique de nombreux apprentissages neuronaux : deux neurones connectés renforcent leur connexion lorsqu'ils sont excités ensemble. C'est une sorte de renforcement par la réussite : lorsqu'un neurone A transmet un signal d'excitation à un autre neurone B, il n'est pas sûr de réussir. L'excitation de A à elle-seule n'est pas forcément suffisante pour déclencher l'excitation de B. Souvent il faut plusieurs signaux d'excitation en provenance d'autres neurones que A pour que B soit excité. La règle de Hebb énonce qu'une synapse d'un neurone excitateur est récompensée par la réussite. Elle est renforcée lorsque le neurone visé est vraiment excité.

Le développement des instincts[modifier | modifier le wikicode]

Pour qu'il y ait un savoir-faire il faut qu'il y ait un réseau de neurones fonctionnel, c'est à dire capable de se servir des signaux de la perception pour donner les signaux d'action appropriés. Le savoir-faire instinctif n'est pas appris, mais il est tout de même acquis, au sens où il apparaît au cours du développement naturel de l'individu. Comment les gènes peuvent-ils contrôler le développement d'un réseau de neurones fonctionnel ?

Le mystère du contrôle génétique du développement de l'organisme et de son système nerveux est partiellement élucidé : les gènes contrôlent le métabolisme (la synthèse et la dégradation des molécules de l'organisme) par l'intermédiaire de la synthèse des ARN et des protéines. La différenciation cellulaire dépend de l'activation de gènes particuliers qui synthétisent des protéines spécifiques au type cellulaire. Les gènes contrôlent la différenciation cellulaire en contrôlant la synthèse des ARN ou des protéines qui activent ou inhibent des gènes. Les propriétés des cellules et leurs interactions dépendent de leur type cellulaire. Les gènes peuvent ainsi contrôler la prolifération, la différenciation et la migration de toutes les cellules de l'organisme lors de son développement (Wolpert, Tickle & Martinez 2015). Pour les cellules nerveuses, ils peuvent aussi déterminer la migration des terminaisons de leurs axones et construire ainsi des réseaux de neurones. Mais ils ne contrôlent ainsi que le plan d'ensemble du système. La structure fine des connexions entre neurones est épigénétique, elle dépend de l'expérience. Là encore les gènes peuvent exercer une influence sur le développement, parce que la plasticité des synapses, la façon dont elles réagissent aux divers signaux qu'elles reçoivent, peut varier en fonction du type cellulaire.

La mémoire procédurale[modifier | modifier le wikicode]

La mémoire procédurale est la mémoire d'un savoir-faire appris. L'apprentissage d'un savoir-faire consiste à construire un réseau de neurones fonctionnel. Tant que le réseau est conservé, et qu'il reste fonctionnel, le savoir-faire est conservé. La mémoire procédurale est donc la conservation des réseaux de neurones fonctionnels construits par un apprentissage.

Un modèle neuronal pour la mémoire épisodique : les zones de convergence-divergence[modifier | modifier le wikicode]

La mémoire épisodique est la mémoire des souvenirs. Quand on se souvient on simule par l'imagination une expérience qu'on a déjà vécue. Comment un réseau de neurones peut-il accomplir une telle performance, enregistrer une expérience, la conserver et la reproduire par l'imagination ?

Une zone de convergence-divergence (ZCD) est un réseau de neurones, qui reçoit des projections convergentes en provenance des sites dont l'activité doit être mémorisée, et qui renvoie des projections divergentes vers ces mêmes sites (Damasio 1989, 2009). Lorsqu'une expérience est mémorisée, les signaux qui convergent sur la ZCD y excitent des neurones qui renforcent alors leurs connexions réciproques, en suivant la règle de Hebb, et forment ainsi un réseau auto-excitateur. Il suffit alors d'exciter à nouveau le réseau ainsi formé pour reproduire la combinaison de signaux initialement reçus. Dans un réseau auto-excitateur l'excitation d'une partie se propage à toutes les autres. De même un fragment de souvenir suffit pour réveiller l'intégralité d'une expérience mémorisée (Proust 1927). Une ZCD peut être ainsi un lieu d'enregistrement et de reproduction des souvenirs.

En plus des voies convergentes-divergentes, une ZCD peut être connectée au reste du cerveau de toutes les façons imaginables, par des signaux en entrée qui l'activent ou l'inhibent, et des signaux en sortie avec lesquels elle fait son effet sur le reste du système. En particulier les ZCD peuvent s'organiser en une arborescence. Une ZCD peut recruter en entrée des voies convergentes issues de nombreuses autres ZCD. Elle peut ainsi faire une synthèse des capacités de détection et de production de toutes les ZCD ainsi recrutées.

Pour faire un modèle du système des ZCD, on distingue dans le système nerveux une partie périphérique et une partie centrale. La périphérie réunit les régions dédiées à la perception, à l'émotion et à l'action. L'arborescence des ZCD est organisée d'une façon hiérarchique, de la périphérie vers le centre. Les ZCD les plus périphériques ont des voies convergente issues directement de la périphérie. On se rapproche du centre en remontant les arborescences de ZCD. On peut songer à des racines qui plongent dans la terre, la périphérie, et qui se rapprochent de la base du tronc, le centre. Mais dans le cerveau, il y a de très nombreux centres. Les ZCD les plus centrales ont des voies convergentes issues d'autres ZCD, et ne sont pas recrutées par des ZCD plus centrales. Le souvenir d'un épisode de notre vie pourrait être conservé par une telle ZCD centrale. Lorsque nous revivons les perceptions, les émotions et les actions d'une expérience passée, l'excitation de cette ZCD centrale activerait toutes les ZCD subordonnées, jusqu'aux aires périphériques, et simulerait ainsi l'expérience préalablement vécue.

Apprendre à percevoir[modifier | modifier le wikicode]

La perception est évidemment nécessaire pour agir sur le présent. Mais son effet ne s'arrête pas aux actions sur l'environnement perçu, parce que nous apprenons en permanence à partir de ce que nous percevons ou imaginons. Chaque expérience, réelle ou imaginaire, peut modifier nos façons de percevoir et d'imaginer.

Les réseaux de neurones dédiés à la perception de bas niveau, proche des organes sensoriels, sont vraisemblablement peu modifiables par l'expérience, dès qu'ils ont fini leur période de maturation initiale. Une fois qu'ils sont fonctionnels, ils ne doivent plus être modifiés, ou seulement un peu, parce qu'ils sont devenus nécessaires à l'accomplissement des fonctions de niveau supérieur. Si on modifie un réseau de bas niveau, on risque de perturber tous les réseaux de niveau supérieur qui se servent de lui.

Les agitations intérieures ressemblent parfois un peu aux mouvements d'un fluide, comme s'il y avait des forces de pression qui nous poussent à pervevoir, ou à imaginer. Pour expliquer comment nos expériences nous transforment on peut alors songer à la façon dont une rivière creuse son lit, au modelage des dunes par le vent, et plus généralement aux façons dont l'air, l'eau, ou tout autre fluide, peuvent modifier les solides au contact desquels ils s'écoulent. Les influx nerveux sont comme des courants fluides, les réseaux de neurones sont comme des canalisations dans lesquels ils s'écoulent et qu'ils peuvent creuser, élargir ou obstruer. Bien sûr ce n'est qu'une analogie. Les influx nerveux sont des courants électriques dans les neurones et à travers leurs membranes. Ils "creusent leur lit" dans les réseaux principalement en agissant sur leurs synapses.

Ce modèle de mémorisation fluide, où les influx nerveux peuvent modifier en permanence les voies dans lesquelles ils s'écoulent, ne peut pas suffire pour expliquer comment nous sommes transformés par nos expériences, parce qu'il donne une trop grande importance à l'oubli. Chaque nouvelle expérience pourrait effacer les traces laissées par les anciennes. Les souvenirs seraient comme des traces sur le sable d'une plage balayée par les vagues.

Notre mémoire fonctionne souvent d'une façon accumulative. Les souvenirs, les compétences et toutes les informations mémorisées sont acquis et conservés indépendamment les uns des autres. En général les nouveaux items mémorisés n'effacent pas les plus anciens. Comment les cerveaux développent de telles facultés de mémorisation est assez mystérieux. Les ZCD, qui requièrent au minimum la constitution d'un nouveau réseau, avec des neurones jusque là inutilisés, pour chaque nouvel item mémorisé, sont probablement une partie de l'explication, mais seulement une partie.

Nous apprenons à percevoir et à imaginer en apprenant à faire des inférences muettes à partir des informations fournies par les sens. Quand on mémorise une inférence muette, on retient une combinaison entre une condition et une conséquence. Pour cela il suffit en principe de conserver une liaison excitatrice entre le réseau qui représente la condition et celui qui représente la conséquence. Comme nos facultés d'inférence se développent d'une façon cumulative, il faut supposer que nos cerveaux savent construire de telles liaisons sans modifier les anciennes, qu'ils ont une mémoire qui ressemble parfois à celle des ordinateurs, où les liaisons entre les conditions, c'est à dire les adresses en mémoire, et les conséquences, les contenus conservés à ces adresses, sont apprises d'une façon cumulative.

Une expérience vécue réunit toujours de très nombreux éléments, d'une façon qui peut sembler parfois très désordonnée. Pour que l'inférence d'une condition à une conséquence soit légitime il ne suffit pas qu'elles aient été réunies lors d'une expérience, parce que leur association pourrait être fortuite. Comment reconnaissons-nous les inférences légitimes, celles qui augmentent vraiment notre savoir ? Par exemple de nombreux animaux savent identifier la cause de leur malaise s'ils ont ingéré un mauvaise nourriture. Qu'ils évitent d'en manger à nouveau montre qu'ils ont identifié correctement la source de leur souffrance. Mais comment font-ils ? De nombreuses autres perceptions ont précédé leur malaise. Pourquoi sélectionnent-ils comme cause précisément la nourriture et non les autres perceptions qui faisaient elles aussi partie de la même expérience ?

La perception ne s'arrête pas à la sensation. Elle construit des modèles de la réalité qui vont au delà du savoir fourni directement par les sens et qui guident l'identification des relations de condition à conséquence. Par exemple, nous reconnaissons les objets solides et leur attribuons spontanément des qualités de permanence. Nous savons qu'ils ne disparaissent pas et que leur forme reste inchangée, tant qu'il n'y a pas de cause capable de les faire disparaître ou de les déformer. Cette connaissance de la solidité est une source inépuisable d'inférences muettes, avec lesquelles nous connaissons le futur, le présent qui n'est pas perçu par les sens, et le passé qu'on n'a pas vécu. De façon générale nous savons naturellement percevoir des qualités de permanence, des relations de causalité, ou d'autres qualités et relations qui conduisent à des inférences légitimes. Nous savons naturellement identifier des causes et des effets, nous savons reconnaître ce qui agit et ce qui subit, nous percevons des traces et des signes annonciateurs... De telles facultés de perception alliées à la mémoire épisodique permettent de développer l'imagination déductive.

Nous savons instinctivement percevoir la causalité, ou d'autres qualités et relations qui conduisent à des inférences légitimes, seulement dans des cas simples, comme la solidité, l'action par contact ou la nourriture comme cause de malaise. De façon générale, l'identification correcte des inférences légitimes est un problème très difficile que notre savoir instinctif n'est pas capable de résoudre à lui seul. De fait nous sommes naturellement portés à percevoir des relations causales là où il n'y en a pas. Toutes les formes de superstition et de divagation montrent que nos facultés naturelles de perception de la causalité sont d'une fiabilité très limitée.

Le chapitre suivant montrera que nous pouvons choisir volontairement les inférences que nous appliquons pour interpréter nos perceptions. Nous pouvons nous servir de notre volonté pour apprendre à percevoir.


Chapitre suivant >>>


Les émotions, la volonté et l'attention

Les modules du cerveau et les comportements routiniers[modifier | modifier le wikicode]

Un module cérébral est un réseau de neurones spécialisé dans certaines tâches de traitement de l'information. Il a des voies d'entrée, où il reçoit des informations et des ordres, et des voies de sortie, où il émet lui-même des informations et des ordres. Il peut être très localisé (un petit noyau de neurones, une micro-colonne corticale...) ou assez étendu (un vaste réseau réparti sur plusieurs régions cérébrales). Il a des compétences qui lui sont propres et un mode de fonctionnement partiellement autonome.

L'activité cérébrale dans son ensemble résulte de l'activité coordonnée de tous les modules. Ils échangent des informations et des ordres et produisent ainsi toutes les représentations internes qui préparent l'action et tous les signaux qui la déclenchent et la contrôlent.

Un module cérébral peut être conçu comme un pilote automatique. Les pilotes les plus subordonnés sont les plus périphériques, les réseaux de neurones qui commandent les muscles et le reste du corps. Ces modules subordonnés sont commandés par d'autres modules, et ainsi de suite. Un module cérébral a toujours une compétence assez limitée. Il n'a accès qu'à une petite partie des informations disponibles dans le cerveau, et le répertoire des tâches qu'il peut accomplir est également limité. Mais les modules de niveau supérieur, c'est à dire ceux qui commandent au plus haut niveau les autres modules, sont capables en principe de mobiliser toutes les ressources du corps et de son cerveau. Un tel module est une sorte de chef dans le cerveau, un pilote automatique qui pilote les autres pilotes automatiques.

Un module peut représenter ses propres fins, donner des informations et des ordres aux autres modules, ou en recevoir, et participer ainsi au bon fonctionnement de l'organisme. L'activité spontanée des modules suffit pour expliquer les comportements routiniers qui résultent des instincts ou de l'apprentissage. Les ressources nécessaires sont recrutées automatiquement et accomplissent leurs tâches comme elles en ont l'habitude. Il peut y avoir un chef qui dirige provisoirement la marche de l'ensemble, ou plusieurs, ou aucun, parce que les modules peuvent travailler séparément et coordonner spontanément leurs activités.

Les émotions[modifier | modifier le wikicode]

Le concept d'émotion est difficile à définir et son usage est souvent très imprécis. Faut-il distinguer les humeurs et les émotions, les humeurs parce qu'elles sont durables, les émotions parce qu'elles sont brèves ? La tranquillité est-elle une émotion ou une indépendance vis à vis des émotions ? La jalousie est-elle une émotion ou un état plus complexe qui mêle émotions et volonté ?

On peut définir les émotions à partir de quelques émotions de base (la tristesse, la peur, la colère, le dégoût, la honte, la joie, l'apaisement, la fierté, la surprise...) et inclure toutes les variations et les combinaisons, ou à partir de quelques caractères généraux :

  • Une émotion est déclenchée par la détection de conditions spécifiques, la peur par la détection du danger, la tristesse par la détection du malheur, la colère par la détection de l'inacceptable...
  • Cette détection est suivie très rapidement de réactions réflexes et de modifications physiologiques qui permettent à l'organisme de s'adapter à la nouveauté de sa situation.
  • Les émotions déterminent des motivations, c'est à dire des désirs ou des aversions. Elles nous indiquent les buts qui méritent d'être poursuivis, et ce que nous devons fuir ou éviter (Damasio 1994). Elles sont donc très importantes pour la volonté, parce qu'elles nous servent à évaluer nos projets, et pour l'apprentissage, parce qu'elles signalent ce qui mérite d'être mémorisé.

Parce qu'elle est déclenchée par des conditions spécifiques et parce qu'elle provoque des réactions spécifiques, une émotion particulière, telle que la peur, peut être caractérisée par l'activité d'un module cérébral, ou d'un système de modules qui coordonnent leurs activités. Les voies d'entrée portent les signaux qui éveillent, modifient ou suppriment l'émotion. Les voies de sortie portent les signaux qui provoquent les réactions émotionnelles typiques (LeDoux 1996). Comme une émotion peut mobiliser une grande partie des ressources de l'organisme, un tel système émotionnel peut être considéré comme une sorte de chef dans le cerveau. Une émotion, surtout si elle est forte, peut exercer une sorte d'empire sur toute l'activité corporelle, intérieure et extérieure.

Émotion et cognition sont parfois pensées en opposition, mais c'est une erreur. Les émotions produisent et utilisent des représentations internes qui préparent à l'action, elles font donc partie de la cognition. Elles sont de précieuses informatrices sur les réalités extérieure et intérieure.

Toutes les émotions de base sont originellement bonnes, parce qu'elles nous aident à vivre. Les circuits cérébraux à l'origine des émotions sont comme tous les organes. S'ils ne nous aidaient pas à survivre et à nous reproduire, ils n'auraient pas été retenus par la sélection naturelle.

La prise de décision et l'autonomie de la volonté[modifier | modifier le wikicode]

Lorsque nous voulons, nous nous représentons consciemment des buts et des façons de les atteindre avant d'avoir agi. Nos comportements et nos actions volontaires sont connus, au moins dans leurs intentions initiales, avant d'être exécutés. C'est pourquoi nous les reconnaissons plus volontiers comme les nôtres que des réactions réflexes ou d'autres comportements involontaires.

La volonté requiert la capacité de se décider sur les buts que l'on poursuit et les règles auxquelles on obéit. Un comportement est volontaire lorsqu'il poursuit des buts que nous avons décidés. Une règle à laquelle on obéit peut être considérée comme une sorte particulière de but. Le but est d'obéir à la règle. Il est atteint tant qu'on obéit.

Pour qu'il y ait véritablement une volonté, la capacité à se représenter les buts que l'on poursuit ne suffit pas, il faut surtout avoir la capacité de se représenter des buts que l'on ne poursuivra pas. Si la décision consiste simplement à suivre toutes les envies qui se présentent, il ne s'agit pas d'une véritable volonté, parce qu'il manque le moment d'indécision où les diverses options sont représentées et évaluées avant d'être choisies ou rejetées. Et la volonté se manifeste souvent davantage par la capacité à renoncer à des buts que par la capacité à les atteindre.

Comme les systèmes émotionnels évaluent les buts sur lesquels nous nous décidons, on peut songer à un modèle de la volonté qui la réduit à un rôle de servante des émotions. La prise de décision volontaire pourrait consister simplement à soumettre un projet aux systèmes émotionnels puis à compter leurs évaluations. Si les avis favorables l'emportent nettement sur les autres alors la décision est prise. La volonté ainsi conçue serait hétéronome, elle ne ferait qu'obéir à une loi extérieure, celle des émotions.

La volonté est autonome lorsqu'elle se donne sa propre loi. Elle est autonome dans ses évaluations lorsqu'elle prend ses décisions à partir de règles ou de critères d'évaluation qu'elle a elle-même décidés.

Les buts sur lesquels nous nous décidons peuvent être suggérés par les systèmes de la perception et de l'émotion indépendamment de tout contrôle volontaire. Dans de tels cas la volonté a seulement à donner son accord pour des projets qu'elle n'a pas élaborés. Tout ce qu'on lui demande est de donner sa signature. Mais nous pouvons aussi décider d'élaborer des projets sur lesquels nous nous déciderons ultérieurement. La volonté est autonome dans son exécution lorsqu'elle décide d'élaborer les projets qu'elle soumettra à ses évaluations.

Un système autonome dans ses évaluations et son exécution est capable de poser et résoudre des problèmes.

La résolution de problèmes[modifier | modifier le wikicode]

Poser un problème consiste à se donner une fin, un but, un objectif. On a résolu le problème quand on a atteint la fin qu'on s'est fixée ou quand on sait comment l'atteindre. La fin recherchée et éventuellement la situation initiale sont les conditions du problème.

Une fin est déterminée avec un système de détection qui permet de reconnaître si la fin est atteinte ou non. Une fin est donc toujours un concept.

Une décision à prendre est un problème. Le but est intérieur. Il s'agit simplement de prendre la décision, adoption ou rejet du projet. Un tel problème de décision est déterminé par le projet examiné et par des critères d'évaluation. La fin recherchée est que ces critères soient satisfaits. Dès que les critères d'évaluation sont bien déterminés, un problème de décision est en principe facile à résoudre. Il suffit de détecter si les critères sont satisfaits. Dans ce cas particulier, il n'y a que deux possibilités à examiner, adoption ou rejet, mais si le nombre de possibilités à examiner est très grand, ou infini, savoir détecter si la fin recherchée est atteinte ou non ne suffit pas pour résoudre le problème, parce qu'on ne peut pas examiner toutes les possibilités.

La solution d'un problème consiste en général à réunir des moyens pour atteindre la fin recherchée. Les possibilités de composer les moyens les uns avec les autres font que l'espace des possibilités de solution est en général a priori illimité. On peut toujours inventer de nouvelles compositions.

Les moyens sont des fins intermédiaires, puisque pour atteindre une fin, il faut d'abord se donner pour but de réunir les moyens.

Un problème est pratique lorsque l'objectif est de transformer la réalité observable. Un problème est cognitif lorsque l'objectif est de produire des représentations. La solution d'un problème pratique est obtenue quand on agit, tandis que la solution d'un problème cognitif est obtenue quand on imagine. Le savoir-résoudre des problèmes cognitifs est une compétence fondamentale, tout simplement parce qu'il faut souvent imaginer ce qu'on va faire avant de le faire.

Poser et résoudre des problèmes cognitifs est une façon d'agir sur soi-même. On ne se donne pas pour but de transformer la réalité extérieure mais seulement de trouver des représentations intérieures.

Quand on doit imaginer ou dire ce qu'on va faire avant d'agir, on remplace un problème pratique par un problème cognitif : trouver une représentation de l'action ou du programme d'actions qui résout le problème pratique initial. Au lieu d'agir on cherche seulement à imaginer l'action. On remplace l'objectif pratique par un objectif cognitif. On peut alors explorer par l'imagination l'espace des possibilités de solution. On peut ainsi résoudre de nombreux problèmes sans quitter son fauteuil. Bien sûr, on a besoin de savoir anticiper afin de déterminer par l'imagination si une séquence d'actions est faisable et si elle permet d'atteindre le but. Lorsque le savoir acquis au préalable est suffisant, l'imagination seule, sans l'action, permet de trouver des solutions. Grâce à l'imagination le savoir déjà acquis est un tremplin pour acquérir davantage de savoir.

L'innovation[modifier | modifier le wikicode]

Les modules cérébraux sont en général spécialisés dans la résolution de problèmes particuliers. Ils peuvent résoudre les problèmes auxquels ils sont naturellement consacrés, des problèmes qu'ils se posent ou qui leur sont posés.

Lorsque leurs comportements sont routiniers, les agents n'ont pas besoin de chercher longtemps des solutions. Ils les trouvent spontanément parce que leurs modules cérébraux savent comment les produire, par instinct ou par habitude. Les agents se contentent de résoudre les problèmes qu'ils savent déjà résoudre. Mais face à une situation nouvelle, les réactions habituelles ne sont pas toujours adaptées. Il se peut que l'agent dispose des ressources intérieures nécessaires pour réagir comme il convient, mais qu'il ne sache pas les mobiliser, parce qu'il lui faudrait pour cela inventer un nouveau mode de coordination entre ses modules cérébraux. Aucun d'entre eux n'a les moyens de recruter les autres, alors qu'il suffirait qu'ils travaillent ensemble pour atteindre les fins recherchées. L'agent aurait besoin d'un compositeur-chef d'orchestre intérieur, capable de trouver des solutions vraiment nouvelles. Le pouvoir de composer est créateur de valeur parce que la valeur de ressources coordonnées peut être supérieure à la somme des valeurs des ressources séparées.

Le hasard suffit pour innover. Un programme d'actions choisies au hasard est en général très innovateur, très différent de ce qui est prescrit par l'instinct ou l'habitude. Mais évidemment le hasard seul est rarement suffisant pour trouver de véritables solutions. Il faut en général du savoir, des compétences, pour concevoir des possibilités prometteuses, et trouver parmi elles celles qui méritent d'être retenues. La connaissance est très généralement un préalable nécessaire à l'innovation.

Pour expliquer nos facultés d'innovation, on est tenté de postuler l'existence de modules innovateurs. Mais cela ressemble à une croyance aux prodiges surnaturels. Comment des réseaux de neurones, même très sophistiqués, pourrait-il inventer tout ce que nous inventons ? Où donc pourrait-il trouver leurs idées ? Il n'y a que des neurones qui s'excitent ou s'inhibent les uns les autres. Il semble qu'il n'y ait rien qui puisse jouer le rôle d'une source pour des idées nouvelles. Comment un réseau de neurones pourrait-il acquérir des connaissances, les conserver, et s'en servir pour trouver des solutions nouvelles à des problèmes nouveaux ?

Des réseaux de neurones assez simples peuvent être dotés de telles facultés. Ils mémorisent des connaissances en modifiant les connexions entre neurones. On peut leur soumettre des problèmes en activant leurs voies d'entrée. Ils produisent des solutions sur leurs voies de sortie. Et ils sont très capables d'innover (David E. Rumelhart, James L. McClelland & PDP Research Group 1986). La conception de réseaux de neurones est une méthode très puissante pour résoudre de très nombreux problèmes.

Une administration centralisée sans administrateur central[modifier | modifier le wikicode]

Pour que les buts et les règles que nous avons décidés volontairement puissent mobiliser nos ressources intérieures, il faut qu'ils soient conservés en mémoire de travail. Certains modules doivent être être spécialisés dans l'enregistrement de nos décisions et la distribution des ordres qui en résultent. La décision mémorisée est utilisée pour envoyer des ordres à tous les modules concernés par l'exécution de cette décision, tant que le but n'est pas atteint, ou qu'on n'a pas renoncé. Les modules qui mémorisent nos décisions volontaires sont des donneurs d'ordres. On peut donc les appeler des modules exécutifs. Les autres modules cérébraux sont subordonnés à ces modules exécutifs.

Les modules exécutifs ne sont pas des innovateurs. Ils se contentent d'enregistrer des décisions prises ailleurs et de distribuer automatiquement les ordres qui les appliquent. Ce ne sont pas des homoncules, ou des petits génies dans la tête, mais seulement des circuits neuronaux capables d'enregistrer les décisions reçues sur leur voies d'entrée, et de donner ensuite les ordres qui les appliquent sur leurs voies de sortie. Il s'agit seulement de traitement de l'information, pas de mettre des esprits dans la machine.

Les décisions volontaires sont prises à partir de l'activité des ressources de la perception et de l'imagination, de l'émotion et de l'action. Certains modules font des propositions, d'autres donnent des évaluations, et finalement ces évaluations sont synthétisées afin qu'une décision soit prise. Tous ces modules obéissent à un ordre intérieur commun, qu'ils contribuent tous à définir. Nos projets volontaires sont proposés, élaborés et évalués par l'ensemble de nos ressources intérieures, et une fois adoptés, ils s'imposent à ces mêmes ressources intérieures, qui doivent obéir aux ordres qui leur sont donnés. Mais il n'y a pas de chef. Les modules exécutifs ne font qu'enregistrer des décisions prises par la collectivité. Eux aussi ne font donc qu'obéir à l'ordre commun. C'est une administration centralisée sans administrateur central.

Les dispositifs d'évaluation à l'origine des décisions obéissent aux modules exécutifs et donc aux décisions prises antérieurement, ce qui rend la volonté autonome dans ses évaluations. Les ressources de la perception et de l'imagination à l'origine des propositions évaluées obéissent elles aussi aux modules exécutifs, ce qui rend la volonté autonome dans son exécution. Ce modèle du fonctionnement cérébral, une administration centralisée sans administrateur central, permet donc d'expliquer l'autonomie de la volonté.

Ce modèle invite à rechercher des analogies entre le fonctionnement du cerveau et les sociétés humaines. Tout ce que nous apprenons sur une société humaine, comment elle s'organise, comment elle est unie et aussi parfois désunie, peut nous apprendre beaucoup sur les cerveaux, comment ils marchent et comment aussi parfois ils ne marchent pas, ou pas très bien. Inversement tout ce que nous comprenons sur notre fonctionnement intérieur, ou sur nos dysfonctionnements, peut nous aider à comprendre les sociétés dans lesquelles nous vivons.

En expliquant l'autonomie de la volonté, le modèle d'administration centralisée sans administrateur central explique pourquoi le moi est comme une boucle étrange (Hofstadter 2007). Je peux décider des critères d'évaluation de mes décisions, parce que la volonté est autonome dans ses évaluations. Je peux aussi décider des objets sur lesquels porteront mes prochaines décisions, parce que la volonté est autonome dans son exécution.

L'attention et la conscience[modifier | modifier le wikicode]

Nos modules exécutifs, responsables de l'application de nos décisions volontaires, sont nécessairement en nombre limité. Leurs ressources en mémoire sont également limitées. C'est pourquoi l'ordre intérieur de buts et de règles qui dirigent notre comportement est d'une complexité limitée. Nous ne pouvons pas faire volontairement trop de choses à la fois.

Les modules exécutifs sont précédés de dispositifs d'évaluation qui modifient et renouvellent en permanence les buts que nous nous fixons. Ces capacités d'évaluation sont également limitées. Nous ne pouvons pas prendre une multitude de décisions en même temps. Chaque proposition doit être examinée à son tour.

L'attention est la sélection des représentations utilisées lors de l'évaluation en vue d'une décision volontaire.

Nous prenons des décisions volontaires plusieurs fois par seconde, à chaque fois que nous réagissons à ce qui attire notre attention. Même ne pas réagir parce qu'une nouvelle information est sans intérêt est une sorte de décision volontaire. Nous approuvons volontairement que l'information est sans intérêt, ce qui est déjà une décision, et en outre nous décidons de ne pas réagir. Toutes les informations dont nous prenons conscience sont toujours utilisées pour prendre des décisions, ne serait-ce que la décision de les ignorer. C'est pourquoi une théorie de l'attention est en même temps une théorie de la conscience.

On fait attention à ce qu'on perçoit, à ce qu'on imagine, à ce qu'on ressent et à ce qu'on fait de très nombreuses façons, parce que les informations sélectionnées peuvent être utilisées de très nombreuses façons. Une information prioritaire dans le processus d'évaluation qui conduit à la décision fait l'objet d'un degré d'attention plus élevé que si elle joue un rôle secondaire. Pour développer la théorie de l'attention et de la conscience, il faut étudier comment les dispositifs d'évaluation qui précèdent la décision volontaire sélectionnent et utilisent leurs sources d'informations.

L'imagination et le contrôle volontaire de l'attention permettent à la volonté de fonctionner en circuit fermé, parce qu'elle peut décider elle-même des informations à partir desquelles elle prend de nouvelles décisions. On peut ainsi être concentré sur ce qu'on imagine et se sentir comme coupé du monde. Mais un tel isolement n'est jamais complet. Un événement inattendu suffit pour nous sortir de notre méditation et capturer notre attention. Les informations sur l'événement inattendu, évaluées en vue d'une décision volontaire, ont été sélectionnées par un processus involontaire (Lachaux 2011). La volonté est autonome et peut décider elle-même de ce qui retient son attention, mais pas au point de se soustraire complètement aux influences extérieures.

Les croyances[modifier | modifier le wikicode]

Nos décisions ne portent pas seulement sur des projets mais aussi sur des croyances. Lorsque les perceptions laissent une place pour le doute, nous pouvons décider de croire ou non ce que nous percevons. Nous pouvons aussi douter de ce que nous imaginons et choisir de ne pas le croire.

Une croyance est une représentation que l'on tient pour vraie après en avoir pris conscience.

Pour devenir une croyance, une représentation doit retenir l'attention. Après avoir été évaluée et approuvée, elle est prise en charge par le système exécutif qui la conserve en mémoire de travail, informe les subordonnés concernés et l'utilise ainsi pour contrôler la perception, l'imagination et leur évaluation.

Tant qu'elle est conservée en mémoire de travail, une croyance est active et peut faire de l'effet, par l'intermédiaire du système exécutif, sur l'ensemble du fonctionnement cérébral. On retrouve ainsi un élément de la théorie cognitive de la conscience de Baars (1988). Tant qu'une représentation ne retient pas l'attention consciente, elle reste attachée à son lieu de production et ne peut pas faire d'effet sur l'ensemble du système. Son effet est nécessairement limité. Mais si on en prend conscience, elle peut être utilisée pour influencer toutes les parties du cerveau contrôlées par le système exécutif. Quand elle est en mémoire de travail elle est comme écrite sur un tableau noir qui peut être lu par les modules cérébraux, elle devient une connaissance utilisable par tous les agents intérieurs subordonnés au système exécutif.

Après être restées actives un moment en mémoire de travail, les croyances sont en général enregistrées et consolidées en mémoire à long terme, où elles demeurent comme des croyances dormantes, ou latentes. Elles sont réveillées si nous nous les remémorons.

Même dormantes les croyances peuvent avoir beaucoup d'effet sur notre activité intérieure, parce que nos remémorations dépendent de toutes nos croyances dormantes. Même si elle n'est pas réactivée, une croyance dormante peut contribuer à l'activation d'une autre croyance, ou au contraire, empêcher cette remémoration.

Une croyance dormante peut être réactivée à notre insu si elle ne retient pas notre attention ou si une autre croyance nous empêche de la lui accorder.

Les associations et les inférences muettes suffisent pour qu'une croyance réactivée nous fasse de l'effet, même si nous lui refusons notre attention. Elle peut activer d'autres croyances et éveiller des émotions sans être prise en charge par le système exécutif, simplement par associations, mais alors elle n'a pas accès aux ressources de la volonté et son effet reste subreptice.

Lorsque nous faisons attention à une croyance, nous pouvons mobiliser toutes les ressources de la volonté pour la modifier, la compléter ou la critiquer, et l'intégrer au système de toutes nos autres croyances. En particulier nous pouvons nous en servir pour former et retenir des inférences, où elle apparaît comme condition, ou comme conséquence. Nous pouvons ainsi nous servir de la conscience pour développer nos facultés d'interprétation, donc pour apprendre à percevoir.

Le simulateur universel[modifier | modifier le wikicode]

Un esprit est capable d'imaginer les autres esprits, c'est à dire qu'il se met à leur place, qu'il simule par l'imagination ce qu'ils perçoivent, ce qu'ils ressentent, ce qu'ils croient et ce qu'ils veulent. Un esprit est un simulateur universel parce qu'il peut simuler tous les autres esprits, au moins s'ils sont dotés des mêmes facultés - pour un être humain il est plus facile de se mettre à la place d'un être humain que d'une chauve-souris.

L'universalité de l'imagination est rendue possible par l'autonomie de la volonté. Pour se mettre à la place d'autrui il suffit d'imaginer qu'on veut ce qu'il veut. On se donne volontairement sa volonté comme si elle était la nôtre.

Le savoir éthique muet[modifier | modifier le wikicode]

Le savoir éthique consiste à évaluer les actions, les comportements et leurs fins.

Pour être intelligent, il ne suffit pas de savoir atteindre des buts, il faut surtout savoir qu'ils méritent d'être poursuivis, ou au moins qu'ils ne sont pas à craindre. L'éthique est donc le savoir le plus important.

Comme les émotions servent à évaluer les actions, elles produisent un savoir éthique. Comme la volonté est autonome dans ses évaluations, elle peut dépasser le savoir éthique purement émotionnel. Le savoir éthique muet est le savoir-évaluer qui résulte des émotions et de la volonté.

Un savoir éthique peut être défini comme le savoir d'un idéal, parce qu'un système d'évaluation détermine un idéal. Est idéal, ou proche de l'idéal, ce qui est évalué positivement. Est contraire à l'idéal ce qui est évalué négativement.

Pour qu'un idéal existe et soit connu, il suffit de le penser comme un idéal, comme un critère d'évaluation de nos actions. Il existe en tant qu'idéal, tout simplement parce qu'il est vrai que nous l'avons adopté.

Pour qu'un savoir éthique soit vrai il suffit que ce qu'il évalue positivement nous satisfasse vraiment et que ce qu'il évalue négativement nous déplaise vraiment. Ainsi conçue la vérité éthique est relative, parce que ce qui satisfait les uns ne satisfait pas forcément les autres. Mais la suite de ce livre montrera que la raison permet de développer un savoir éthique universel.

Le ça, le moi et le surmoi[modifier | modifier le wikicode]

On est un moi quand on est conscient et volontaire, quand on a conscience de ce qu'on perçoit, de ce qu'on imagine, de ce qu'on ressent et de ce qu'on veut. Le modèle d'administration centralisée sans administrateur central explique comment le cerveau fait exister le moi, parce qu'il explique la volonté et l'attention.

Le surmoi est l'idéal du moi, ce qu'il croit devoir être ou ce qu'il voudrait être. Il est construit par le moi qui se donne des critères d'évaluation de lui-même. Il résulte donc de l'autonomie de la volonté. Comme nous devons nous adapter à la société dans laquelle nous vivons, nous construisons notre surmoi en intériorisant les valeurs que la société nous invite à adopter.

La volonté se donne des critères d'évaluation d'elle-même, en décidant des critères d'évaluation de ses décisions. Une telle boucle fait qu'on peut dire à la fois que le moi fait le surmoi et que le surmoi fait le moi.

Le ça est la machine intérieure, tout ce qui en nous est mécanique, ou automatique, et involontaire. L'activité du ça inclut toute l'agitation intérieure, sauf l'activité volontaire. Le ça est pour sa plus grande part inconscient, parce que nous ne pouvons pas avoir conscience de tout ce qui se passe dans le cerveau. Mais il n'est pas complètement inconscient. On peut le comparer à un océan dont on peut observer les vagues mais pas les profondeurs. Si nous portons notre attention sur notre intérieur, sur ce que nous ressentons, percevons, imaginons et désirons, nous pouvons parfois prendre conscience des automatismes qui nous agitent intérieurement (Freud 1923).

Tout ce qui est vivant manifeste toujours le désir de vivre, même lorsqu'il est mécanique, ou automatique. C'est pourquoi on peut aussi comparer le ça à une sorte d'animal intérieur, plutôt qu'à une machine. Mais il ne faut pas le doter d'une volonté unifiée. Seul le moi a les moyens de se donner une telle volonté, en construisant son surmoi.

Si on compare l'organisation psychique à une société humaine, le moi est l'État, l'idéal du moi est l'idéal de l'État tel qu'il est affirmé dans la Constitution et dans toutes les déclarations officielles, le ça est la société civile. Les modules exécutifs sont tous les agents de l'État qui lui permettent d'imposer ses décisions. Les modules concepteurs et évaluateurs sont tous les citoyens, fonctionnaires ou non, qui participent à la conception et à l'évaluation des décisions prises au nom de l'État. Une information dont nous prenons conscience parce qu'elle retient notre attention est une information prise en compte lors de l'évaluation qui conduit aux décisions étatiques. Les informations inconscientes sont celles qui restent ignorées par l'État lors de ses évaluations. Les croyances sont ce que l'État déclare officiellement être vrai.

Comme toute analogie, celle-ci a ses limites. En particulier elle n'est pas très flatteuse pour la société civile, parce que le ça n'est pas toujours très honorable, et qu'on peut espérer que le moi le soit davantage. Mais si on se sert de cette analogie pour dévaloriser la société civile et promouvoir l'État, on n'en fait évidemment pas un bon usage. Pour expliquer les bases cérébrales de l'organisation psychique, elle est une excellente analogie, parce qu'elle nous aide à comprendre l'organisation d'un système très complexe. Mais comme toute théorie, elle peut être interprétée et à tort et à travers.

Avons-nous toujours conscience de ce que nous voulons ?[modifier | modifier le wikicode]

Nous prenons continuellement et rapidement des décisions, plusieurs fois par seconde, à chaque fois que nous réagissons à ce dont nous prenons conscience ou que nous choisissons de ne pas réagir. La plupart de ces décisions sont prises trop rapidement pour qu'on ait le temps d'y penser et de les anticiper. Nous découvrons en vivant ce que nous décidons. En général nous ne le savons pas d'avance. Nous sommes en même temps acteurs et spectateurs de nous-mêmes. Et nous ne sommes pas forcément mieux placés que les autres pour comprendre ce que nous faisons et ce que nous voulons. Nous avons conscience de ce que nous avons décidé, mais nous n'avons pas forcément conscience des motivations qui sont à l'origine de nos décisions.

Les décisions les plus importantes, celles qui nous engagent le plus, ne sont normalement pas prises à la légère. On prend le temps de se décider. On décide de ne pas décider avant d'avoir pris le temps d'y réfléchir. Nous pouvons donc avoir davantage conscience de ce que nous décidons et nous sentir actifs plus que réactifs. Mais même lorsque nos décisions ont été longuement méditées, nous ne connaissons pas toujours leurs motivations profondes.

Les désirs inconscients[modifier | modifier le wikicode]

Nos émotions déterminent nos désirs. Est désirable tout ce que nos émotions nous poussent à désirer. Ainsi défini le désir n'est pas nécessairement conscient. Pour qu'un désir devienne conscient, nous devons faire attention à nos émotions et prendre conscience de ce qui les anime.

Nos décisions déterminent notre volonté. On veut quand on a pris une décision qu'on n'a pas oubliée. Ainsi définie la volonté commence toujours par être consciente. Nous avons conscience de ce que nous voulons au moment où nous le décidons et quand nous nous souvenons de nos décisions. Mais une volonté qui a d'abord été consciente peut devenir inconsciente, lorsque nous oublions ce que nous avons voulu.

Le système exécutif fait la volonté. Le système émotionnel fait les désirs. Les désirs deviennent conscients seulement si nous faisons attention à nos émotions. Ils deviennent volontaires seulement si nous décidons de les approuver. Mais on peut vouloir ce qu'on ne désire pas, si on l'a décidé, et ne pas vouloir ce qu'on désire, en le sachant ou sans le savoir.

Les désirs restent inconscients si nous les refoulons (Freud 1915), c'est à dire que nous refusons d'en prendre conscience et donc de les satisfaire volontairement. Le refoulement des désirs est une conséquence de l'autonomie de la volonté. Nous pouvons contrôler notre attention et refuser d'écouter nos émotions lorsqu'elles éveillent des désirs qui nous dérangeraient si nous en prenions conscience. Ce refoulement révèle un conflit entre le désir et la volonté, entre le ça et le surmoi. Le surmoi se comporte comme un censeur qui rejette dans l'inconscient les propositions du ça qui le dérangent. On peut nier qu'on désire ce qu'on désire afin de croire être ce qu'on croit devoir être.

Désir et volonté sont étroitement reliés, à la fois parce que les désirs forment la volonté et parce que la volonté forme les désirs. Nous sommes poussés à vouloir ce que nous désirons mais nous sommes aussi poussés à désirer ce que nous voulons. Nos croyances et nos buts volontaires font partie des causes de nos émotions. Il y a du plaisir à atteindre un but, quel qu'il soit, dès qu'on se l'est fixé, et parfois un très fort déplaisir à ne pas l'atteindre. Les relations entre les émotions, les désirs et la volonté peuvent être très complexes, tantôt harmonieuses et tantôt conflictuelles. Il peut y avoir des conflits entre des émotions, entre une émotion et un but volontaire, et entre des buts volontaires.

Le surmoi est en général conscient, parce que nous savons ce que nous voulons, mais il peut devenir en partie inconscient (Freud 1923), parce qu'il peut être en contradiction avec lui-même, parce que nous pouvons nous donner des valeurs incompatibles. Une partie du surmoi peut être évincée et niée par une autre partie. Même ainsi refoulée, elle peut continuer à agir en coulisses, mais elle n'a plus accès aux ressources de la conscience et de la volonté.

Une version un peu fausse de la psychologie des profondeurs enseigne que le moi est pris dans un conflit entre le ça et le surmoi qui oppose les désirs charnels aux nobles aspirations spirituelles. C'est un peu faux parce que le ça ne se réduit pas aux désirs charnels, parce que le surmoi n'est pas toujours très noble, et surtout parce que les conflits internes peuvent être beaucoup plus complexes que cette simple opposition, qui n'est pas nécessairement conflictuelle.

Le ça inclut tout ce qui est automatique et involontaire, pas seulement les désirs charnels. Comme nos croyances font de l'effet même lorsqu'elles restent dormantes, elles font partie du ça, même les croyances sur nos plus nobles aspirations. Nous sommes mus par les idées d'une façon qui n'est pas toujours volontaire. Le surmoi et le moi sont enracinés dans le ça. Ils ne pourraient pas exister sans lui.

Fausse conscience et savoir inconscient[modifier | modifier le wikicode]

Même quand nos observations nous montrent clairement la vérité, nous pouvons souvent en douter, parce que nous pouvons croire que les faits ont été mal perçus ou mal interprétés, ou qu'une erreur s'est glissée quelque part, on ne sait où. Quand nous voulons ne pas croire des vérités pourtant assez clairement observées, il est donc en général facile de le faire. Il faudrait vraiment que des preuves flagrantes et irréfutables nous soient mises sous le nez pour nous obliger à y croire. Mais souvent on n'a pas de telles preuves, on ne les cherche pas, et celles que nous avons laissent une place pour le doute, même si elles sont très bonnes. L'autonomie de la volonté nous permet donc de nier des vérités que pourtant nous connaissons (Freud 1915). Le déni nous permet en particulier de refouler nos désirs, parce que pouvons nier ce que nous ressentons en refusant de l'écouter.

L'affirmation et la négation ne portent pas seulement sur des croyances verbales, formulées avec des mots. Nous pouvons percevoir qu'un être a ou n'a pas une qualité même si nous n'avons pas de mot pour la dire. Le déni prend beaucoup d'importance quand nous développons un savoir parlant, mais il peut exister même en l'absence de pensée formulée avec des mots.

Lorsqu'un savoir est acquis par nos systèmes de perception, il vient avec une force intrinsèque, qui dépend de son mode d'acquisition et qui nous permet de l'évaluer. Est-ce une bonne observation, parce que nous étions bien placés pour observer, ou seulement une interprétation douteuse d'événements mal compris ? Lorsque nous décidons de croire ou de ne pas croire, nous tenons compte de cette force intrinsèque de la perception, mais aussi de ce que nous voulons croire. Lorsque nous nions la vérité, nous ne lui faisons pas perdre pour autant sa force intrinsèque, parce que celle-ci ne dépend que de la façon dont la vérité a été perçue. Le déni, le refus de reconnaître la vérité, n'empêche pas la mémorisation du savoir perçu et ne lui fait pas perdre sa force intrinsèque, il ne fait qu'empêcher la conscience de travailler avec lui. Si on nie la vérité, on ne peut pas s'en servir pour réfléchir.

Si finalement on accepte de reconnaître une vérité qu'on a toujours niée, on se dit qu'on l'a toujours sue.

La fausse conscience, qui résulte du déni, entretient ses illusions. Ce n'est pas nécessairement mauvais, puisque les illusions peuvent nous motiver et nous faire entreprendre de bons projets que nous n'aurions pas adoptés sans elles, mais c'est quand même un problème, puisque les illusions nous empêchent de nous adapter à la réalité.

Prisonniers des schémas[modifier | modifier le wikicode]

Les schémas, les cadres conceptuels, c'est à dire les systèmes de préconceptions, ont pour fonction de nous aider à nous adapter à la réalité mais ils peuvent aussi faire le contraire.

Nous percevons la réalité en fonction de nos désirs et de nos projets. Les schémas que nous utilisons pour la comprendre dépendent de ce que nous voulons qu'elle soit ou de ce que nous croyons qu'elle devrait être. En particulier nous nous percevons nous-mêmes à partir de schémas qui déterminent ce que nous croyons devoir être, un idéal du moi, et nous attachons évidemment une forte charge affective à ces croyances. Lorsque la réalité perçue est en conflit avec nos attentes, elle ne nous conduit pas toujours à prendre conscience de l'inadaptation de nos schémas et nous sommes tentés de la nier.

Les schémas sont inadaptés non seulement lorsqu'ils nous empêchent de percevoir la réalité mais aussi lorsqu'ils nous empêchent de prendre conscience des possibilités. Nous définissons nos projets en fonction de schémas qui déterminent ce que nous nous croyons capables de faire et ce dont nous nous croyons incapables. Les schémas d'incapacité ne peuvent en général pas être confrontés à la réalité, parce qu'on n'essaie pas si on se croit incapable, on ne peut donc pas apprendre qu'on est en vérité capable. Les schémas d'incapacité sont comme des prophéties autoréalisatrices. Elles se réalisent parce qu'elles ont été annoncées et ne se seraient pas réalisées sinon. Les schémas de capacité sont également autoréalisateurs, dès qu'ils sont adaptés, parce qu'on se prouve qu'on est capable en essayant, et on n'aurait pas essayé si on ne s'était pas cru capable.

Certains schémas qui déterminent la personnalité, ce qu'elle croit être, ce qu'elle veut être et ce qu'elle peut faire, sont profondément ancrés depuis l'enfance. Ils peuvent conduire un individu à répéter les mêmes erreurs toute sa vie. On les appelle alors des schémas d'inadaptation précoces (Young & Klosko 1993, 2003, Cottraux 2001).

Les schémas inadaptés sont omniprésents. Très généralement les êtres humains souffrent et font souffrir à cause de leurs schémas inadaptés. Une telle omniprésence n'est pas étonnante si on comprend qu'elle résulte de l'autonomie de la volonté et des limites naturelles de nos facultés d'évaluation et d'anticipation. Nos schémas inadaptés ont d'abord été acceptés volontairement, parce que nous sommes amenés à prendre mille fois plus de décisions que celles que nous pouvons prendre rationnellement en étant bien informés. Très souvent nous devons évaluer et décider en ignorant les conséquences, et nous le faisons avec des critères très grossiers ou franchement faux. Nous sommes les égarés, qui errons dans l'obscurité et subissons les suites malheureuses de nos erreurs passées.

L'autonomie de la volonté conduit à la connaissance du bien et du mal, et à l'ignorance qui va avec, parce que nous ne sommes que des créatures. Elle est à l'origine de la plupart de nos malheurs, comme un péché originel (Genèse 3). Elle est aussi la source de nos plus grandes joies.

Les bons schémas portent des fruits en nous aidant à nous adapter à la réalité et à prendre de bonnes décisions. Inversement les schémas inadaptés font souffrir et prendre de mauvaises décisions. On sait rarement d'avance quels sont les bons et les mauvais schémas, mais l'expérience est un guide assez fiable. Elle confirme nos bons choix et nous incite à reconnaître nos erreurs. Nous ne sommes pas condamnés à un perpétuel égarement, à prendre toujours nos décisions sans rien savoir. Pourvu que que nous acceptions de reconnaître nos erreurs, l'expérience nous donne les moyens d'identifier nos schémas inadaptés et de les corriger pour nous délivrer de leur emprise.

Le moi divisé[modifier | modifier le wikicode]

Une incohérence est une contradiction. On croit une chose et son contraire. On tient pour vraies à la fois une affirmation et sa négation.

Comme pour le déni, les incohérences ne sont pas seulement entre croyances verbales. Nos perceptions et nos souvenirs de la réalité peuvent être incohérents même si nous n'avons pas de mots pour les dire.

L'autonomie de la volonté nous rend naturellement incohérents. Nos façons d'évaluer pour approuver ou nier dépendent des conditions extérieures et intérieures, de ce que nous avons perçu, de ce que nous ressentons et des croyances qui ont été précédemment éveillées. Comme ces conditions changent tout le temps, nous changeons d'avis très souvent.

Un même individu doit souvent jouer des rôles très différents, qui dépendent des circonstances et des personnes rencontrées. On joue un rôle en activant des croyances et des désirs, en activant un schéma qui organise notre perception de la réalité et ce que nous devons y faire.

Si un système de croyances nous conduit à des incohérences, il nous empêche de nous adapter, parce qu'il ne permet pas de faire la différence entre les bonnes décisions et les autres. Un minimum de cohérence est vital pour le développement de l'intelligence.

Les rôles que nous jouons, et les schémas qui nous rendent capables de les jouer, ne sont pas fixés une fois pour toutes. A chaque fois que nous jouons un rôle nous pouvons apprendre à mieux le jouer et enrichir nos schémas avec de nouvelles croyances et de nouveaux désirs. Mais ce perpétuel renouvellement nous fait prendre le risque de l'incohérence. A chaque fois qu'un schéma est enrichi d'une nouvelle croyance, nous devons nous assurer qu'elle est compatible avec les anciennes. Si ce n'est pas le cas, il faut résoudre la contradiction, en renonçant à une croyance ou en apportant des précisions.

Chaque rôle a des croyances et des valeurs qui lui sont propres, qui sont activées seulement quand nous jouons ce rôle et qui définissent un idéal particulier, ce que nous devons faire pour bien jouer ce rôle. Mais nous adoptons aussi des valeurs plus générales que nous appliquons à tous nos rôles, qui définissent notre idéal du moi et qui nous donnent un sentiment d'identité. Si nous changions toujours de valeurs comme nous changeons de chemise, nous ne saurions plus qui nous sommes et nous ne pourrions plus nous fier à nous-mêmes parce que nous ne serions jamais le même. L'idéal du moi, le surmoi, est déterminé avec un schéma de base, qui intègre tous les rôles particuliers dans une personnalité unifiée. Il rend capable de faire un travail d'unification intérieure, en imposant un minimum de cohérence à nos croyances et à nos décisions.

L'idéal du moi est sans cesse enrichi et renouvelé, et peut être modifié, mais il a quand même un caractère permanent, stable et presque définitif. Renoncer à une croyance de base qui définit l'idéal du moi demande qu'on revienne sur une parole fondamentale. C'est comme se trahir soi-même. C'est une menace pour notre sentiment d'identité et la confiance en soi qui l'accompagne. C'est pourquoi ces croyances de base sont normalement ancrées très solidement et nous n'y renonçons pas facilement.

Les divers rôles peuvent entrer en conflit les uns avec les autres et avec l'idéal du moi. La volonté doit en permanence faire un travail d'unification intérieure en réduisant ses incohérences. Si elle ne le fait pas, elle perd sa capacité à s'adapter à la réalité et à se protéger elle-même (Laing 1959). Il faut être en accord avec soi-même pour être en accord avec le monde.

Le surmoi ne nous aide pas toujours à apaiser les conflits intérieurs et à unifier la personnalité. S'il n'est pas adapté à la réalité, ses impératifs et ses bonnes résolutions sont de peu d'efficacité. Le surmoi peut être aussi lui-même divisé, si nous adoptons des valeurs incompatibles, si la réalité nous force à tenir des rôles inconciliables et si nous ne résolvons pas ces contradictions intérieures. Un surmoi divisé ne peut pas être unificateur, apaisant et modérateur, comme une bonne autorité, il ne peut qu'aggraver les conflits intérieurs.

Nous nous identifions volontiers à nos croyances, au moins à celles auxquelles nous tenons le plus. Je suis ce que je crois. Si une de nos croyances capitales est niée, nous nous sentons nous-mêmes niés, comme si on essayait de nous planter un couteau en plein cœur. C'est pourquoi les conflits intérieurs peuvent être très violents. Chaque partie du moi se bat pour sa survie et craint d'être anéantie par les autres parties, de la même façon qu'on peut craindre d'être anéanti par autrui, s'il ne nous laisse nous affirmer tel que nous croyons devoir être.

Les événements traumatisants rendent très difficile le travail d'unification intérieure. Ils nous transforment d'une façon qui nous surprend. Nous ne nous reconnaissons plus nous-mêmes. Nos réactions ne sont plus en accord avec nos aspirations fondamentales. Ils peuvent aussi ébranler nos idéaux, nous faire douter des croyances auxquelles nous tenons le plus, et affaiblir ainsi le surmoi, qui ne nous aide plus à faire notre travail d'unification intérieure. On ne sait plus ni qui on est, ni ce qu'on doit devenir.

Les dissociations psychiques sont les troubles du système exécutif lorsqu'il a perdu partiellement, ou totalement, sa capacité à faire son travail d'unification intérieure.

Cette définition est plus large que celle des troubles dissociatifs, trop restrictive, retenue dans les classifications officielles.

La schizophrénie regroupe les formes les plus graves de dissociations psychiques. Typiquement un schizophrène entend des voix intérieures qui lui semblent venir d'ailleurs, comme si des anges, ou des démons, ou des extra-terrestres, ou la CIA, ou la police, pouvait à la fois lire dans nos pensées et les contrôler, et contrôler aussi ce qu'on imagine, ce qu'on ressent, et même ce qu'on veut.

L'unité du corps vivant et la volonté autoprotectrice[modifier | modifier le wikicode]

Dans un corps vivant vivant toutes les parties vivifient toutes les autres et sont vivifiées par elles (Aristote, Les parties des animaux). Cette solidarité est essentielle. Un pied ne peut pas être vraiment un pied s'il est séparé du corps. Pour être un pied il doit être vivant, il doit faire partie du corps. Il est nourri, soigné et protégé par le reste du corps et en retour il sert pour marcher. Il en va de même pour toutes les autres parties du corps, y compris les structures cérébrales à l'origine des émotions et de la volonté.

Grâce à l'imagination, nous pouvons étendre le champ des possibles à l'infini. Nous pouvons vouloir tout ce que nous imaginons, mais cette puissance de la volonté fait aussi sa faiblesse, parce que la volonté peut être un danger pour elle-même, elle peut se causer à elle-même beaucoup de tort et même s'autodétruire.

Lorsqu'elle est en bonne santé, la volonté se protège et se construit elle-même. L'individu prend ses décisions de façon à protéger et à augmenter sa capacité à prendre des décisions. Quand on veut, on ne veut pas seulement atteindre tel ou tel but particulier, on veut d'abord et surtout conserver sa capacité à vouloir et à faire ce qu'on veut, et si possible augmenter une telle capacité. La volonté se veut elle-même. L'individu veut protéger, conserver et augmenter sa liberté d'exercice de sa volonté. Parmi tous ses objectifs, il a toujours comme objectif prioritaire de conserver la capacité à poursuivre des objectifs. Sinon l'imagination risque fort de mener à l'autodestruction. Pour survivre et se développer, la volonté consciente doit donc être autoprotectrice et autoconstructrice, elle doit être un ange gardien pour elle-même et pour tout le corps. Et bien sûr elle peut étendre davantage le champ de sa protection et de sa construction.

La puissance autodestructrice de la volonté n'est que l'envers de sa puissance autoconstructrice. Une puissance n'est en elle-même ni bonne, ni mauvaise, tout dépend des fins qu'elle sert. On peut être consterné et désespéré par la puissance autodestructrice, mais on peut aussi y voir une raison d'espérer, puisqu'elle n'est que le résultat de l'autonomie de la volonté. Si la volonté est aussi puissante pour se détruire elle-même, c'est justement parce qu'elle a une formidable puissance de se construire elle-même.

Nos instincts sont nécessairement protecteurs, parce que la sélection naturelle a retenu ce qui nous aide à vivre et à nous reproduire. L'évolution de la vie interdit l'apparition d'instincts autodestructeurs ou d'une pulsion de mort, parce qu'elle ne retient que ce qui augmente la capacité à vivre. Le désir de vivre, de profiter au mieux de tous les moyens disponibles pour augmenter sa puissance de vivre, est une conséquence de l'évolution par sélection naturelle. Il est présent chez tous les êtres vivants, sans aucune exception, parce qu'ils ont hérité de leurs instincts, et parce que la sélection naturelle ne retient que les instincts qui portent ce désir de vivre, parce qu'elle ne permet pas aux instincts autodestructeurs d'apparaître et d'évoluer. Une tendance autodestructrice chez un être vivant ne peut être qu'un dysfonctionnement d'un système essentiellement autoprotecteur.

La maîtrise de soi[modifier | modifier le wikicode]

On maîtrise une réalité lorsqu'on est capable de prendre des décisions éclairées sur ce qu'elle devient et de les faire appliquer. Le point important est que les décisions soient éclairées, qu'on sache choisir le meilleur des possibles, ou au moins, le satisfaisant. Si on ne sait pas mettre au service du bien le potentiel disponible, on n'est pas vraiment un maître.

Être dans la maîtrise ne veut pas dire tout maîtriser ou tout décider. Le lâcher-prise est une forme de maîtrise s'il résulte d'une décision éclairée. Décider de ne rien décider, de laisser faire ou de laisser aller est parfois la meilleure décision à prendre.

On est maître de soi-même lorsqu'on est capable de prendre des décisions éclairées sur ce qu'on devient et de les appliquer.

L'accord, ou la congruence, entre le moi et son expérience (Rogers 1951), c'est à dire l'adaptation de nos croyances conscientes aux réalités extérieures et intérieures, est une condition nécessaire de la maîtrise de soi. Pour se servir au mieux de son potentiel il faut le connaître. On ne peut pas développer pleinement son potentiel si on entretient des illusions à son sujet.

L'activité du ça est la plus grande partie de notre activité intérieure et elle échappe au contrôle volontaire. Cela suggère que nous ne pouvons pas être maîtres de nous-mêmes. Tout pourrait se décider à notre insu dans le ça. La volonté elle-même pourrait n'être que l'enregistrement des décisions du ça. Et nous ne pourrions pas décider de ce que nous devenons. Mais attribuer au ça la toute-puissance et réduire ainsi le moi à néant, ou presque néant, semble exagéré. La volonté du moi d'être maître de sa destinée, sa croyance dans ses capacités à décider de ce qu'il deviendra, à se transformer et à se construire lui-même, semble n'être pas seulement une illusion. On peut vouloir acquérir de nouvelles capacités, de nouvelles façons de réagir et de savoir, et même vouloir transformer et construire sa volonté.

Comme nous sommes transformés par toutes nos expériences, par tout ce que nous percevons ou imaginons, toutes nos décisions volontaires à l'origine de nos expériences ont toujours pour effet de nous transformer. C'est ainsi que nous acquérons de nouvelles habitudes. Au début elles requièrent un effort volontaire, mais elles sont ensuite accomplies d'une façon automatique.

On agit sur soi-même dès qu'on agit parce qu'on dirige son attention. La direction de l'attention est le premier levier avec lequel on agit sur soi-même à chaque instant. Elle est l'une des premières compétences à acquérir pour apprendre à se maîtriser soi-même.

L'imagination, même sans action, suffit pour se transformer soi-même, parce qu'elle nous fait découvrir nos capacités. On commence par imaginer qu'on pourrait essayer quelque chose, puis on se rend compte que cela pourrait marcher. Imaginer qu'on est capable suffit souvent pour se rendre capable. Quand on résout un problème par l'imagination, on est transformé par la découverte d'une solution.

On peut agir sur sa propre perception et la construire, parce que nos décisions influencent la façon dont nous percevons la réalité. Les schémas qui organisent nos perceptions dépendent de ce que nous voulons. Nous pouvons choisir de nouveaux schémas, modifier ou rejeter les anciens et changer ainsi nos façons de voir le monde et nous-mêmes.

Nos décisions volontaires ne sont pas limitées à l'action sur le présent. Elles portent souvent sur un avenir plus ou moins lointain ou déterminé. Nous décidons par avance les objectifs que nous poursuivrons et les règles, les engagements ou les contraintes que nous respecterons. Tout se passe comme si nous écrivions dans nos têtes les contrats et les cahiers des charges pour lesquels nous nous décidons volontairement. Une telle écriture se produit automatiquement. Il suffit que nous arrêtions nos décisions pour qu'elles soient mémorisées d'une façon définitive, ou presque. Elles peuvent alors exercer leurs effets même des années ou des décennies plus tard, sauf si on les oublie. Arrêter ses décisions par avance est comme vouloir vouloir, parce qu'on se décide maintenant à vouloir ce qu'on devra décider plus tard. En déterminant sa volonté on la construit. On se transforme soi-même en prenant des décisions, la volonté s'autodétermine, elle est transformée par ses propres décisions.

On se construit soi-même en décidant de ce qu'on veut être, donc en se donnant un savoir éthique qui définit l'idéal du moi. Le surmoi est le principal outil avec lequel le moi peut se construire lui-même.

La volonté a quelque chose de magique : il suffit de vouloir lever le petit doigt pour qu'il se lève automatiquement. Il en va de même lorsque la volonté se veut elle-même, lorsqu'elle prend des engagements sur son avenir. Il suffit de vouloir déterminer sa volonté pour qu'elle soit automatiquement déterminée. Mais que ce soit pour l'action sur son environnement ou sur elle-même, la magie de la volonté a toujours des limites. La volonté à elle seule est en général insuffisante pour déplacer des montagnes. Elle ne peut pas non plus faire d'elle-même ce qu'elle ne peut pas être.

Nous nous construisons nous-mêmes en permanence, à chaque fois que nous prenons des décisions et que nous vivons leurs conséquences. Comme pour toute construction, le constructeur doit adapter son action aux matériaux disponibles, s'il veut un résultat viable et fiable. La réflexion, la connaissance de soi, est donc essentielle, vitale, pour se construire soi-même.

Puissance de l'inconscient ou de la conscience ?[modifier | modifier le wikicode]

« Un troisième démenti sera infligé à la mégalomanie humaine par la recherche psychologique de nos jours qui se propose de montrer au moi qu’il n’est seulement pas maître dans sa propre maison, qu’il en est réduit à se contenter de renseignements rares et fragmentaires sur ce qui se passe, en dehors de sa conscience, dans sa vie psychique. » (Freud 1915)

Le modèle d'une administration centralisée sans administrateur central explique le ça, le moi et le surmoi et permet ainsi de confirmer certaines des hypothèses freudiennes, mais il ne permet pas d'attribuer à l'inconscient une puissance supérieure à celle de la conscience. An contraire il montre que la conscience est la plus grande puissance intérieure, parce qu'elle commande le système exécutif qui domine l'ensemble de l'activité cérébrale. En dehors du système exécutif, seuls les systèmes émotionnels ont les moyens d'exercer une domination intérieure, mais ils ne peuvent pas le faire complètement à notre insu, parce que nous avons toujours un minimum de conscience de ce que nous ressentons. La conscience est en position de recueillir tous les renseignements d'importance vitale sur l'activité intérieure, parce que c'est naturellement son travail. Le modèle ne laisse pas de place pour un inconscient qui pourrait développer sa puissance indépendamment de la conscience. Où trouverait-il les ressources qui lui permettraient de dominer l'intérieur s'il n'a accès ni au système exécutif, ni aux systèmes émotionnels ?

On pourrait inventer un autre modèle, où l'inconscient serait être un nouveau système, supérieur à la fois au système exécutif conscient et aux systèmes émotionnels. Mais pourquoi la nature consacrerait-elle des ressources précieuses à construire un système qui aurait pour principal effet de priver la conscience de sa puissance ? Cela semble interdit par la sélection naturelle, ou alors il faudrait que cet inconscient nous aide à vivre.

Le modèle d'administration centralisée sans administrateur central interdit l'existence d'un inconscient à la fois indépendant de la conscience et plus puissant qu'elle, mais il explique quand même pourquoi l'inconscient peut être très puissant. Lorsque la conscience se réfugie dans la fausse conscience et s'accroche à des schémas inadaptés, elle peut devenir très faible et incapable de faire son travail d'unification intérieure, elle perd le contrôle et se laisse envahir par l'agitation intérieure, d'origine inconsciente. L'inconscient acquiert de la puissance par l'intermédiaire de la conscience et à son insu, parce qu'elle s'est réfugiée dans le déni. En profitant de la faiblesse et des illusions de la conscience, l'inconscient peut avoir accès aux ressources du système exécutif en nous suggérant des croyances et des buts dont nous ne reconnaissons pas les motivations inconscientes. L'inconscient peut ainsi devenir puissant mais seulement parce que la conscience lui a cédé une part de sa puissance.

Un bon surmoi, adapté à la réalité, lucide, qui impose un minimum de cohérence à la vie intérieure et qui se comporte comme une bonne autorité, modératrice et apaisante, est en principe suffisant pour apprivoiser son inconscient. Il ne faut pas voir le ça comme un repaire de démons très puissants, mais plutôt comme un animal plein de désir de vivre, plus ou moins sauvage, et qui peut être apprivoisé. Il arrive que l'inconscient s'approprie les ressources d'une conscience faible et fausse et pousse à l'autodestruction, mais il ne peut le faire que si la conscience ne fait plus correctement son travail d'autoprotection.

La fausse conscience est une fausse maîtrise de soi et une vraie faiblesse, mais elle est faible parce qu'elle est fausse, pas parce qu'elle est conscience. Quand elle n'est pas fausse, la conscience est naturellement très puissante.

La psychanalyse et la sociologie dénoncent souvent les illusions de la conscience. Ce que nous croyons, ce que nous voulons et ce que nous faisons ont de très nombreuses causes dont nous n'avons en général pas conscience et nous nous dupons volontiers nous-mêmes sur les causes de nos décisions. Tout cela est vrai mais on aurait tort d'en conclure que la maîtrise de soi est nécessairement une illusion. Conclure à partir de l'existence de causes dont nous n'avons pas conscience que la maîtrise de soi est toujours illusoire est un sophisme. Il est nécessaire que nous n'ayons pas conscience de toutes les causes qui déterminent ce que nous vivons. Nous ne pouvons pas avoir conscience de tout. Mais pour être maître de soi-même il n'est pas nécessaire d'avoir conscience de tout, il suffit d'en savoir assez sur soi-même pour prendre de bonnes décisions, ce n'est pas la mer à boire.

Il faut dénoncer les illusions de la fausse conscience pour renforcer la conscience pas pour l'affaiblir.

Le manque de maîtrise de soi est toujours une faiblesse. On vit beaucoup mieux quand on renforce sa maîtrise. Une telle amélioration de la vie prouve très simplement par l'expérience la puissance de la conscience et l'existence d'un minimum de maîtrise de soi.

Le manque de maîtrise de soi quand il est grave est une maladie de l'esprit. Tous les troubles psychiques sont des formes du manque de maîtrise de soi. Et la guérison consiste à retrouver le minimum de maîtrise de soi dont on a besoin pour vivre sans trop souffrir. Si la maîtrise de soi était toujours illusoire nous ne pourrions jamais guérir.

La maîtrise des émotions[modifier | modifier le wikicode]

L'homéostasie (Claude Bernard), c'est à dire la stabilisation du milieu intérieur, est vitale pour tous les êtres vivants, parce qu'ils doivent maintenir des conditions intérieures qui leur permettent de vivre. Un écart par rapport à cet équilibre intérieur doit être suivi de réactions de retour à l'équilibre, sinon l'organisme peine à survivre ou meurt.

Le système des émotions participe à l'homéostasie de l'ensemble du corps, mais il est aussi doté d'une homéostasie qui lui est propre. La stabilité émotionnelle est la capacité à retrouver sa tranquillité intérieure malgré tout ce qui nous en éloigne. Les émotions fortes sont des écarts par rapport à la tranquillité et elles doivent être suivies de réactions de retour à l'équilibre pour que la vie soit préservée.

La tranquillité intérieure n'est pas forcément le grand bonheur ou la sérénité. Quand on a été frappé par le malheur, on arrive quand même parfois à conserver un peu de tranquillité, la vie continue, mais on n'est pas forcément très heureux. Quoiqu'il en soit, cette tranquillité est une sorte de minimum vital. Si on la perd et si on ne sait pas comment la retrouver, la vie devient impossible, ou très douloureuse.

Le système des émotions déclenche de façon automatique des réactions destinées à maintenir l'équilibre intérieur, mais il n'est pas purement autonome, il peut avertir la conscience et l'inciter à réagir. Les émotions fonctionnent comme des avertisseurs et des évaluateurs. Elles informent la conscience des problèmes présents et elles servent à évaluer les solutions potentielles. De ce point de vue elles ne s'opposent pas à la raison, au contraire, elles incitent à réfléchir pour trouver des solutions, et elles nous orientent, comme une boussole, ou comme l'Étoile du Nord.

Lorsqu'une émotion est très forte, elle devient impérieuse. Elle mobilise toutes les ressources de la conscience et de la volonté, on ne peut pas ne pas y penser, et tous les autres objectifs sont comme effacés par un seul problème particulier, qui a éveillé l'émotion. De ce point de vue l'émotion nous aveugle, parce qu'elle nous empêche de penser à tout ce qui ne la concerne pas. Elle est comme un dictateur égoïste qui veut seulement être obéi, et qui ne se soucie pas du reste.

La tranquillité intérieure n'est pas seulement une condition de survie, elle est aussi une condition nécessaire pour le développement de la volonté. En l'absence de tranquillité, on est asservi et aveuglé par ses émotions et on ne peut pas profiter pleinement des ressources de la conscience volontaire. Les émotions sont bienfaisantes tant qu'elles sont régulées et stabilisées, tant qu'elles ne sont que des écarts temporaires par rapport à un équilibre de tranquillité qu'on arrive toujours à retrouver.

Pour préserver de bonnes conditions d'exercice, la volonté doit seconder le système des émotions dans sa recherche de la tranquillité, la conscience doit résoudre les problèmes qui ont éveillé l'émotion et elle doit aussi jouer un rôle modérateur, pour que l'émotion ne nous envahisse pas et ne nous aveugle pas. Mais vis à vis des émotions l'imagination est naturellement amplificatrice. Une émotion éveille des représentations qui tendent en général à la renforcer. Émotion et imagination s'excitent mutuellement et entretiennent ainsi une sorte d'embrasement intérieur qui s'approprie toutes les ressources de la conscience et de la volonté. On doit donc apprendre à maîtriser ses émotions et son imagination si on veut que la volonté développe normalement ses facultés autoprotectrices, si on veut savoir conserver son équilibre intérieur et le retrouver après s'en être écarté.

La maîtrise volontaire des émotions, si elle est mal comprise, ressemble à une mission impossible. Les émotions sont souvent déclenchées en dehors de tout contrôle volontaire. Elles nous prennent. Nous ne les choisissons pas. Elles sont comme des forces qui nous dépassent et nous montrent que nous ne sommes pas maîtres de nous-mêmes. Nous ne pouvons pas décider de ne pas ressentir une émotion que nous ressentons.

Les émotions sont une vie et une force intérieures qui échappent au contrôle volontaire, mais elles ne sont pas toutes-puissantes. La volonté a naturellement de nombreux moyens pour influencer les émotions (Beck 1975).

Les émotions sont souvent déclenchées avant que nous prenions conscience de leurs causes (James 1890), mais pas toujours. Parfois elles sont déclenchées par ce que nous percevons ou imaginons consciemment. Le contrôle volontaire de la perception et de l'imagination permet donc d'influencer indirectement les émotions.

Le devenir d'une émotion, après son déclenchement, n'est pas écrit d'avance. Il dépend de nos décisions volontaires. Nous pouvons choisir d'exprimer ou de retenir l'émotion. Nous pouvons l'approuver ou la réprouver. Nous pouvons adopter ou non les buts qu'elle nous suggère. Nos critères d'évaluation ont donc une grande influence sur la façon dont nous vivons avec nos émotions et sur ce que nous en faisons. Une émotion que nous approuvons pleinement n'est pas vécue de la même façon qu'une émotion qui nous dérange, et n'a pas les mêmes effets.

Nos schémas sont à la base de nos façons de percevoir, de vouloir et de ressentir. Une même réalité peut être vécue dans le désespoir, parce qu'on croit que sa vie est totalement détruite, ou comme l'occasion d'aller plus loin, parce qu'on croit que c'est un échec riche d'enseignements. Même quand nous ne pouvons pas être maîtres de la réalité, nous pouvons quand même être maîtres de nos façons de la percevoir et de réagir, parce que nous pouvoir choisir nos schémas, les modifier, les améliorer ou les rejeter.

La volonté est dominée par les émotions seulement si elle se laisse dominer, si elle renonce à exercer pleinement son autonomie. Lorsque la volonté exerce normalement son pouvoir de contrôle, les émotions sont comme une source d'énergie qu'on peut canaliser et utiliser de très nombreuses façons. Nous ne décidons pas d'avoir des émotions, mais nous décidons de ce que nous en faisons, de ce qu'elles deviennent, et des façons dont elles nous transforment. Nous pouvons donc être maîtres de nos émotions, pourvu que nos décisions à leur sujet soient éclairées.

Le contrôle de la volonté sur les émotions peut conduire à une forme de fausse conscience, le déni émotionnel, et au refoulement des désirs. Nous ne pouvons pas ne pas ressentir ce que nous ressentons, mais nous pouvons le percevoir de diverses façons, refuser de lui accorder notre attention et nier les observations qu'il nous suggère. Les émotions demandent à être écoutées et interprétées. Comme toute réalité, elles sont perçues à partir de schémas. Nous ne comprenons pas nos émotions et nos désirs et restons sourds à leur enseignement lorsque nos schémas ne sont pas adaptés. Nous pouvons ainsi nous construire une fausse conscience en niant les vérités que nos émotions nous enseignent. Un travail d'acceptation émotionnelle est nécessaire pour renoncer aux illusions de cette fausse conscience (Greenberg).


Chapitre suivant >>>


La parole

Qu'est-ce que parler ?[modifier | modifier le wikicode]

Au commencement la parole
La parole avec Dieu
Dieu, la parole.
Elle est au commencement avec Dieu.
Par elle tout est venu
et sans elle rien n'a été de ce qui fut.
En elle, la vie
La vie, lumière des hommes
Et la lumière brille à travers la nuit
La nuit ne l'a pas saisie.

(Jean, 1, 1-5, traduit par Florence Delay et Alain Marchadour)

Tout parle[modifier | modifier le wikicode]

Si on entend le concept de parole en son sens le plus large, tout parle. La vie est une parole. Même l'être tout court est une parole. Être, pour tous les corps, vivants ou non, c'est agir sur les autres êtres. Tous les êtres matériels le font, simplement en étant matériels. Être visible, ou audible, ou être perçu de toute autre façon, c'est toujours se montrer, et c'est toujours parler. Les êtres vivants perçoivent les autres êtres et vivent en réagissant à ce qu'ils ont perçu. Leurs réactions montrent comment ils comprennent la parole exprimée par les êtres qu'ils perçoivent.

La communication animale[modifier | modifier le wikicode]

En un sens plus restreint, les animaux parlent seulement quand ils émettent des signaux pour qu'ils soient perçus et qu'ils influencent ceux qui les perçoivent. Ils se montrent aux yeux qui les regardent, ou ils font sentir leur présence d'une autre façon. Il n'est pas nécessaire de supposer que l'animal émet ses signaux volontairement. Une guêpe signale par sa robe jaune et noire à un éventuel prédateur qu'elle est une proie dangereuse. L'évolution par sélection naturelle suffit pour expliquer une telle communication animale. Les guêpes ont un avantage à montrer leur dangerosité et les prédateurs ont un avantage à la percevoir. Il n'est pas nécessaire qu'il y ait une volonté ou une conscience. Des instincts aveugles suffisent pour établir cette communication.

Influencer l'imagination et la volonté[modifier | modifier le wikicode]

En un sens encore plus restreint, les animaux parlent seulement s'ils émettent des signaux parce qu'ils veulent influencer l'imagination et la volonté de ceux qui les reçoivent. Cela suppose que les animaux qui émettent et reçoivent ces signaux sont capables d'imaginer et de vouloir, et surtout qu'ils se connaissent eux-mêmes et autrui comme des êtres qui imaginent et qui veulent.

La parole est l'émission volontaire de signaux pour influencer l'imagination et la volonté de ceux qui les reçoivent.

La signification par l'imagination[modifier | modifier le wikicode]

Lorsqu'on comprend une description, on imagine ce qui est décrit. Les mots et les expressions verbales éveillent l'imagination dès que nous comprenons leur signification. On imagine ce qui est décrit quand on en simule la perception, quand on active, en mode simulation, les systèmes de détection qui seraient éveillés si nous percevions ce qui est décrit. Lorsque les concepts détectés par nos systèmes de perception sont associés à des expressions verbales qui les nomment, nous pouvons à la fois décrire ce que nous percevons, en nommant les concepts perçus, et imaginer ce qui est décrit, en simulant la détection des concepts nommés (Saussure 1916).

Le savoir muet est le savoir qui précède la parole et qui résulte de la perception, de l'imagination, de l'émotion et de la volonté. Il peut être traduit en paroles dès que les systèmes de détection qu'il utilise sont nommés par des expressions verbales. Les descriptions sont alors une traduction en mots du savoir muet de ce qui est décrit. Les règles d'inférence qui relient la description de conditions à la description de conséquences sont une traduction des inférences muettes. Un raisonnement qui enchaîne de telles règles est une traduction d'un enchaînement d'inférences muettes. De cette façon le savoir muet peut être traduit en savoir parlant, et donc communiqué.

Le savoir muet est fondamental pour le développement de la raison, parce que le savoir parlant commence par être une traduction du savoir muet. Il peut ensuite voler de ses propres ailes parce qu'il peut parler de la parole, mais il a besoin du savoir muet pour décoller, parce que les mots doivent éveiller l'imagination pour avoir du sens.

Une expression verbale nomme un concept lorsqu'elle est associée au système de détection de ce concept. Une telle association est une interprétation de l'expression. Une même expression verbale peut être interprétée de nombreuses façons en étant associée à différents systèmes de détection.

La compréhension de la parole peut être conçue sur un mode purement passif, comme si les mots étaient les notes d'une partition et la compréhension, la musique exécutée par un piano mécanique intérieur. Mais l'imagination n'est pas seulement éveillée par les mots de cette façon passive. La compréhension de la parole est aussi et surtout active. Nous comprenons parce que nous voulons comprendre, et ce que nous comprenons , c'est à dire ce que nous imaginons, dépend de nos attentes.

Comprendre des paroles, c'est savoir s'en servir[modifier | modifier le wikicode]

Toute façon de se servir de la parole, en tant que locuteur ou auditeur, est une façon de la comprendre (Wittgenstein 1953, Turing 1950). La compréhension d'un langage n'est rien d'autre que son usage. Le locuteur comprend ce qu'il dit lorsqu'il sait ce qu'il fait en le disant. L'auditeur comprend ce qui est dit lorsqu'il sait quoi en faire. Comprendre des paroles, c'est savoir s'en servir. Pour expliquer comment nous comprenons des paroles il faut expliquer comment elles nous préparent à l'action.

Une description peut être communiquée pour elle-même. Dans ce cas simple, le locuteur comprend ce qu'il dit s'il sait ce qu'il décrit, et l'auditeur comprend ce qui est dit dès qu'il imagine ce qui est décrit. Mais évidemment il y a beaucoup d'autres usages de la parole que la communication des descriptions. Savoir décrire ce qu'on perçoit et savoir imaginer ce qui est décrit ne sont que la partie la plus fondamentale de la compréhension du langage. Elle est fondamentale parce que tous les autres usages du langage se servent de descriptions.

De nombreux mots et expressions n'ont pas de fonction directement descriptive. Ils ne nomment ni des concepts, ni des objets, mais servent comme mots de liaison ou comme modificateurs d'expressions. Ils sont très utiles à la fois pour enrichir nos descriptions et pour déterminer les façons de les utiliser. L'étude des significations des expressions verbales ne se limite pas à leur fonction descriptive. Elle inclut tous les usages du langage, toutes les façons d'utiliser des descriptions, parce qu'ils sont tous des modes de compréhension, donc des façons de donner du sens à nos paroles.

Un locuteur agit sur ceux qui l'écoutent. Il veut toujours attirer leur attention sur ce qu'il dit. Pour savoir ce qu'il fait quand il dit ce qu'il dit, il doit donc savoir ce que les auditeurs en font, ou ce qu'ils pourraient en faire. Un locuteur doit être capable de se mettre à la place des auditeurs et de comprendre ce qu'ils comprennent, sinon il ne se comprend pas vraiment lui-même. Inversement, pour savoir quoi faire avec ce qu'on leur dit, les auditeurs doivent comprendre les intentions du locuteur, pourquoi il dit ce qu'il dit. Ils doivent donc être capables de se mettre à la place du locuteur et de comprendre ce qu'il fait, sinon ils ne comprennent pas vraiment ce qu'on leur dit. La compréhension des paroles est une des formes de la compréhension mutuelle, où chacun connaît les autres et lui-même, et sait qu'il est connu par les autres de la même façon qu'il les connaît.

Les cadres théoriques et la priorité de l'a priori[modifier | modifier le wikicode]

Les cadres théoriques sont l'équivalent parlant des cadres conceptuels muets. Un cadre théorique est déterminé avec un système de noms, destinés à nommer des concepts, et des règles d'inférence. Un cadre théorique est interprété lorsque les concepts nommés sont identifiés à des systèmes de détection. Le système des systèmes de détection ainsi déterminé est le cadre conceptuel associé au cadre théorique ainsi interprété. Il donne une signification aux expressions théoriques, qui peuvent alors servir à formuler des descriptions. Les règles d'inférence muette du cadre conceptuel sont l'interprétation des règles de raisonnement du cadre théorique.

Les cadres conceptuels sont un premier degré de généralité et d'abstraction. Ils sont généraux parce qu'ils peuvent être appliqués à de nombreuses réalités particulières. Ils sont abstraits parce qu'ils sont distincts des êtres concrets auxquels ils sont appliqués. Les cadres théoriques sont un second degré de généralité et d'abstraction. Ils sont doublement généraux parce qu'ils peuvent être interprétés par de nombreux cadres conceptuels différents, qui sont eux-mêmes des cadres généraux. Ils sont doublement abstraits parce qu'ils sont distincts à la fois des êtres concrets et des cadres conceptuels appliqués aux êtres concrets.

Lorsque les concepts nommés sont identifiés à des systèmes de perception, ils ont une signification empirique. La vérité des énoncés est alors déterminée par la vérité des descriptions, donc par la vérité de la perception. Les descriptions sont vraies dès que les perceptions qu'elles traduisent le sont (Locke 1690).

La perception n'est pas le seul critère de vérité, parce que les cadres théoriques imposent la vérité de leurs principes (Leibniz 1705, Kant 1787). Ceux-ci sont admis par définition de leurs termes. Leur vérité est supposée connue dès que la signification des mots est comprise. Un cadre théorique donne ainsi aux concepts nommés des significations abstraites, indépendantes de nos perceptions et des résultats de nos expériences. Par exemple, la vérité du principe de transitivité, 'si x est plus grand que y et y est plus grand que z alors x est plus grand que z' est admise par définition de la relation 'est plus grand que'. Celle-ci peut être interprétée de multiples façons empiriques, mais le principe de transitivité ne pourra jamais être contredit par nos perceptions. S'il conduit à une anticipation erronée, on dira que la relation observée a été mal nommée, qu'elle n'est pas une signification empirique que l'on peut donner à l'expression 'est plus grand que'.

Le paradoxe de Condorcet (1785), en science politique, illustre la priorité d'un principe a priori :

On peut supposer que des résultats électoraux donnent de la force aux divers candidats en présence et songer à mesurer cette force. Soit une élection où chaque électeur doit ranger trois candidats A, B et C par ordre de préférence, et supposons que les trois ordres ABC, BCA et CAB aient chacun été choisis par un tiers de l'électorat. Il semble que la force de A est plus grande que celle de B, puisque deux tiers de l'électorat préfère A à B. De même B est plus fort que C, et C est plus fort que A. Le principe de transitivité est donc contredit par l'expérience. Mais il n'est pas réfuté pour autant, il a seulement été mal appliqué, parce qu'un tel système électoral ne permet pas de mesurer ainsi la force des candidats. On ne dira pas que le cadre théorique (la mesure de la grandeur des forces) est faux, mais seulement qu'il n'est pas adapté à la réalité perçue.

On peut dire des principes qu'ils donnent à leurs termes des significations abstraites, ou qu'ils déterminent abstraitement leur signification, parce que la connaissance des principes fait partie de la compréhension du langage. Pour se comprendre le locuteur et l'auditeur doivent connaître les mêmes principes parce que les raisonnements font partie de la préparation à l'action, parce qu'on a souvent besoin de raisonner pour savoir quoi faire de la parole.

Pour développer un savoir théorique sur le savoir, il faut définir un cadre théorique qui nous permette de raisonner sur le développement du savoir. C'est précisément la principale ambition du présent livre.

La liberté d'interprétation[modifier | modifier le wikicode]

Les mots et les expressions verbales peuvent être interprétés de nombreuses façons et recevoir ainsi de nombreuses significations, empiriques ou abstraites. Pour déterminer une interprétation empirique il suffit d'associer aux concepts nommés des systèmes de perception qui nous permettent de les détecter. Pour déterminer une interprétation abstraite il suffit d'associer aux concepts nommés des systèmes de principes qui nous permettent de raisonner avec eux.

En général une expression peut avoir de nombreuses significations empiriques, et on peut toujours en inventer de nouvelles. Mais quand les principes sont vrais par définition ils imposent des contraintes d'interprétation, des limites aux significations empiriques que nous pouvons donner à nos expressions. Les interprétations empiriques ne sont pas indépendantes des interprétations abstraites. La vérité par définition est en général prioritaire. Si une expression est employée d'une façon qui contredit un principe, on dira que l'interprétation n'est pas correcte, ou qu'elle ne fait pas partie des interprétations permises par les principes. De cette façon, on peut être sûr que nos principes sont toujours vrais, parce qu'une interprétation qui les rendrait faux est a priori exclue.

Selon l'interprétation qui lui est donnée, un même énoncé peut être en même temps une vérité abstraite et une vérité empirique. Une telle ambiguïté peut être très utile, parce qu'en développant un savoir abstrait, on obtient du même coup un savoir empirique. On n'a même pas besoin de modifier la formulation. Évidemment pour qu'une telle magie se produise il faut que les cadres théoriques et leur interprétation soient adaptés à la réalité observée.

Lorsque nous apprenons une langue, nous apprenons en même temps de nouvelles expressions, de nouvelles façons de percevoir, qui donnent des significations empiriques à ces expressions, et de nouveaux principes avec lesquels nous pouvons raisonner. Nous développons ainsi notre savoir empirique et notre savoir abstrait en même temps. Les deux sont mêlés d'une façon inextricable parce qu'en général une même expression réunit à la fois des significations empiriques et abstraites.

Pour savoir si un énoncé est vrai il faut d'abord préciser sa signification. Le même discours peut être tantôt vrai, tantôt faux, cela dépend de son interprétation. La plupart de nos controverses viennent ou de malentendus, parce que nous donnons des significations différentes à une même expression, ou de l'absence de précision, parce que nous laissons dans le vague les conditions de vérité de ce que nous disons. Nous n'explicitons pas les principes qui décident de la vérité abstraite ou nous ne précisons pas les systèmes de perception qui décident de la vérité empirique.

La diversité des interprétations peut rendre très difficile la communication du savoir. Le locuteur doit respecter un principe de clarté : donner des éclaircissements pour que son discours puisse être interprété correctement. L'auditeur doit respecter un principe de charité : toujours interpréter un discours de la façon qui lui est la plus favorable, autant qu'il est possible. Il est toujours possible de dissiper les malentendus et d'aboutir au consensus, parce que nous pouvons tous faire les mêmes raisonnements et percevoir le même monde.

Le raisonnement[modifier | modifier le wikicode]

Une inférence muette peut être traduite en savoir parlant sous la forme d'une loi conditionnelle : si les conditions alors la conséquence. L'inférence des conditions à la conséquence peut alors être mise sous la forme d'un raisonnement logique : si les conditions alors la conséquence, or les conditions sont vraies, donc la conséquence est vraie. 'donc' sépare la conclusion des prémisses dont elle résulte logiquement. Les enchaînements d'inférences muettes peuvent alors eux aussi être mis sous la forme de raisonnements logiques : si A alors B, et si B alors C, or A, donc B, donc C.

Un raisonnement (une démonstration, une argumentation, une preuve logique ou mathématique...) est une suite d'affirmations destinée à prouver la dernière, sa conclusion (Aristote, Organon). Il commence avec des prémisses, qui peuvent être des vérités connues par ailleurs, ou des hypothèses, ou des principes. N'importe quelle affirmation peut être choisie comme prémisse, mais la force d'un raisonnement, sa valeur en tant que preuve de sa conclusion, dépend de la vérité de ses prémisses. Un raisonnement établit que sa conclusion est vraie pourvu que ses prémisses soient vraies. Si celles-ci sont fausses, le raisonnement ne prouve rien.

Pour qu'un raisonnement soit logique, il faut que chaque affirmation qui suit les prémisses, y compris la conclusion, soit naturellement reconnaissable comme une conséquence logique des affirmations qui la précèdent (Gentzen 1934, Fitch 1952). Les conséquences logiques les plus simples sont en général reconnues intuitivement. Quand on apprend à parler, on apprend à se servir des opérateurs logiques : l'implication (si A alors B), la conjonction (A et B), la négation (non A), la disjonction (A ou B), l'équivalence (A si et seulement si B)... Ils sont présents dans toutes les langues avec des formulations très variées. Dès qu'on comprend leur signification, on reconnaît du même coup la vérité de règles logiques simples. Par exemple, B est une conséquence logique de 'A et si A alors B'. On reconnaît la vérité de ce principe dès qu'on comprend la signification des opérateurs d'implication et de conjonction. La vérité des principes logiques peut être admise par définition des opérateurs logiques.

Comme un opérateur peut être identifié à la relation fonctionnelle qu'il définit, les opérateurs logiques peuvent être considérés comme des concepts, qui nous permettent de préciser les relations logiques entre des affirmations. Les principes logiques déterminent des cadres théoriques qui donnent des significations abstraites aux concepts logiques. Ces cadres théoriques peuvent être appliqués à tous nos raisonnements afin de vérifier leur correction logique.

Les principes logiques énoncent seulement les formes de raisonnement logique les plus simples. Mais un raisonnement logique complexe peut toujours être mis sous la forme d'une suite de raisonnements simples, où la conclusion résulte évidemment des prémisses qui la précèdent.

Les principes logiques nous font toujours passer du vrai au vrai (Aristote, Premiers analytiques). Lorsque des affirmations sont vraies, leurs conséquences logiques ne peuvent pas être fausses. Plus précisément, quelle que soit l'interprétation que l'on donne à des affirmations, si ces affirmations sont vraies, d'après l'interprétation supposée, alors les conséquences logiques sont vraies elles aussi, d'après la même interprétation. La relation de conséquence logique ne dépend pas de l'interprétation de ce que nous affirmons, elle ne dépend que de la signification des opérateurs logiques.

Lorsque nous prouvons une conclusion par une raisonnement logique, les prémisses déterminent des conditions suffisantes de vérité. Quelle que soit l'interprétation choisie, si les prémisses sont vraies, alors la conclusion est vraie. Les raisonnements ne servent pas qu'à prouver, ils servent aussi à expliciter des conditions de vérité. Pour comprendre un théorème, il faut connaître sa preuve, parce qu'elle donne des conditions de vérité qui précisent comment il faut l'interpréter.

La vérité mathématique[modifier | modifier le wikicode]

Un cadre théorique peut être identifié au système des principes qui déterminent les façons correctes de raisonner avec les concepts qu'ils emploient. Formellement, un système de principes est un ensemble d'axiomes et de définitions. Il définit une théorie, qui peut être conçue comme l'ensemble de tous les énoncés prouvables à partir des principes, les théorèmes de la théorie. Une théorie donne une signification abstraite aux noms avec lesquels elle forme ses énoncés, parce que ses principes peuvent être admis comme vrais par définition de leurs termes. On dit parfois des axiomes qu'ils sont des définitions déguisées, parce qu'ils servent à donner une signification à leurs termes, donc à les définir.

Une théorie peut être utilisée d'une façon qui ressemble à la perception, comme un système de détecteurs. Pour savoir si un énoncé est vrai ou faux, il suffit de le prouver ou de prouver sa négation. De cette façon les noms des concepts sont associés à des détecteurs théoriques qui déterminent si les concepts sont vrais des individus nommés. Les détecteurs théoriques détectent ce qu'ils doivent détecter en trouvant des preuves logiques, à partir de principes admis. S'ils n'en trouvent pas, leur détection a échoué. « Les yeux de l'âme, par lesquels elle voit et observe les choses, ne sont rien d'autre que les preuves. » (Spinoza, Éthique, Livre V, prop. 23, Scolie) De même que les yeux du corps nous rendent capables de voir les êtres visibles, les preuves logiques à partir de principes nous rendent capables de connaître les êtres abstraits. La perception des êtres abstraits consiste à raisonner à partir des principes qui les définissent.

Pour développer le savoir purement abstrait, il suffit de choisir des principes, d'admettre leur vérité par définition de leurs termes, et de s'en servir pour prouver des théorèmes (Russell 1903). Du point de vue du savoir abstrait, n'importe quel système de principes, dès qu'il n'est pas contradictoire, peut être considéré comme vrai par définition. Mais bien sûr nous ne choisissons pas nos principes arbitrairement. Ils décident de nos raisonnements, des théories que nous développons et des significations que nous donnons à nos paroles. Ils doivent donc être choisis très soigneusement.

Le savoir abstrait peut être conçu de deux façons. Selon le platonisme (le réalisme des Idées) il porte sur une réalité abstraite, immuable et indépendante de la réalité observable. Selon le nominalisme, il est seulement une forme particulière de savoir sur le savoir, parce qu'il consiste essentiellement à étudier des théories, qu'il n'y a rien d'autre à connaître que des principes et des théorèmes.

Le savoir théorique abstrait est l'équivalent parlant de l'imagination muette des fictions. Pour que les êtres théoriques existent et soient connus, il suffit d'en faire une théorie, de se donner des principes et de raisonner à partir d'eux. Les êtres abstraits existent en tant qu'objets de la théorie, tout simplement parce qu'il est vrai que nous en parlons. Les êtres abstraits sont complètement déterminés par nos définitions et par les théories dans lesquelles nous les avons définis.

De même que l'imagination des fictions nous fait découvrir nos capacités de connaissance par inférence muette, l'invention des théories abstraites nous fait découvrir nos capacités de connaissance par le raisonnement.

Les théories purement abstraites sont parfois d'une utilité prodigieuse pour connaître la réalité concrète. On peut s'étonner de la déraisonnable efficacité des mathématiques pour les sciences de la Nature (Wigner 1960).

Un savoir éthique parlant ressemble à une théorie abstraite, parce qu'il s'énonce avec des principes dont la vérité est admise par la définition d'un idéal.

La pensée[modifier | modifier le wikicode]

« - Qu’est-ce que tu appelles penser ?

- Une discussion que l’âme elle-même poursuit tout du long avec elle-même à propos des choses qu’il lui arrive d’examiner. (…) voici ce que me semble faire l’âme quand elle pense : rien d’autre que dialoguer, s’interrogeant elle-même et répondant, affirmant et niant. Et quand, ayant tranché, que ce soit avec une certaine lenteur ou en piquant au but, elle parle d’une seule voix, sans être partagée, nous posons que c’est là son opinion. »

(Platon, Théétète, 189e-190a, traduit par Michel Narcy)


La pensée est l'imagination de la parole.

La pensée solitaire est une sorte de vie sociale imaginaire. On intériorise par l'imagination la comédie humaine, comme si toute la société pouvait parler sur la scène intérieure.

Pourquoi pense-t-on ? A quoi bon se parler à soi-même de façon imaginaire ? Pourquoi vouloir influencer avec des paroles sa propre imagination et sa propre volonté ?

La parole donne au savoir et à la volonté une existence sociale, indépendante des individus qui savent et qui veulent. Grâce à la parole, chacun peut bénéficier du savoir acquis par tous les autres, faire bénéficier les autres du savoir qu'il a lui-même acquis, et participer à des projets portés par une volonté commune. L'imagination muette suffit pour développer un savoir, mais elle ne produit qu'un savoir privé, qui ne peut être transmis qu'à quelqu'un capable de se mettre à notre place. L'imagination parlante, c'est à dire la pensée, permet de s'approprier et de développer un savoir collectif, potentiellement universel.

On a besoin des yeux du monde pour se sentir exister et pour affirmer son identité. Pour croire que je suis vraiment ce que je suis, j'ai besoin d'être reconnu par autrui. Mon seul jugement sur moi-même n'est pas suffisant parce que je suis un esprit qui existe dans l'assemblée de tous les esprits. Tant que mes croyances sur moi-même ne sont pas confirmées par les autres, elles ne sont que mes fantasmes. Je ne peux pas vraiment exister tout seul en tant qu'esprit parce que l'esprit s'accomplit en affirmant sa vérité pour tous les esprits.

Les sensations, les émotions et toutes les perceptions ne sont pas directement communicables, sauf si nous les traduisons en paroles. Grâce à la parole nous pouvons montrer aux yeux du monde ce que nous percevons et ressentons, donc nous accomplir comme de véritables esprits.

Même lorsque la pensée est solitaire, elle est quand même une affirmation de l'esprit devant l'esprit. On est pour soi-même son propre auditeur. Ce qu'on pense pourrait être dit et est évalué comme un discours prononcé devant autrui. Même solitaire, la pensée est une expression de la nature essentiellement sociale de l'esprit.

Comme les agents se construisent par l'imagination et la volonté, et comme ils peuvent influencer par la parole les imaginations et les volontés des autres agents, ils peuvent chacun agir sur la façon dont les autres se construisent. Par la parole ils se construisent, ils se forment, ils se développent tous ensemble. Comme la parole peut être partagée, elle est une ressource commune de construction de soi-même. Nous pouvons tous recevoir les mêmes bienfaits de la parole pour nous former.

Nous nous construisons par la parole et la pensée, mais on peut aussi dire que c'est la parole qui nous construit.

Avec la pensée, nous intériorisons les valeurs de la société dans laquelle nous vivons, nous nous les approprions. La pensée est l'un des principaux moyens avec lequel nous donnons de la force à notre idéal du moi. Quand nous pensons, nous ne cessons de nous justifier, en tant qu'acteur et en tant que penseur, nous ne cessons d'affirmer les valeurs auxquelles nous voulons croire. Le surmoi exerce son pouvoir sur toute notre vie d'abord et avant tout en faisant autorité sur nos pensées.

La pensée nous aide à faire notre travail d'unification intérieure, à imposer un minimum de cohérence dans nos croyances, nos décisions et nos valeurs. Le surmoi fait l'unité du moi, pourvu qu'il soit lui-même unifié et qu'il soit adapté à la réalité. Nous avons besoin de l'affirmation permanente de ce que nous croyons pour nous sentir exister. Je pense donc je suis, pas seulement parce que je ne peux pas penser sans être (Descartes 1637) mais aussi et surtout parce que sans penser, je ne sais même pas si je suis. Si on renonce au travail d'unification intérieure par la pensée, le moi est comme éclaté (Laing 1959), dispersé en de nombreux fragments qui s'opposent les uns aux autres, et on ne sait même plus qui on est, ni même si on est.

Le savoir éthique parlant fait l'unité du moi pourvu qu'il cherche honnêtement à connaître la vérité pour s'adapter à la réalité. De la même façon il fait l'unité des sociétés humaines. En se donnant des valeurs communes, en les affirmant, en invitant tous les arrivants à les partager, les communautés se forgent une identité. Elles affirment une existence qui dépasse celles de leurs membres.

La science, la sagesse et la raison existent quand les êtres humains se donnent collectivement les moyens de les faire exister. Et le premier de ces moyens est l'idéal. L'idéal est à la fois le moyen et la fin, la cause motrice et la cause finale (Aristote, Métaphysique).

Pour faire la science, nous devons nous unir, nous devons la faire tous ensemble en nous donnant collectivement un idéal de la science, une sorte de surmoi pour toute l'humanité. De même que le surmoi individuel unifie une personnalité, l'idéal rationaliste unifie l'humanité. Le surmoi individuel rend intelligent et puissant quand il rend cohérent avec soi-même et avec la réalité. De la même façon l'idéal de la raison rend l'humanité capable de s'unir et de réaliser ainsi la raison.


Chapitre suivant >>


La justification et l'évaluation du savoir

Le problème de la reconnaissance du savoir[modifier | modifier le wikicode]

Pour savoir nous devons savoir que nous savons. Avoir une représentation vraie n'est pas suffisant. Nous devons être capable de reconnaître qu'elle est vraie, nous avons besoin de critères de reconnaissance du savoir qui nous montrent que nos représentations sont vraies. Mais très généralement nous ne savons pas si ce que nous pensons ou ce qu'on nous dit est vrai ou non. Nous pouvons douter même de nos propres observations et de nos souvenirs, parce qu'ils sont parfois erronés. Nous n'avons pas de dispositif universel et infaillible de détection du savoir. Nous nous trompons souvent. Très généralement nous ne savons pas faire la différence entre le savoir et l'ignorance. Il est alors tentant de conclure que nous ne savons jamais reconnaître le savoir, et que donc nous ne savons jamais rien, puisqu'il faut savoir reconnaître le savoir pour savoir.

L'exigence de reconnaissance du savoir n'est-elle pas elle-même une erreur ? (Sextus Empiricus) N'y aurait-il pas une régression à l'infini ? Pour savoir nous devons savoir que nous savons, donc nous devons savoir que nous savons que nous savons, et ainsi de suite à l'infini. Si nous proposons des critères de reconnaissance du savoir, comment savoir qu'ils ne sont pas erronés ? Faut-il d'autres critères de savoir pour les reconnaître comme de bons critères de savoir ? Et ainsi de suite à l'infini ?

Pour justifier nos prétentions au savoir, nous nous servons de systèmes d'évaluation qui définissent des idéaux de savoir. Est alors considéré comme un véritable savoir, un savoir justifié, ou rationnel, ce qui atteint nos idéaux, ou ce qui nous en rapproche. La reconnaissance du savoir est ainsi fondée sur un savoir éthique. Nous reconnaissons le savoir en reconnaissant qu'il est ce qu'il doit être. Mais comment savons-nous que notre idéal détermine un véritable savoir ? Il pourrait n'être rien d'autre qu'une illusion pour nous donner bonne conscience, pour nous rassurer et flatter notre vanité. Et notre prétendu savoir, fondé sur une telle illusion, pourrait être tout aussi illusoire et complètement dépourvu de vérité. Les idéaux ne sont pas plus vrais que les rêves. Il peut sembler absurde de vouloir fonder le véritable savoir, la connaissance du vrai et du réel, sur du rêve.

Nous pouvons nous donner de nombreux idéaux de savoir qui se contredisent les uns les autres. Ce qui est considéré comme un bon savoir par les uns peut être méprisé par d'autres. Quel idéal faut-il choisir ? Comment reconnaître qu'un idéal de savoir est un bon idéal, qu'il ne méprise pas le bon savoir et n'honore pas l'ignorance ? Pour reconnaître qu'il est un bon idéal nous devons le justifier à partir d'un idéal du savoir de l'idéal. Mais cet idéal du savoir de l'idéal doit lui aussi être justifié. N'y a-t-il pas alors une régression à l'infini ?

Pour justifier nos prétentions au savoir nous donnons des raisonnements destinés à prouver leurs conclusions. Une affirmation est justifiée lorsqu'elle est la conclusion d'un bon raisonnement. L'existence d'une preuve rationnelle nous sert de critère de reconnaissance du savoir. Mais est-ce vraiment un bon critère ? Faut-il vraiment savoir que tous les hommes sont mortels et que Socrate est un homme pour savoir qu'il est mortel ?

Pour reconnaître le savoir par le raisonnement il faut au préalable être capable de faire la différence entre les bons raisonnements et les autres. Mais comment reconnaître les bons raisonnements ? Comment les distinguer des sophismes et des ratiocinations qui ne prouvent rien ?

Un raisonnement établit la vérité de sa conclusion à partir de la vérité de ses prémisses. Pour qu'il soit concluant, il faut savoir au préalable que les prémisses sont vraies, il faut donc justifier les prémisses. Faut-il chercher d'autres raisonnements pour les prouver et ainsi de suite à l'infini ? Mais alors nos raisonnements ne seraient jamais concluants puisqu'ils reposeraient toujours sur des prémisses injustifiées.

Ces objections sceptiques ne sont pas aussi redoutables qu'elles en ont l'air. Pour s'en convaincre il suffit d'examiner comment nous reconnaissons et justifions les diverses formes de savoir.


La reconnaissance muette du savoir[modifier | modifier le wikicode]

Nous avons des facultés naturelles de reconnaissance du savoir. Hormis les cas d'hallucination, nous faisons la différence entre les perceptions et les souvenirs d'une part, et les fictions d'autre part. De même nous distinguons les bonnes perceptions, claires et précises, des mauvaises (parce qu'on est trop loin, ou parce qu'il n'y a pas assez de lumière, ou parce que le brouhaha empêche d'entendre...). Nous reconnaissons un souvenir confus, quand il est trop ancien, ou déformé par des souvenirs ultérieurs, ou par des émotions trop intenses. Nous distinguons les anticipations ou les inférences hasardeuses de celles que l'expérience antérieure a bien confirmées. Nous reconnaissons un bon savoir-faire, lorsqu'il atteint toujours, ou le plus souvent, les objectifs auxquels il est destiné. Nous avons également des facultés naturelles de détection du mensonge. De nombreux signes (le ton de la voix, le visage, l'expression corporelle) nous aident à faire la différence entre un menteur et un témoin fiable.

La reconnaissance du savoir est en même temps une évaluation. Elle définit un idéal de savoir. Nos facultés naturelles nous orientent vers un idéal de précision des observations, d'efficacité du savoir-faire, de vérité des inférences, des anticipations et des paroles. Faut-il douter de ces idéaux ? Nous conduisent-ils à mépriser le bon savoir et à honorer l'ignorance ? Bien sûr que non.

Nous savons naturellement reconnaître le savoir, au moins parfois, mais nos façons de le reconnaître ne sont pas infaillibles. Même si les perceptions ou les souvenirs semblent clairs et précis, ils peuvent être erronés. L'expérience antérieure ne suffit pas toujours pour reconnaître la vérité des inférences ou l'efficacité du savoir-faire, parce qu'elle peut être contredite par l'expérience ultérieure. Un menteur s'il est bon comédien sait comment cacher ses mensonges.

Nos observations sont parfois erronées. Nous nous faisons des illusions et nous ne nous en rendons pas toujours compte. Puisqu'il arrive que nos perceptions nous trompent, qu'elles nous montrent parfois les choses telles qu'elles ne sont pas, ne se pourrait-il pas qu'elles le fassent toujours et que nous vivions en permanence dans un monde d'illusions ? Quant au savoir acquis par le témoignage d'autrui, c'est encore pire, puisqu'en plus de leurs illusions ils peuvent nous tromper avec des mensonges.

Nos facultés naturelles de reconnaissance du savoir ne sont pas infaillibles. Mais il n'y a pas de raison de croire qu'elles nous trompent toujours. Il y a au contraire de bonnes raisons de croire qu'elles sont souvent assez fiables. Nos observations nous permettent généralement de choisir un comportement adapté à la réalité. L'adaptation de nos actions aux objets perçus est une vérification de la justesse de nos perceptions, de l'adéquation de nos modèles internes à la réalité qu'ils représentent. Quand nos observations nous trompent, nous pouvons les corriger avec de meilleures observations. Nous pouvons toujours améliorer la fiabilité de nos dispositifs de reconnaissance du savoir. De ce point de vue, le problème des erreurs d'observation n'est pas un problème de principe, mais seulement un problème pratique : comment observer dans de bonnes conditions avec de bons dispositifs d'observation ?


La justification du savoir[modifier | modifier le wikicode]

« il disait que l'opinion vraie accompagnée d'une justification (logos) est science, tandis que celle qui est dépourvue de justification est en dehors de la science; et ce dont il n'y a pas de justification n'est pas sachable - tel est le mot qu'il forgeait - tandis que ce qui en a une est sachable.» (Platon, Théétète 201d)

Les critères de justification du savoir[modifier | modifier le wikicode]

Quand nous disons ce que nous savons ou croyons savoir, nous devons être capable de dire pourquoi cela doit être reconnu comme un savoir. Nous le faisons avec un raisonnement qui a toujours la même forme :

Si un énoncé satisfait le critère C alors il est un savoir, or A satisfait le critère C, donc A est un savoir.

Nous reconnaissons le savoir avec des critères de justification du savoir. De façon générale :

Un énoncé est un savoir si et seulement s'il est vrai et justifié (principe n°1).

La vérité de ce principe peut être admise par définition du concept de savoir.

On pourrait craindre que cette façon de faire nous expose à une régression à l'infini, parce que pour conclure qu'un énoncé est un savoir il faut connaître au préalable un critère de justification, savoir que c'est un bon critère et savoir qu'il est vraiment satisfait pour l'énoncé à justifier. Si nous devons toujours tout justifier il semble que nos justifications ne peuvent jamais s'arrêter. Mais cette crainte de la régression à l'infini n'est pas fondée. En examinant comment on justifie les diverses formes de savoir, on constate que certains énoncés sont justifiés à partir d'eux-mêmes, qu'il n'est pas nécessaire de les justifier à partir d'un autre savoir.

Pour appliquer le principe n°1 on a besoin d'une théorie de la vérité et de la justification des énoncés. Quatre principes d'une telle théorie vont être présentés. Ils impliquent que les énoncés justifiés sont toujours vrais, pourvu qu'ils soient vraiment justifiés. Avec cette théorie, le principe n°1 peut être simplifié : un énoncé est un savoir si et seulement s'il est justifié.

La justification des observations[modifier | modifier le wikicode]

- Comment le savez-vous ?
- Parce que je l'ai vu.
- Êtes-vous sûr de l'avoir vu ?
- Oui. Je l'ai vu et bien vu.
- Comment savez-vous que vous l'avez bien vu ?
- Parce que je l'ai bien vu.

Une bonne observation se justifie parfois elle-même. Quand nous devons la justifier, nous devons dire qu'elle est une bonne observation, mais il n'est pas toujours nécessaire de justifier pourquoi elle est une bonne observation. Quand nos facultés naturelles de perception conduisent à des observations claires et précises, il n'est pas nécessaire de chercher davantage de justification.

Si nous nous donnons l'observation ou la perception comme critère de savoir, nous nous exposons à l'erreur, parce que les observations sont parfois erronées. Si en revanche nous exigeons que les observations soient bonnes alors nous obtenons un principe irréfutable :

Si un énoncé est une bonne observation alors il est vrai et justifié (principe n°2), et est donc un savoir.

Le principe est irréfutable parce que sa vérité peut être admise par définition des concepts de bonne observation et de justification. Si une observation n'est pas vraie alors elle n'est pas une bonne observation, par définition du concept de bonne observation. Si elle est une bonne observation, alors elle est justifiée, par définition du concept de justification.

Le principe est irréfutable mais son application n'est pas pour autant infaillible. Il nous arrive de nous tromper quand nous croyons reconnaître une bonne observation. De plus il faut souvent justifier qu'une observation est vraiment une bonne observation. Si nous nous servons de dispositifs d'observation, d'instruments de mesure, de détecteurs, autres que ceux qui nous sont donnés par nos facultés naturelles de perception, nous devons justifier qu'ils nous permettent de faire de bonnes observations. Mais il n'y a pas de régression à l'infini parce que certaines formes de savoir se justifient spontanément elles-mêmes.

Le principe de la vérité des bonnes observations définit un idéal. Adopter cet idéal c'est simplement vouloir de bonnes observations. Mais pourquoi adopter cet idéal ? L'ultime justification est simplement que nous le voulons. Nous choisissons volontairement d'accueillir les observations dans le champ du savoir. Nous ne voulons pas d'un savoir purement abstrait qui ignore tout ce que nous vivons. Une telle volonté a un sens humaniste. Nous (êtres humains humanistes) voulons que tous les êtres humains aient un droit égal à témoigner au nom du savoir en tant qu'observateurs du même monde et que leurs observations soient respectées, et fassent autorité, pourvu évidemment qu'elles soient de bonnes observations.

La justification des lois empiriques par l'observation[modifier | modifier le wikicode]

Le raisonnement inductif, qui consiste à passer de la vérité d'une ou plusieurs observations à la vérité d'une loi qui en rend compte, n'est pas logiquement correct. Pour être vraie une loi empirique doit être vraie pour toutes les observations faites dans les conditions où elle est applicable, à la fois toutes les observations passées et toutes les observations futures. Comme il est toujours concevable que de nouvelles observations viennent contredire des lois qui jusque là étaient bien confirmées, la vérité d'une loi ne peut jamais être prouvée à partir des observations, ou du moins pas d'une façon infaillible. C'est pourquoi on dit parfois, à la suite de Karl Popper (1934), que les lois empiriques ne sont pas vérifiables, qu'elles sont seulement réfutables.

Affirmer qu'on ne peut jamais vérifier les lois empiriques est en contradiction avec la plupart des usages courants. Lorsque nos lois empiriques sont bien confirmées par de bonnes expériences, elles perdent leur caractère hypothétique et nous nous attendons à ce qu'elles soient toujours confirmées, nous ne doutons plus de leur vérité. Mais pour qu'elles soient bien confirmées, nous demandons plus que quelques observations, nous voulons des expériences bien contrôlées. Une expérience est bien contrôlée lorsque l'expérimentateur connaît avec précision toutes les conditions susceptibles d'affecter le résultat observé. Faire des expériences bien contrôlées est souvent assez difficile, et d'autant plus que le système observé est plus complexe. Du point de vue de l'expérimentateur, le problème de la vérification des lois ne se heurte pas à une difficulté de principe mais seulement à une difficulté pratique : comment faire des expériences bien contrôlées ?

Comme celui de bonne observation, le concept d'expérience bien contrôlée conduit à un principe irréfutable :

Si une loi empirique est pleinement confirmée par une expérience bien contrôlée alors elle est vraie et justifiée (principe n°3), et est donc un savoir.

Le principe est irréfutable parce qu'il est vrai par définition des concepts d'expérience bien contrôlée et de justification. Si une loi confirmée par une expérience se révèle fausse à l'issue d'une expérience ultérieure, alors l'expérience initiale n'était pas bien contrôlée. L'expérimentateur ne contrôlait pas toutes les conditions susceptibles d'affecter son résultat, puisque le résultat a changé. Une loi confirmée par une expérience bien contrôlée est donc nécessairement vraie, par définition du concept d'expérience bien contrôlée, et elle est justifiée, par définition du concept de justification.

Le principe de la justification par des expériences bien contrôlées est irréfutable mais son application n'est pas pour autant infaillible. Il nous arrive de nous tromper quand nous croyons reconnaître une expérience bien contrôlée. De plus il faut souvent justifier qu'une expérience est vraiment bien contrôlée. Nous le faisons avec un savoir préalable qui doit lui-même être justifié. Mais il n'y a pas de régression à l'infini, parce que certaines formes de savoir se justifient elles-mêmes.

La vérification des lois empiriques par des expériences bien contrôlées repose sur la croyance à l'intelligibilité du réel. Nous croyons que la Nature, ou l'Univers, obéit à des lois, que nos expériences peuvent nous les révéler, et qu'il n'y a pas de malin génie qui s'amuse à nous leurrer pour ruiner la valeur de nos recherches empiriques.

L'ultime justification de la vérification empirique des théories est simplement notre volonté. Nous voulons connaître les lois de l'Univers et nous voulons que le savoir accueille toutes les expériences bien contrôlées qui soumettent à une épreuve rigoureuse nos prétentions à ce savoir.

La justification par le raisonnement[modifier | modifier le wikicode]

Dès que nous connaissons des énoncés vrais et justifiés, nous pouvons les prendre comme points de départ de raisonnements destinés à étendre notre savoir, parce que l'existence d'une preuve rationnelle est un critère de justification :

Si un énoncé est la conclusion d'un raisonnement logique dont les prémisses sont vraies et justifiées, alors il est vrai et justifié (principe n°4), et est donc un savoir.

Ce principe est vrai par définition des concepts de raisonnement logique et de justification. Si les prémisses d'un raisonnement logique sont vraies alors la conclusion est vraie, par définition du raisonnement logique, et si en outre elles sont justifiées alors la conclusion est justifiée, par définition de la justification.

La simple communication du savoir peut conduire à l'erreur, à cause de la variabilité des interprétations. Un énoncé peut être vrai selon une interprétation et faux selon une autre. Le même énoncé peut être un savoir pour moi, parce qu'il est justifié et vrai selon mon interprétation, et une erreur pour un autre, parce qu'il l'interprète d'une façon qui le rend faux. Dans un raisonnement logique, les prémisses sont des conditions suffisantes de vérité de la conclusion. En même temps que nous prouvons la conclusion, nous précisons son interprétation. Pour que la conclusion soit un savoir, il faut qu'elle soit interprétée d'une façon qui respecte la vérité des prémisses. Les raisonnements servent non seulement à augmenter et à justifier le savoir mais aussi à lever les ambiguïtés et à dissiper les malentendus.

La justification de la logique[modifier | modifier le wikicode]

Nous reconnaissons un raisonnement logique en vérifiant qu'il respecte les principes logiques. Mais comment reconnaissons-nous les principes logiques ? Comment savons-nous qu'ils sont de bons principes ? Comment les justifions-nous ? Sommes-nous vraiment sûrs qu'ils conduisent toujours à des conclusions vraies à partir de prémisses vraies ?

En se donnant des principes de définition de la vérité (Tarski 1933), on peut prouver que nos principes logiques sont vrais, au sens où ils font toujours passer du vrai au vrai. On peut même prouver qu'un petit nombre de principes suffit pour déterminer toutes les relations de conséquence logique (Gödel 1929).

Un sceptique pourrait objecter que ces justifications des principes logiques sont sans valeur parce qu'elles sont circulaires. Quand nous raisonnons sur les principes logiques pour les justifier, nous nous servons des mêmes principes que ceux que nous devons justifier. Si nos principes étaient faux, ils permettraient de prouver des faussetés et donc ils pourraient permettre de prouver leur propre vérité. Que les principes logiques permettent de prouver leur vérité ne prouve donc pas qu'ils sont vrais, puisque des principes faux pourraient faire la même chose.

Cette objection n'est pas concluante. Il suffit d'examiner les preuves suspectes de circularité pour se convaincre de leur validité, tout simplement parce qu'elles sont excellentes et irréfutables. Aucun doute n'est permis parce que tout y est clairement défini et prouvé. Un sceptique peut faire remarquer avec raison que de telles preuves ne peuvent convaincre que ceux qui sont déjà convertis. Mais dans ce cas il n'est pas difficile de faire partie des convertis, parce que les principes logiques ne font que formuler ce que nous savons déjà quand nous raisonnons correctement.

L'ultime justification des raisonnements logiques est simplement que nous les voulons. Comme les principes logiques sont universels, les respecter conduit à respecter la faculté de raisonner de tous les êtres humains et leur droit égal à donner des preuves et à parler au nom de la raison. Nous ne voulons pas d'un savoir qui exclut les preuves logiques, nous voulons un savoir qui accueille tout ce que les raisonnements peuvent enseigner.

La justification des principes[modifier | modifier le wikicode]

Les théories, qu'elles soient empiriques, éthiques ou abstraites, reposent toujours sur des principes (axiomes et définitions) dont la vérité est admise par définition des termes employés. De tels principes sont très faciles à justifier :

Si un énoncé est un principe dont la vérité peut être admise par définition des termes employés alors il est vrai et justifié (principe n°5), et est donc un savoir (Descartes 1637, Pascal 1657).

Un principe vrai par définition se justifie lui-même. Il est nécessairement vrai, parce qu'il détermine la ou les interprétations qui le rendent vrai.

Avec le principe n°1, les principes n°4 et n°5 suffisent pour reconnaître le savoir abstrait : toutes les vérités abstraites, donc en particulier toutes les vérités mathématiques, dès qu'elles sont prouvées. Les cinq principes ensemble suffisent pour reconnaître tous les savoirs parlants, empirique, éthique et abstrait, tous les énoncés vrais et justifiés.

L'évaluation du savoir[modifier | modifier le wikicode]

L'expression 'justification du savoir' peut être interprétée de plusieurs façons. Dans les sections qui précèdent un énoncé est considéré comme justifié dès qu'il respecte l'un des critères de justification du savoir, mais cela ne veut pas dire qu'il est pour autant un très bon savoir. Un énoncé peut être vrai, justifié et sans intérêt, s'il ne dit rien qui mérite d'être connu. Mais justifier un savoir peut vouloir dire aussi montrer sa valeur et son importance. Afin d'éviter l'ambiguïté sur le concept de justification, il vaut mieux dans ce cas parler d'évaluation du savoir. Les principes 1 à 5 suffisent pour justifier le savoir mais ils ne suffisent pas pour l'évaluer.

L'évaluation des principes[modifier | modifier le wikicode]

« Vous les reconnaîtrez à leurs fruits. » (Matthieu, 7:20)

« On y verra de ces sortes de démonstrations, qui ne produisent pas une certitude aussi grande que celles de Géométrie, et qui même en diffèrent beaucoup, puisque au lieu que les Géomètres prouvent leurs Propositions par des Principes certains et incontestables, ici les Principes se vérifient par les conclusions qu'on en tire; la nature de ces choses ne souffrant pas que cela se fasse autrement. Il est possible toutefois d'y arriver à un degré de vraisemblance, qui bien souvent ne cède guère à une évidence entière. Savoir lorsque les choses, qu'on a démontrées par ces Principes supposés, se raportent parfaitement aux phénomènes que l'expérience a fait remarquer; surtout quand il y en a grand nombre, et encore principalement quand on se forme et prévoit des phénomènes nouveaux, qui doivent suivre des hypothèses qu'on employe, et qu'on trouve qu'en cela l'effet répond à notre attente. Que si toutes ces preuves de la vraisemblance se rencontrent dans ce que je me suis proposé de traiter, comme il me semble qu'elles font, ce doit être une bien grande confirmation du succès de ma recherche, et il se peut malaisément que les choses ne soient à peu près comme je les représente. » (Christian Huyghens, Traité de la lumière, p.2)

A priori, n'importe quel ensemble de formules, dès qu'il est cohérent, peut être choisi pour fonder un savoir abstrait. Mais nous n'adoptons pas n'importe quelle formule comme principe simplement pour le plaisir de fonder une théorie abstraite. Nous n'étudions pas toutes les théories abstraites que nous pouvons concevoir. Ce serait vain, insensé et infaisable. Comment alors choisissons-nous les principes de nos théories abstraites ? Plus généralement, comment choisissons-nous les principes vrais par définition sur lesquels nous fondons les théories empiriques, éthiques et abstraites avec lesquelles nous développons notre savoir ? Et comment évaluons-nous ces choix ?

Nous reconnaissons les bons principes à leurs fruits.

Un principe porte des fruits lorsqu'il nous aide à acquérir du bon savoir. Pas n'importe quel savoir, pas n'importe quel énoncé vrai et justifié. Nous voulons des théories qui nous rendent vraiment savants, qui soient plus qu'une collection d'énoncés vrais.

Qu'un bon principe porte des fruits est une vérité qu'on peut admettre par définition du concept de bon principe.

Nous évaluons les principes à partir de la qualité du savoir qu'ils nous permettent d'acquérir. Un sceptique pourrait dénoncer un cercle vicieux : nous justifions notre savoir en le prouvant à partir de principes, mais nous évaluons les principes à partir du savoir qu'ils nous permettent de prouver.

Il y a bien un cercle mais il n'est pas forcément vicieux. Les principes ne sont pas la seule source du savoir. Les observations et les expériences, du monde extérieur et de la réalité intérieure, le sont également. Il y a un cercle parce qu'il y a un dialogue incessant entre les principes et leurs applications. Les principes nous servent à développer des applications. Ils prouvent leur valeur quand nous réussissons. Les échecs en revanche nous conduisent à les modifier ou à les abandonner. Les principes sont ainsi évalués à partir de leurs applications, leurs fruits, mais les applications elles-mêmes ne sont pas évaluées seulement à partir de principes. Les perceptions, les émotions et tout ce que nous vivons nous font sortir du cercle de l'évaluation des principes par des principes.

L'idéal d'intelligibilité[modifier | modifier le wikicode]

Nous recherchons un savoir qui rende le monde et nous-mêmes intelligibles. Nous ne voulons pas seulement connaître des énoncés vrais et justifiés. Nous voulons des explications.

Nous demandons aux théories empiriques d'être confirmées par les observations passées et de prédire des observations futures, mais cela ne suffit pas. Nous voulons aussi qu'elles nous donnent de bonnes explications de ce que nous observons. Prédire ne suffit pas pour expliquer.

Nous demandons aux théories éthiques d'évaluer les actions, les comportements, les fins, les paroles... mais cela ne suffit pas. Nous ne voulons pas seulement qu'elles nous disent ce qui est souhaitable, ou obligatoire, nous voulons aussi qu'elles nous disent pourquoi, qu'elles expliquent leurs évaluations.

Nous ne demandons pas seulement aux théories abstraites de prouver des théorèmes, nous voulons aussi et surtout qu'elles nous éclairent, qu'elles nous aident à comprendre la réalité, abstraite ou concrète, qu'elles la rendent intelligible.

Qu'est-ce qu'une bonne explication ? Que faut-il pour qu'une théorie nous éclaire ou nous illumine ?

N'importe quelle connaissance qui nous aide à connaître un être, ne serait-ce que par analogie, peut être considérée comme une explication. Mais nous demandons davantage pour que la réalité soit intelligible. Nous voulons être capables de répondre par le raisonnement aux questions que nous pouvons nous poser. Nous voulons connaître des principes à partir desquels on peut prouver ce que nous devons expliquer. N'importe quel système de principes ne fait pas forcément l'affaire. Au lieu de nous éclairer, il peut rendre les choses encore plus obscures. Quelles conditions doivent satisfaire nos principes pour nous éclairer, pour rendre la réalité plus intelligible ?

Nous ne savons pas très bien. Nous ne pouvons pas tout savoir là-dessus parce que la science innove, parce que personne ne connaît par avance les explications qu'elle découvrira. Mais nous avons quand même des critères d'évaluation qui nous orientent dans la recherche des bonnes explications. La simplicité des principes, leur généralité, l'analyse de la complexité, la connaissance des fins, et parfois la beauté théorique, sont les principaux critères invoqués pour évaluer nos explications. Ils valent également pour les savoirs empirique, éthique et abstrait.

Demander la simplicité des principes, c'est simplement demander qu'ils soient en petit nombre et qu'ils puissent être formulés en peu de mots. Demander leur généralité, c'est demander qu'ils puissent être appliqués à un grand nombre de cas particuliers. De telles exigences peuvent sembler excessives et irréalistes. Pourquoi le monde avec toute sa complexité pourrait-il être expliqué à partir d'un petit nombre de principes simples ? Les êtres sont toujours différents les uns des autres. Pourquoi alors devraient-ils tous obéir aux mêmes principes ?

A l'idéal d'intelligibilité on associe parfois la beauté comme critère d'évaluation des théories. On demande qu'elles soient belles, ou qu'elles nous révèlent la beauté du réel. Ce n'est pas vraiment un critère parce qu'on ne sait pas d'avance ce qui fait la beauté d'une théorie ou de la réalité. Mais le désir de beauté est une motivation puissante pour la recherche du savoir. C'est un peu surprenant a priori. Pourquoi la réalité devrait-elle être belle ? Ne faut-il pas croire à la vie en rose pour affirmer qu'une théorie doit être belle pour être vraie, ou qu'elle doit révéler la beauté du monde ? Pourtant le désir de beauté n'est pas vain. En physique théorique surtout (Albert Einstein, Paul Dirac), mais aussi dans toutes les autres sciences, la recherche de la beauté a conduit aux découvertes les plus fondamentales.

L'analyse de la complexité[modifier | modifier le wikicode]

Analyser un système complexe consiste à identifier ses parties, à dire comment elles sont assemblées, et comment elles interagissent, si le système est dynamique. Puisqu'une partie est en général elle-même un système, composé de parties, qui sont elles-mêmes des systèmes, et ainsi de suite, on distingue plusieurs niveaux, le niveau macro, celui du système entier, et divers niveaux micro ou nano.

On se donne souvent comme idéal de savoir une analyse telle que le niveau macro soit expliqué à partir du niveau micro. Les propriétés du système, son mouvement ou son comportement, doivent être expliqués à partir des propriétés des parties, de leurs mouvements ou de leurs comportements, de la façon dont les parties sont assemblées et de leurs lois d'interaction. Lorsque cet idéal de savoir est atteint, on a une explication réductionniste, ou analytique, du système. Dans les sciences empiriques, les systèmes complexes sont souvent trop mal connus pour qu'un tel idéal soit atteint. En revanche, lorsqu'il s'agit d'êtres abstraits, cet idéal de savoir analytique est toujours atteint, parce que les êtres abstraits sont complètement déterminés par nos définitions. Même s'il est très complexe, un système abstrait est toujours composé d'éléments très simples, dont les propriétés fondamentales sont complètement connues. Les principes qui permettent de déduire ses propriétés à partir de celles de ses parties et de leur mode d'assemblage sont eux aussi complètement connus et peuvent être formulés avec un petit nombre de lois simples.

On prétend parfois récuser l'idéal de savoir analytique en remarquant avec raison que le niveau micro doit lui-même parfois être expliqué à partir du niveau macro. Par exemple, pour comprendre le comportement d'un individu, il faut connaître la société dans laquelle il vit. Mais cela ne contredit pas l'idéal de savoir analytique. Il demande que les phénomènes sociaux soient expliqués à partir des comportements individuels, mais il n'exige pas que nous sachions tout sur les individus avant de connaître leur société. Pour connaître les individus, toutes les sources de connaissance sont les bienvenues, y compris le savoir déjà acquis sur leur société. Il y a bien un cercle, parce que nous nous servons des connaissances au niveau micro pour acquérir des connaissances au niveau macro et inversement, mais il n'est pas vicieux. Nous développons le savoir sur les systèmes complexes en faisant dialoguer les savoirs des niveaux macro et micro.

Les explications réductionnistes sont parfois ridiculisées sous le nom de réductionnisme, une sorte de programme matérialiste et scientiste qui exigerait d'une façon irréaliste que toutes nos connaissances scientifiques soient prouvées avec des explications réductionnistes à partir des lois fondamentales sur les interactions entre particules élémentaires. Les explications réductionnistes sont très largement utilisées dans toutes les sciences empiriques, mais il n'y a vraisemblablement aucun scientifique qui souscrive au programme du réductionnisme tel qu'il vient d'être formulé. Et à l'exception des physiciens, ils sont peu nombreux à se soucier des interactions entre particules et de leurs lois, qu'en général ils ne connaissent pas.

Le but des explications réductionnistes, l'idéal de savoir analytique qu'elles s'efforcent d'atteindre, n'est pas de tout prouver à partir de la physique des particules. Il s'agit bien de comprendre l'univers observable et tout ce qu'il contient comme de vastes systèmes, qui sont tous composés à partir des même éléments, et dont les comportements résultent des interactions entre ces éléments. Mais il ne s'agit pas de tout prouver à partir des lois d'interaction entre les éléments. Le but d'une explication réductionniste n'est même pas forcément de prouver. Si les parties et leurs lois d'interaction sont déjà bien connues alors oui les explications réductionnistes permettent parfois de prouver des lois du comportement macroscopique à partir de lois microscopiques. Mais souvent on donne une explication réductionniste en se contentant de postuler des lois microscopiques. Dans de tels cas, les lois macroscopiques qui résultent des lois microscopiques ne sont pas prouvées. Elles ne sont pas moins hypothétiques que les prémisses dont elles résultent. Malgré son caractère hypothétique, une telle explication peut tout de même avoir une grande valeur scientifique, si elle dissipe une partie du mystère de la complexité.

Tant qu'on ne connaît pas la composition d'un système complexe et qu'on n'a pas d'explication réductionniste de son comportement, celui-ci reste très mystérieux, même s'il nous est familier. On connaît parfois des lois, par expérience, qui permettent d'anticiper des effets, des réactions, des résultats, mais ces lois elles-mêmes restent très mystérieuses. Même si on sait les justifier, par la justesse des anticipations auxquelles elles conduisent, ou en les prouvant à partir d'autres lois bien justifiées par les observations, elles ne perdent pas leur mystère. Il n'y a que les explications réductionnistes qui permettent de dissiper une partie du mystère (mais elles conduisent souvent à d'autres mystères, puisque les lois microscopiques elles-mêmes doivent être expliquées, sauf si on suppose que les parties sont des particules élémentaires). Tant qu'on n'a pas d'explication réductionniste d'une loi de comportement d'un système complexe, il y a un manque d'explication. L'idéal de savoir analytique, expliquer le tout à partir des parties, s'impose toujours pour comprendre la complexité. S'il n'est pas satisfait, il demande à être satisfait. Cet idéal est un moteur de la découverte scientifique, parce que nous trouvons parfois les explications que nous cherchons.

Se donner un idéal de savoir analytique pour les sciences empiriques revient à affirmer que la matière est intelligible, que l'univers observable peut être expliqué avec des théories, qu'il suffit que nos théories déterminent avec quelques principes les propriétés des éléments ou des parties, les assemblages et les lois d'interaction, pour qu'elles expliquent les comportements de tous les systèmes complexes que nous observons. Il n'est pas évident a priori qu'un tel idéal puisse être vraiment atteint. Pourquoi la matière devrait-elle être intelligible ? On peut en douter. Rien ne lui impose d'être à notre mesure. L'univers n'est-il pas beaucoup plus que tout ce que nous pouvons en penser ?

La connaissance des fins[modifier | modifier le wikicode]

Un agent peut expliquer son comportement simplement en disant ce qu'il veut et les moyens qu'il a réunis. Même s'il ne nous l'explique pas , nous pouvons comprendre son comportement en nous mettant à sa place, en imaginant que nous voulons ce qu'il veut et que nous croyons ce qu'il croit. Si nous arrivons à simuler ainsi intérieurement l'enchaînement de ses actions, leurs motivations et les croyances qui les accompagnent, nous pouvons expliquer son comportement de la même façon que lui-même (Weber 1904-1917).

La compréhension des fins permet d'expliquer les comportements des êtres humains et de nombreux animaux. Pour expliquer ce qu'ils font nous avons seulement besoin de connaître ce qu'ils veulent et les moyens qu'ils se donnent. La compréhension des fins est fondamentale pour la préparation à l'action et l'apprentissage, parce ce que nous apprenons à agir en comprenant les fins des autres.

La compréhension des fins permet d'expliquer le fonctionnement d'un système artificiel. On le comprend en comprenant les inventeurs ou les ingénieurs qui ont imaginé les fins, les fonctions, que le système peut accomplir. L'explication par les fins est toute aussi fondamentale pour la science du fonctionnement des corps vivants, la physiologie (Aristote, Les parties des animaux). Dans ce domaine, la valdité de l'explication par les fins est a priori très étonnante, parce qu'il n'y a pas d'ingénieur qui ait dessiné les plans des corps vivants. Comment les organes des êtres vivants peuvent-ils avoir des fins s'il n'y a pas eu d'inventeur qui les a imaginées ?

La théorie darwinienne de l'évolution par sélection naturelle suffit pour dissiper ce mystère. Les formes vivantes sont naturellement sélectionnées par leurs capacités à atteindre leurs fins (croissance, survie et reproduction). Si leurs organes n'accomplissent pas leurs fonctions, elles ne laissent pas de descendance. L'accumulation de petites variations à chaque génération et la sélection de celles qui sont les plus fonctionnelles suffisent pour expliquer l'apparition de toutes ces formes vivantes, tellement sophistiquées qu'elles vont souvent bien au delà de la compréhension des ingénieurs (Darwin 1859, Dawkins 1997).

La compréhension des fins est d'une importance fondamentale pour le savoir éthique, puisque nous apprenons à évaluer les actions, les comportements et leurs fins en nous connaissant nous-mêmes, et les autres, comme des agents qui veulent et qui s'en donnent les moyens.

L'évaluation du savoir éthique[modifier | modifier le wikicode]

Un savoir éthique sert à évaluer les actions. Mais il doit lui-même être évalué. Nous ne voulons pas n'importe quel système d'évaluation. Nous voulons un bon savoir éthique. Faut-il alors concevoir une succession infinie de savoirs éthiques, le premier évalue les actions, le second évalue le premier, et ainsi de suite ?

L'adoption d'un savoir éthique, l'approbation ou la désapprobation des principes éthiques, sont elles-mêmes des actions. En approuvant un principe éthique on agit sur soi-même parce qu'on détermine sa volonté. Il s'agit bien d'une action parce que nous modifions la réalité. Nous ne sommes pas pareils avant et après l'approbation du principe.

Un savoir éthique est général. Il sert à évaluer toutes les actions (ou parfois toutes les actions d'une certaine catégorie). Un savoir éthique peut donc servir à évaluer les savoirs éthiques. Il n'y a pas de régression à l'infini du savoir éthique parce qu'un même savoir sert à l'évaluation de toutes les actions, y compris l'approbation des principes éthiques. De fait, quelle que soit la sagesse que nous adoptons, qu'il faille l'honorer est toujours un principe de sagesse. Un savoir éthique s'évalue toujours lui-même positivement. Quand on adopte un principe éthique on ne s'engage pas seulement à honorer toutes les actions que le principe nous demande explicitement d'honorer, on s'engage aussi à honorer le principe lui-même et son adoption.

Certains principes éthiques donnent explicitement des critères d'évaluation des principes éthiques. Par exemple, « Vous les reconnaîtrez à leurs fruits » est un principe éthique qui sert à évaluer les principes éthiques, il peut même servir à s'évaluer lui-même : c'est un bon principe parce qu'il porte des fruits à chaque fois qu'il nous permet de reconnaître un bon principe. Bien sûr une telle preuve ne peut pas convaincre un sceptique qui douterait du principe. Mais elle montre que l'évaluation des principes ne conduit pas à une régression à l'infini.

Notre savoir éthique nous sert à évaluer tous les autres savoirs éthiques. Plus un savoir éthique est en accord avec le nôtre, plus nous l'honorons, plus il nous contredit et plus nous le méprisons ou le détestons. Lorsque nous adoptons un savoir éthique nous nous retrouvons automatiquement en désaccord avec ceux qui ont choisi un savoir éthique qui nous contredit. Comme les désaccords dégénèrent souvent en conflits violents, la diversité des savoirs éthiques contribue à la guerre perpétuelle entre les êtres humains.

N'y aurait-il pas un savoir éthique universel sur lequel tous les êtres humains pourraient se mettre d'accord ? Une vérité éthique universelle ? Si une telle vérité existait elle serait aussi la véritable justification du savoir éthique, puisqu'un mauvais savoir éthique se justifie mal quand il se justifie lui-même. Mais les très nombreux savoirs éthiques développés par les êtres humains prétendent généralement être justement cette vérité universelle, et ils se contredisent souvent entre eux. Cela conduit à douter de la possibilité d'une telle vérité. Elle pourrait n'être qu'un rêve, une divagation d'un esprit qui n'a pas les pieds sur terre. Certains indices suggèrent cependant qu'il faut douter de ce doute.

Le savoir éthique fait partie du savoir-vivre (la somme de tous les savoir-faire qui permettent de vivre). Sa valeur dépend du savoir-vivre dans lequel il s'intègre. Si par exemple un savoir éthique nous prescrit des objectifs inaccessibles, parce que nous n'avons pas le savoir-faire adéquat, il est automatiquement disqualifié, parce qu'il ne nous aide pas à bien vivre, parce qu'il tend plutôt à nous empêcher de bien vivre.

On conçoit souvent l'éthique, ou la morale, comme un système d'interdictions, qui tend donc à limiter le champ de nos actions, à réduire l'espace des possibles. Mais c'est plutôt le contraire qui est vrai. En nous enseignant ce qui est souhaitable, un savoir éthique nous fait voir des possibilités auxquelles nous n'aurions pas songé autrement. Et en nous donnant des règles pour l'action, il augmente nos moyens d'action, parce qu'il y a beaucoup d'objectifs qui requièrent de la discipline pour être atteints.

Un savoir éthique est toujours soumis à l'épreuve de la vie. Il doit faire ses preuves et montrer sa valeur en nous aidant à bien vivre et en nous faisant découvrir de bonnes façons de vivre. Ainsi nous pouvons faire l'expérience de la vérité de l'idéal. Les rêves font partie des chemins vers la vérité, parce qu'ils nous font découvrir ce qui n'existe pas encore. La vérité du rêve n'est pas une absurdité.

Un savoir éthique est évalué à partir des comportements qu'il évalue. Il y a bien un cercle, mais il n'est pas vicieux. Le savoir éthique se développe naturellement ainsi, par une sorte de dialogue entre l'idéal et l'expérience.

Tous les êtres humains ont naturellement les mêmes besoins fondamentaux (Maslow 1954) : l'alimentation, la protection contre les intempéries, la santé, la sécurité, l'intégration dans une communauté qui nous reconnaît et nous respecte, s'aimer soi-même, aimer les autres et être aimé d'eux, s'accomplir soi-même... Un savoir éthique qui se heurte à la satisfaction de ces besoins est automatiquement disqualifié parce qu'ils sont nécessaires au bien vivre. Les besoins fondamentaux déterminent donc un savoir éthique universel, qui peut être reconnu par tous les êtres humains. Tenir ce savoir pour une vérité universelle, c'est simplement affirmer que nous avons vraiment ces besoins fondamentaux. Un tel savoir ne suffit pas pour décider de toutes les questions éthiques, mais il est toujours une base à partir de laquelle on peut raisonner.

Un savoir éthique peut conduire à l'autodestruction, s'il nous fait mépriser ce dont nous avons besoin pour vivre. On assiste alors au triste spectacle d'une volonté qui s'anéantit elle-même, à cause d'un mauvais savoir éthique. Il faut que la volonté se veuille elle-même, qu'elle veuille continuer à exister, qu'elle ne souhaite pas sa propre destruction. Il faut que l'esprit soit pour l'esprit (Hegel 1830). Ce principe est une vérité éthique universelle. Il ne se réduit pas à un simple égoïsme parce que nos besoins fondamentaux sont souvent des besoins sociaux. Quand nous sommes solidaires nous voulons que la volonté des autres continuent à exister. Vouloir l'esprit n'est pas seulement se vouloir soi-même, c'est aussi et surtout vouloir que la société continue à faire vivre l'esprit.

Une mauvaise interprétation de la théorie de Darwin affirme que la sélection naturelle impose nécessairement l'égoïsme. Etant en compétition les uns avec les autres, les êtres vivants seraient obligés de toujours favoriser leurs intérêts individuels au détriment de ceux des autres. Le plus important serait d'avoir des griffes et des dents. Mais cette interprétation ignore l'omniprésence de la coopération et de la solidarité dans le monde vivant. Comme beaucoup d'animaux nous avons des instincts de solidarité. Croire que l'égoïsme est une loi de la nature est une erreur grave. Nous avons naturellement besoin d'être solidaires pour nous accomplir.


La justification et l'évaluation du savoir sur le savoir[modifier | modifier le wikicode]

Les façons de reconnaître, de justifier et d'évaluer le savoir présentées dans ce chapitre, de la reconnaissance muette du savoir jusqu'à l'évaluation du savoir éthique, permettent de reconnaître, de justifier et d'évaluer toutes les formes de savoir, muettes et parlantes, de la perception la plus élémentaire jusqu'aux théories empiriques, éthiques ou abstraites les plus élaborées. Le savoir sur le savoir, qu'il soit muet ou parlant, empirique, éthique ou abstrait, est reconnu, justifié et évalué de la même façon que les autres. En montrant comment on doit reconnaître, justifier et évaluer les diverses formes de savoir, le savoir sur le savoir montre du même coup comment il doit lui-même être reconnu, justifié et évalué.

Puisque les problèmes de la justification et de l'évaluation du savoir sont des problème éthiques (Quelles prétentions au savoir devons-nous honorer ? Quel idéal de savoir devons-nous nous donner ?) les solutions présentées dans ce chapitre constituent elles-mêmes un savoir éthique sur le savoir, qui doit être reconnu, justifié et évalué de la même façon que n'importe quel autre savoir éthique.

De même qu'un idéal de vie nous montre sa vérité en nous rendant capables de bien-vivre, un idéal de savoir nous montre sa vérité en nous rendant capables d'acquérir du bon savoir. Nous savons que notre idéal de savoir nous permet de reconnaître et de justifier un bon savoir tout simplement parce qu'il marche très bien, parce qu'il produit des fruits, parce qu'avec cet idéal nous nous donnons les moyens d'acquérir beaucoup de bon savoir, tandis que sans lui nous restons dans l'impasse. En particulier, le développement des sciences empiriques prouve par le fait, d'une façon incontestable, que l'idéal d'intelligibilité peut être atteint, et que des principes simples en petit nombre suffisent parfois pour expliquer les comportements des systèmes complexes que nous observons. Plus généralement toutes les sciences, dès qu'elles sont bien développées, justifient a posteriori l'idéal de savoir qui a conduit à les rechercher.

Un idéal de savoir est évalué à partir du savoir qu'il nous fait reconnaître ou découvrir. Comme tous les savoirs éthiques, le savoir de l'idéal du savoir se développe par une sorte de dialogue entre l'idéal et l'expérience.

Notre idéal de savoir est rationaliste et humaniste. Il est défini par des vérités éthiques universelles. Pour respecter tous les êtres humains en tant qu'observateurs, il faut honorer les bonnes observations. Pour nous respecter en tant qu'expérimentateurs, il faut honorer les expériences bien contrôlées et les lois empiriques qu'elles vérifient. Pour nous respecter en tant que raisonneurs, il faut honorer la correction logique des raisonnements. Pour nous respecter en tant que théoriciens, il faut honorer l'idéal d'intelligibilité. Pour nous respecter en tant que travailleurs, il faut honorer l'efficacité du savoir-faire. Enfin et surtout, pour nous respecter en tant qu'êtres humains rationnels, il faut honorer le savoir éthique humaniste.

Diversity, solidarity and unity.jpg Diversity, solidarity and unity 2.jpg

Blanc a besoin de Bleu, Bleu a besoin de Vert et Vert a besoin de Blanc, pour tenir debout.


Chapitre suivant >>


La recherche et la découverte

La volonté de savoir[modifier | modifier le wikicode]

L'acquisition du savoir est d'abord naturelle et involontaire. Le développement des instincts, l'apprentissage et la mémoire font qu'un animal acquiert du savoir tout au long de sa vie. L'agent apprend simplement en vivant, même s'il ne cherche pas à apprendre. Mais l'acquisition du savoir peut aussi être le but d'un effort volontaire : l'agent se donne pour fin la production d'un savoir et s'efforce d'agir, ne serait-ce qu'intérieurement, pour l'atteindre. Autrement dit, il veut résoudre un problème qu'il s'est posé.

Comment chercher ce qu'on ne sait pas ? Si on ne sait pas ce qu'on cherche, on ne peut pas le chercher. Si on sait ce qu'on cherche, il n'y a rien à chercher, puisqu'on le sait déjà. Donc on ne peut jamais rien chercher. Où est l'erreur dans ce sophisme de Ménon, rapporté par Platon ? Il confond la connaissance d'un problème avec la connaissance de sa solution. On peut connaître les conditions d'un problème, donc on sait ce qu'on cherche, sans connaître sa solution, donc on ne sait pas d'avance ce qu'on espère trouver.

Une méthode générale de résolution de problèmes consiste à identifier toutes les possibilités de solution (toutes les actions et les séquences d'actions possibles par exemple) et à les essayer jusqu'à ce qu'on en trouve une qui atteigne l'objectif désiré. Cette méthode est très efficace tant que le nombre de possibilités à essayer n'est pas trop grand. Mais même les supercalculateurs les plus puissants ne peuvent pas résoudre ainsi certains problèmes parce que l'espace des possibilités qu'ils doivent essayer est beaucoup trop grand.

Une heuristique est une méthode de résolution de problèmes qui explore l'espace des possibilités de solution en sélectionnant certaines qui semblent prometteuses (Newell & Simon 1972, Russell & Norvig 2010). L'apprentissage par l'exercice peut être considéré comme une résolution d'un problème fondée sur une heuristique simple. Le problème est défini par les objectifs que le savoir-faire désiré doit atteindre et par leurs conditions initiales. Les possibilités de solution sont les façons d'agir que l'on peut essayer. On commence par sélectionner une possibilité, pas trop mauvaise si possible, puis on expérimente des variations et on évalue leurs résultats. On modifie par étapes successives le savoir-faire initial en conservant les variations qui semblent nous rapprocher du savoir-faire désiré. On explore ainsi l'espace des possibles par petits pas, en passant d'une façon de faire à une autre qui semble l'améliorer. C'est une forme d'apprentissage par l'essai, l'erreur et la réussite.

Parce que l'imagination et l'abstraction sont créatrices, elles nous rendent capables de définir et d'explorer d'immenses espaces de possibilités et elles nous invitent ainsi à résoudre de nombreux problèmes cognitifs.

Les problèmes théoriques[modifier | modifier le wikicode]

Résoudre des problèmes théoriques consiste à se servir du raisonnement pour augmenter notre savoir. Un problème cognitif est théorique lorsqu'on recherche par le raisonnement à répondre à une question. Si nous avons besoin d'observer ou d'expérimenter pour trouver une réponse, alors la question n'est pas un problème théorique. Le savoir préalable, l'énoncé de la question et nos facultés de raisonnement doivent suffire pour trouver la solution d'un problème théorique. S'il n'existe pas de raisonnement qui permette de répondre à la question, c'est que le problème théorique est mal posé, ou que sa (méta)solution est de ne pas avoir de solution.

Pour une question fermée, il n'y a que deux solutions possibles, oui ou non. Pour une question ouverte, la solution doit nommer ou décrire un ou plusieurs êtres qui satisfont aux conditions énoncées dans la question. Les êtres ainsi nommés ou décrits sont alors les solutions du problème. Pour qu'un problème théorique soit résolu, il faut énoncer ses solutions et les justifier, en donnant un raisonnement qui prouve qu'elles sont véritablement des solutions du problème.

Un problème théorique peut être empirique, abstrait ou éthique selon la nature empirique, abstraite ou éthique de la connaissance recherchée. Pour qu'un problème empirique ou éthique soit un problème théorique bien posé il faut expliciter toutes les conditions du problème, y compris les principes qui nous serviront à raisonner pour le résoudre. Dès lors le problème devient équivalent à un problème abstrait, parce qu'il n'est pas nécessaire de tenir compte des significations empiriques pour raisonner correctement.

En général l'énoncé d'un problème empirique ou éthique n'est pas suffisamment explicite pour qu'il soit un problème théorique bien posé. Nous devons trouver ou choisir nous-mêmes les principes qui nous serviront à raisonner (Aristote, Topiques). Pour cela nous devons tenir compte évidemment de la signification empirique des termes employés dans l'énoncé du problème.

L'acquisition du savoir par la résolution de problèmes théoriques exige un savoir parlant préalable, déjà acquis, à partir duquel nous raisonnons. Grâce au raisonnement le savoir théorique déjà acquis est un tremplin pour acquérir davantage de savoir.

La résolution de problèmes théoriques est une façon de s'approcher de l'idéal d'intelligibilité. Plus nous savons raisonner pour répondre aux questions que nous nous posons sur la réalité, plus elle est intelligible .

Pourquoi les raisonnements nous permettent-ils d'acquérir des connaissances ?[modifier | modifier le wikicode]

Lorsqu'un raisonnement est logique, la conclusion ne peut pas apporter plus d'informations que celles qui sont déjà données par les prémisses. Sinon le raisonnement n'est pas logique, parce que la conclusion pourrait être fausse quand les prémisses sont vraies. Les conclusions logiques ne sont jamais que des reformulations de ce qui est déjà dit dans les prémisses. De fait de nombreux raisonnements ne nous apprennent rien, parce que la conclusion ne fait que répéter les prémisses, sous une forme légèrement différente. On dit alors qu'ils sont tautologiques. Ce sont des variations sur le thème "c'est comme ça parce que c'est comme ça".

Au sens précis défini par les logiciens, les tautologies sont les lois logiques, les lois toujours vraies quelle que soit l'interprétation donnée aux termes employés (les opérateurs logiques exceptés). Lorsqu'un raisonnement est logique, l'énoncé 'si les prémisses alors la conclusion' est toujours une tautologie, au sens des logiciens.

Les conclusions ne font que répéter ce qui est déjà dit dans les prémisses. Les raisonnements doivent être tautologiques pour être logiques. Mais alors à quoi bon raisonner ? Il semble que les raisonnements n'ont rien à nous apprendre.

La puissance d'un raisonnement vient de la généralité des principes qui lui servent de base. Si on réduit la logique au calcul élémentaire des propositions, une logique dans laquelle les énoncés ne sont jamais des lois générales, alors oui, le caractère tautologique de nos raisonnements est généralement assez évident. Quand il ne l'est pas, c'est parce que nos intuitions logiques sont limitées. Le calcul des propositions nous sert surtout à reformuler nos affirmations. Cela peut être très utile, parce que la compréhension dépend de la formulation, mais cela n'explique pas pourquoi les raisonnements nous font connaître ce que nous ne savons pas déjà.

Un énoncé est une loi générale lorsqu'il peut être appliqué à de nombreux cas particuliers. Il peut toujours être mis sous la forme :

Tout x dans D est tel que A(x)

D est le domaine d'application de la loi. A(x) est un énoncé sur x.

Tous les énoncés de la forme A(a), où a nomme un élément de D et A(a) est l'affirmation obtenue à partir de A(x) en substituant partout a à x, sont des conséquences logiques évidentes de la loi générale. A(a) est un énoncé qui porte sur un cas particulier de la loi générale.

Quand nous apprenons une loi générale, nous connaissons au départ seulement un ou quelques cas particuliers. Nous ne pouvons pas songer à tous les cas particuliers, parce qu'ils sont trop nombreux. A chaque fois que nous appliquons une loi déjà connue à un cas particulier auquel nous n'avons pas songé auparavant, nous apprenons quelque chose.

Une loi générale est comme un condensé d'informations. En une seule phrase elle détermine une foule d'informations sur tous les cas particuliers auxquels elle peut être appliquée. Lorsque nous raisonnons avec des lois ce que nous découvrons n'est pas déjà dit dans les prémisses, il est seulement impliqué de façon implicite. Les raisonnements nous font découvrir tout ce que les lois peuvent nous enseigner.

La critique est une heuristique[modifier | modifier le wikicode]

Lorsque le savoir est abstrait, en mathématiques en particulier, il est possible de donner des preuves infaillibles. Si on est sceptique, il suffit de vérifier la correction logique de la preuve pour supprimer toute possibilité de doute. Dans les sciences empiriques, il est parfois possible de s'approcher de cet idéal d'infaillibilité, lorsque nous avons d'excellentes théories dont les principes sont bien vérifiés par des expériences bien contrôlées. Mais très généralement nos preuves et notre savoir ne sont pas infaillibles. Si nous exigions du savoir qu'il soit infaillible pour être honoré comme un savoir, il faudrait nous priver de la plupart de nos connaissances. Et nous ne pourrions même pas développer le savoir. Une science parvenue à maturité, qui a atteint ou s'est approchée de l'idéal d'infaillibilité, n'a pas toujours été ainsi. Dans ses commencements elle était mêlée à beaucoup d'erreurs ou d'incertitudes.

La raison est naturellement et nécessairement faillible parce qu'elle est en perpétuel développement. Pour que la vérité d'un énoncé puisse être décidée de façon infaillible il faut que la signification, empirique ou abstraite, des termes employés soit déterminée et fixée avec précision. Mais ce n'est pas ainsi que nous nous servons couramment de la parole. Et cela n'est pas souhaitable. Le plus souvent nos paroles sont données pour être interprétées. Nous inventons tous les jours de nouvelles interprétations, de nouvelles significations et de nouvelles expressions. Même les principes ne sont pas immuables, parce qu'à partir d'un même principe nous pouvons inventer d'innombrables variations. La multitude des possibilités d'interprétation est vitale pour l'acquisition du savoir et le développement de la raison, mais elle les rend très faillibles, parce que la vérité d'une parole dépend de son interprétation.

Un comportement ou un programme d'action est tolérant aux fautes lorsque l'erreur ne l'empêche pas de fonctionner correctement. Si des erreurs se produisent, elles sont simplement réparées ou corrigées, et le système continue à fonctionner. Il en va souvent ainsi, pas toujours, pour l'acquisition et l'utilisation du savoir. Heureusement. Sinon nous ne pourrions pas développer la raison.

Si la raison était généralement infaillible, la critique se réduirait à l'examen des preuves. Une fois que leur infaillibilité est vérifiée il ne resterait plus de place pour le doute ou la discussion. Mais généralement la raison n'est pas infaillible.

On peut douter d'une preuve en soupçonnant sa correction logique. Le plus souvent nos raisonnements ne sont pas complètement explicites. Nous laissons dans l'ombre une partie des prémisses nécessaires pour inférer nos conclusions, parce qu'elles semblent plutôt évidentes. Tout expliciter serait fastidieux. Mais ce recours à l'implicite cache parfois des erreurs de logique. Pour les détecter il faut expliciter l'implicite.

Même lorsque sa correction logique n'est pas suspecte, on peut douter d'une preuve en doutant de ses prémisses. Nous justifions notre savoir en donnant des preuves fondées sur des principes. Mais les principes doivent être eux-mêmes justifiés. Il faut qu'ils fassent leurs preuves en nous aidant à développer un bon savoir. Chacun peut se servir de sa propre expérience pour mettre des principes à l'épreuve et apprendre ainsi à reconnaître leur valeur. Mais il ne faut pas se limiter à sa propre expérience. Quand on prend un principe comme base d'un raisonnement, on affirme implicitement qu'il a une valeur universelle, qu'il peut servir à tous ceux qui veulent raisonner. Un principe doit donc être mis à l'épreuve de toutes les expériences de tous les êtres humains. Un principe fait ses preuves en aidant tous les êtres humains à développer un bon savoir.

Afin d'évaluer nos preuves nous devons les soumettre volontairement à la critique de tous les êtres humains. Les objections et les tentatives de réfutation peuvent nous conduire à modifier nos raisonnements, et parfois même à les abandonner, si la réfutation est décisive. Nous développons le savoir en conservant les principes et les preuves qui résistent bien aux épreuves critiques et en renonçant aux autres.

Tout le développement du savoir peut être conçu comme la résolution d'un unique et vaste problème. L'objectif est un savoir qui satisfasse notre désir d'intelligibilité. Nous explorons l'espace des possibles à chaque fois que nous examinons un savoir en vue de l'évaluer. Les épreuves critiques sont destinées à sélectionner les possibilités prometteuses. La critique est donc une heuristique qui nous aide à résoudre le problème du développement de la raison (Goodman 1955, Rawls 1971, Depaul 2006).

La découverte de la raison[modifier | modifier le wikicode]

Comme on peut simuler par l'imagination un dialogue critique, imaginer qu'on doit défendre ce qu'on prétend savoir en face d'un sceptique qui veut nous réfuter, on peut obtenir les bénéfices de l'esprit critique simplement en exerçant sa pensée en solitaire. Mais le développement de la raison est surtout une œuvre collective (Leibniz 1688-1690, Goldman 1999), à laquelle chaque être humain peut participer dès qu'il le veut, qu'il sait qu'il en est capable et qu'il se soumet volontairement à sa discipline : justification, évaluation et critique.

Nous ne connaissons pas d'avance la portée de nos capacités à résoudre des problèmes. Nous la découvrons par l'exercice. En résolvant des problèmes, nous prenons davantage conscience de nos capacités. Mieux nous les connaissons et plus nous pouvons étendre leur champ d'applications. Nous nous découvrons ainsi nous-mêmes en tant qu'êtres rationnels, c'est à dire capables de développer la raison. Tous les développements de la raison sont des découvertes, parce que nous ne savons pas ce que la raison nous révélera avant de nous mettre au travail. Nous découvrons que nous sommes capables d'inventer ou de dévoiler la raison.


Chapitre suivant >>


Qu'est-ce que la raison ?

Science de l'individuel ou science du général ?[modifier | modifier le wikicode]

La science est-elle plutôt de connaître des individus ou des concepts ?

La science doit être la connaissance de la la vérité sur la réalité. Or seuls les individus sont vraiment réels. Les concepts ne sont que des représentations. La science doit donc être la science des individus pour être vraiment la science.

La science doit être un savoir universel, le même pour tous. Or les individus concrets ont une existence éphémère. Ils viennent de la poussière et redeviendront poussière. Comment la connaissance d'un individu pourrait-elle mériter le nom de science ? Comment pourrait-elle être un savoir qui mérite d'être partagé par tous ?

Une loi porte toujours sur un domaine d'individus. Elle peut ne mentionner aucun individu particulier. Sa vérité est alors générale et dépend seulement des concepts qu'elle mentionne. Elle est donc un savoir de l'universel. Il semble que pour mériter d'être partagée par tous, la science doit être la connaissance des lois, donc être un savoir de l'universel. La science est parfois définie ainsi : le savoir universel de l'universel (Aristote, Seconds Analytiques).

Faut-il en conclure que la science ne connaît que des concepts et qu'elle ignore les individus ?

La connaissance des concepts n'est pas séparée de celle des individus puisqu'en attribuant des concepts aux individus on connaît en même temps les individus et les concepts. Un individu est connu à partir des concepts qui lui sont attribués. Mais on peut aussi dire qu'un concept est connu à partir des individus auxquels il est attribué.

Pour bien connaître un individu il ne suffit pas de le percevoir, ou de savoir ce que d'autres ont perçu de lui, il faut aussi savoir raisonner à son sujet, parce qu'on peut ainsi déduire ce qui n'a pas encore été perçu. Et pour raisonner il faut connaître des lois. Même si on s'intéresse avant tout aux individus concrets, et non aux concepts, on a besoin des concepts et des lois, donc de la science du général, pour faire la science des individus.

Un individu est toujours connu avec une constellation de concepts : tous les concepts que nous lui attribuons. Une telle conjonction suffit en général pour l'identifier parmi les autres individus, parce qu'elle suffit pour le distinguer parmi les autres, mais elle ne détermine pas complètement son individualité, parce qu'elle pourrait être également vraie d'un autre individu, une sorte de jumeau. Un individu n'est donc jamais vraiment connu dans son individualité, mais seulement comme exemple d'une possibilité conceptuelle.

Certains concepts sont utilisés pour n'être vrais que d'un seul individu. On peut les nommer avec des noms propres et ils sont déterminés par les systèmes de détection qui permettent d'identifier les individus. Mais comme un individu peut toujours en principe avoir un jumeau, ces systèmes de détection ne peuvent pas être parfaits.

La permanence est le seul véritable critère qui permet d'identifier un individu. Si on suit en continu la trajectoire d'un mobile, et s'il ne s'est pas évaporé en cours de route, on peut être à peu près sûr que l'individu à la fin est le même qu'au début. C'est ainsi que nous nous reconnaissons nous-mêmes comme des individus. Je sais que je suis moi et que je ne serai jamais un autre parce que je suis un témoin permanent de moi-même.

Ressemblance et généralité[modifier | modifier le wikicode]

Pourquoi les lois sont-elles parfois vraies ? Pourquoi y a-t-il des vérités générales ? Les événements et les individus sont toujours très différents, pourquoi alors la même affirmation devrait-elle être vraie de très nombreux cas particuliers ? Les êtres sont tous différents, mais ils sont aussi parfois très semblables. Les généralités énoncent ce qu'ils ont en commun.

Les ressemblances et les concepts[modifier | modifier le wikicode]

Deux êtres sont semblables lorsqu'une partie de ce qui est vrai de l'un est également vraie de l'autre. Deux êtres sont différents lorsqu'une partie de ce qui est vrai de l'un est fausse de l'autre.

Attribuer un concept à un individu est une façon de de connaître ses ressemblances et ses différences. Dès que le même concept est vrai de plusieurs êtres ils sont tous semblables entre eux, et tous différents de tous les êtres pour lesquels le concept n'est pas vrai.

Comme on connaît toujours par concepts, connaître c'est toujours connaître des ressemblances et des différences.

Lorsqu'une loi est vraie de nombreux individus, ils sont tous semblables entre eux, parce qu'ils obéissent à la même loi, et tous différents de ceux qui ne lui obéissent pas. Pour connaître les lois, il faut donc connaître les façons dont les êtres peuvent se ressembler. Les principes de la science énoncent toujours des ressemblances fondamentales entre les individus et entre les systèmes.

Le raisonnement par similitude et les types[modifier | modifier le wikicode]

Le raisonnement par similitude consiste à affirmer que puisque a et b sont semblables, ce qui a été dit de a doit être également vrai de b. Utilisé sans aucune restriction le raisonnement par similitude est généralement faux, parce que deux êtres semblables sont aussi différents et qu'il y a donc des énoncés vrais de l'un qui ne sont pas vrais pour l'autre. Un raisonnement par similitude n'est pas logiquement correct.

Pour justifier le raisonnement par similitude, on peut recourir à la typologie. On ne se contente pas de dire que a et b sont semblables, on dit qu'ils appartiennent à un même type, et que ce qui a été dit de a est vrai de tous les exemples du même type. On se sert ainsi d'une loi générale. On peut alors conclure en bonne logique que ce qui a été dit de a est également vrai de b.

Un propriété commune est partagée par tous les individus d'un même type. Si p est une propriété commune du type t alors la loi générale 'pour tout x de type t, x est p' est vraie.

L'utilisation de typologies est fondamentale dans toutes les sciences. On peut songer aux structures mathématiques (en tant que types d'objets mathématiques), aux espèces de particules élémentaires, d'atomes et de molécules, aux espèces vivantes...

Les ressemblances entre les systèmes et les analogies[modifier | modifier le wikicode]

Dans cette section un système est défini par un ensemble d'individus (les composants, les constituants ou les éléments du système), de qualités attribuées à ces individus et de relations entre eux.

Lorsqu'on parle de ressemblance entre deux individus auxquels on attribue des qualités, on entend qu'une partie des qualités qui sont attribuées à l'un peut être attribuée à l'autre. Lorsqu'on parle de ressemblance entre deux systèmes, l'expression 'ce qui est vrai de l'un est également vrai de l'autre' peut recevoir une signification plus subtile. On entend qu'il existe une projection f qui permet de remplacer les individus x du premier système par des individus f(x) du second système, de telle façon que des énoncés vrais sur le premier système soient remplacés par des énoncés vrais sur le second système. Une telle projection est appelée en mathématiques un morphisme, ou un isomorphisme si elle est bijective, pour dire que les deux systèmes ont la même forme, ou la même structure.

La ressemblance entre deux systèmes peut être définie d'une façon encore un peu plus subtile. On permet à la projection f de remplacer non seulement les individus mais également des qualités ou des relations, toujours de telle façon que les énoncés vrais soient remplacés par des énoncés vrais. Lorsque la ressemblance est définie de cette façon, on dit couramment que les systèmes semblables sont analogues et que la projection f est une analogie.

Les symétries[modifier | modifier le wikicode]

Pour qu'un système soit symétrique, il faut qu'il ait des parties semblables. Plus précisément, un système est symétrique lorsqu'il a des automorphismes (des isomorphismes internes). Un automorphisme est une fonction (bijective) f qui permet de remplacer les individus x du système par des individus f(x) du même système, de telle façon que des énoncés vrais soient remplacés par des énoncés vrais. Lorsque f est un automorphisme, x et f(x) sont toujours semblables. Les automorphismes d'un système forment un groupe (au sens algébrique) qu'on appelle le groupe des symétries du système.

La connaissance d'un individu d'un type permet de connaître tous les individus du même type. La connaissance d'un système permet de connaître tous les systèmes isomorphes ou analogues. Lorsqu'un système est symétrique, la connaissance d'une de ses parties suffit pour connaître toutes les autres. Les types et leurs propriétés communes, les morphismes, les analogies et les symétries permettent de généraliser nos connaissances, et de connaître par le raisonnement plus que ce que nous percevons directement.

Le principe d'équivalence de tous les observateurs et la générosité de la vérité[modifier | modifier le wikicode]

« Il n'est pas possible que la divinité soit envieuse. » (Aristote, Métaphysique, livre A, 983a)

Pour développer la science empirique, il faut postuler que tous les expérimentateurs sont équivalents, au sens où toute expérience faite par l'un doit pouvoir être refaite par un autre. Les expériences doivent être reproductibles. Si une expérience ne l'est pas, alors elle n'est pas bien contrôlée. Pour que les expériences soient reproductibles, il faut en particulier que leurs résultats ne dépendent pas du lieu ou du moment. Les conditions expérimentales doivent pouvoir être reproduites toujours et partout et conduire toujours au même résultat. En postulant le principe d'équivalence des observateurs, on postule donc du même coup que les lois de la physique sont vraies toujours et partout. Cela conduit à définir le groupe des symétries de l'espace-temps. Tous les points de l'espace-temps sont nécessairement semblables. Quand on en connaît un, on les connaît tous. Il en va de même pour toutes les directions de l'espace et plus généralement pour tous les référentiels d'observation. Il n'y pas de centre de l'espace-temps, pas de direction spatiale privilégiée (isotropie, pas de haut et de bas), et pas non plus d'état de repos absolu (principe de relativité de Galilée-Einstein). Comme les chevaliers de la Table Ronde, mais dans un espace beaucoup plus grand, les observateurs de l'espace-temps n'ont jamais de position privilégiée. Le groupe des symétries de l'espace-temps (le groupe de Poincaré) est une traduction mathématique du principe d'équivalence de tous les observateurs, de même que le groupe des symétries d'une table ronde est une traduction mathématique du principe d'équivalence de tous les chevaliers.

Le principe d'équivalence de tous les observateurs n'est pas seulement au fondement de la physique théorique, de sa vérité et de sa beauté, il est également fondamental pour toutes les sciences, empiriques, éthiques et abstraites, parce que la raison exige que le savoir soit universel, que tout ce qui est un savoir pour l'un puisse également être un savoir pour tous les autres.

Quand nous comprenons que le savoir est universel, nous comprenons du même coup le grand principe à partir duquel fonder tout le savoir rationnel. Tout se passe comme si la vérité était une divinité généreuse, qui donne sa sagesse à tous ceux qui veulent vraiment la connaître. La première vérité sur la vérité est que justement elle est généreuse. Elle n'est pas envieuse, elle ne nous prive pas du meilleur. Elle ne serait pas la meilleure si elle privait un seul d'entre nous du meilleur. En sachant que le savoir peut être partagé par tous, nous avons le savoir fondamental qui nous donne les moyens de comprendre tout le savoir rationnel.

La Nature obéit-elle vraiment à des lois ?[modifier | modifier le wikicode]

Nous croyons aux conclusions de nos raisonnements parce que nous croyons à la vérité des lois avec lesquelles nous raisonnons. Nous croyons que nous sommes capables de développer les sciences parce que nous croyons au principe d'équivalence de tous les observateurs.

Il est dans la nature de l'esprit de raisonner et donc de postuler des lois avec lesquelles raisonner. Un esprit ne peut pas développer son esprit sans penser à des lois. Il semble donc que l'existence des lois résulte de la nature de l'esprit. Mais la matière semble en général naturellement sans esprit, pourquoi obéirait-elle à des lois ?

Pour justifier nos savoirs et le principe d'équivalence de tous les observateurs, nous avons besoin de postuler que la Nature obéit à des lois, mais est-ce vraiment une croyance justifiée ? N'est-ce pas plutôt prendre son désir pour une réalité ? Il se pourrait que toutes les lois de la Nature auxquelles aujourd'hui nous croyons soient toutes réfutées par des observations à venir. Et la Nature ne pourrait-elle pas être sans loi ?

La matière ne serait pas la matière si elle n'obéissait pas à des lois. La matière est nécessairement détectable, elle doit donc obéir à des lois de détection, qui résultent des lois fondamentales d'interaction. Une matière qui n'obéirait à aucune loi ne serait pas détectable, et il n'y aurait pas de raison de l'appeler matière. Nous ne savons pas du tout ce que ce pourrait être, cela semble inconcevable.

Tout se passe comme si la matière et l'esprit avaient été faits l'un pour l'autre, parce que la nature de la matière est d'obéir à des lois et que la nature de l'esprit est de connaître les lois.

Ni la matière, ni a fortiori la vie et la conscience, ne pourraient exister et se développer si la Nature n'obéissait pas à des lois. Nous ne serions pas là pour en parler.

Nous n'avons pas à attendre de nos expériences qu'elles prouvent définitivement que la Nature obéit à des lois, ce qu'elles ne peuvent pas faire, puisque toute loi vérifiée aujourd'hui pourrait être réfutée demain, mais seulement qu'elles nous aident à trouver les lois de la Nature. Nous savons d'avance que la Nature obéit à des lois mais nous ne savons pas lesquelles. Comme la Nature ne semble pas être malicieuse, mais plutôt généreuse, il semble qu'un travail honnête et des expériences bien contrôlées suffisent pour trouver et prouver les lois auxquelles elle obéit. Si une loi est vérifiée par une expérience bien contrôlée, ou si elle est une conséquence logique de prémisses déjà bien prouvées, elle peut être considérée comme prouvée, jusqu'à preuve du contraire.

Où trouve-t-on le grain à moudre ?[modifier | modifier le wikicode]

La raison consiste à développer en commun un savoir universel, en cherchant honnêtement des vérités et des preuves, en respectant le principe d'équivalence de tous les observateurs, et plus généralement en se soumettant volontairement à toutes les règles de l'esprit critique.

La discipline critique nous rend capable de développer le savoir en mettant des théories à l'épreuve. Elle est comme un moulin, destiné à donner de la bonne farine, du bon savoir, à partir des théories qu'on lui donne. Mais où trouve-t-on le grain à moudre ? D'où sortent les théories que nous soumettons à la critique ?

Il n'y a pas à chercher très loin : tout ce qui nous passe par la tête et tout ce que nous disons, les pensées de bon sens, ou contraires au bon sens, les intuitions banales, ou originales, même les rêves et les délires, parce qu'ils nous font penser et parler. N'importe quelle pensée est candidate pour un examen critique, mais bien sûr on ne veut pas n'importe quoi. On cherche les pensées qui nous aident à développer un bon savoir, ou qui nous font espérer qu'elles pourraient nous aider.

Quand on cherche du savoir, on se sent parfois comme égaré dans une forêt à la recherche d'un trésor dont on ignore l'emplacement, et il y a de quoi désespérer. Il faudrait un miracle pour qu'on puisse le trouver. Mais c'est une illusion, parce que l'emplacement du trésor est connu d'avance. Il ne peut être qu'en nous-mêmes. Quand on cherche du savoir, on se cherche soi-même parce qu'on cherche un savoir qui nous rend compétent. Il n'y a pas d'autre endroit où chercher. Où le savoir pourrait-il être s'il n'était pas déjà potentiellement en nous-mêmes ?

Le bon savoir est le savoir qui nous rend compétent[modifier | modifier le wikicode]

Comment reconnaît-on le bon savoir ? C'est le savoir qui nous rend compétent. Il n'y a pas de critère plus fondamental. Le bon savoir est par définition le savoir qui nous rend compétent.

Je suis pour moi-même le critère fondamental de reconnaissance du bon savoir, puisque je le reconnais en reconnaissant ma compétence. Mais cette autonomie est rationnelle seulement si elle est solidaire. Le bon savoir n'est pas seulement le savoir qui me rend compétent, c'est surtout le savoir qui nous rend compétent. Un savoir doit pouvoir être partagé pour être rationnel. Quand j'acquiers un savoir, je dois acquérir en même temps la capacité à l'enseigner, sinon mon savoir n'est pas rationnel. Pour développer la raison, nous devons travailler ensemble. Des savoirs individuels isolés ne suffisent pas pour faire la raison.

Je suis la source, le milieu et la fin de la raison. Pas moi en tant que différent de tous les autres mais en tant que semblable à tous les autres. Tous les Je, tous ceux qui peuvent penser qu'ils sont, qui peuvent dire "Je", sont les sources, le milieu et les fins de la raison, les sources parce que la raison naît de nos pensées, le milieu parce qu'elle se développe quand nous travaillons pour elle, les fins parce qu'elle est là pour que nous puissions nous accomplir.

On peut raisonner sur la raison comme si elle était la sagesse d'une personne et lui attribuer une volonté parce qu'on peut lui attribuer des fins. L'éthique nous enseigne ce qui mérite d'être poursuivi et nous donne ainsi les moyens de nous accomplir. Que nous poursuivions les fins que la raison nous prescrit peut justement être considéré comme une fin de la raison. Tout se passe comme si la raison était une bonne autorité qui nous montre les bons chemins.

Savoir qu'un esprit doit travailler pour l'esprit ne suffit pas pour décider des fins particulières que nous nous donnons. C'est ce qu'on attend d'une bonne autorité. Si elle nous privait de notre liberté, elle ne serait pas une bonne autorité. Le savoir éthique rationnel n'est pas une entreprise totalitaire qui décide à notre place de ce que nous devons faire. Il en est l'exact contraire puisqu'il nous demande de décider librement et intelligemment. On peut même affirmer qu'il est une condition de la véritable liberté, parce qu'on fait un mauvais usage de sa liberté si on ne s'en sert pas pour le bien. Plus on connaît le bien, mieux on peut le faire et vivre ainsi comme un esprit vraiment libre.

L'unité de la raison[modifier | modifier le wikicode]

Pour qu'un savoir puisse être partagé, il faut qu'il puise seulement dans des ressources communes, accessibles à tous. On pourrait croire que c'est une limite très restrictive, qu'en se privant de ressources privées, on se prive du même coup du meilleur du savoir, mais c'est l'exact contraire qui est vrai. Nos intelligences sont les plus puissantes justement quand elles se limitent aux ressources communes. C'est en nous entraidant que nous découvrons le mieux le pouvoir de nos intelligences, que nous développons les meilleurs savoirs et que nous faisons vivre la raison.

Malgré leur diversité tous les savoirs manifestent l'unité de la raison. Les grands principes de logique et de discipline critique sont les mêmes pour tous. Une telle unité est essentielle au développement des sciences. Tout ce qui est compris par quelques uns doit pouvoir être compris par tous les autres, sinon ce n'est pas la raison. De ce point de vue on peut dire que toutes les sciences parlent d'une seule voix et que tous les êtres humains contribuent au développement d'un savoir commun.

L'unité de la raison n'exclut pas la diversité, au contraire elle l'encourage. Les grands principes logiques par exemple ne nous interdisent jamais d'étudier des théories. Au contraire ils nous donnent toujours les moyens d'étudier toutes les théories, dès qu'elles sont correctement formulées.

« Tu aimeras ton prochain comme toi-même » (Lévitique 19:18) n'est pas seulement un principe religieux, c'est aussi un principe rationaliste, parce que les sciences et la raison ne peuvent se développer que par l'entraide et la coopération. Si les êtres humains ne veulent pas s'entraider la raison ne peut pas être parmi eux.

La raison est-elle seulement une invention humaine ?[modifier | modifier le wikicode]

Pour savoir que la raison existe, nous avons besoin de la faire exister, en la partageant entre nous. En ce sens, c'est nous qui la faisons. Elle ne serait pas là si nous ne travaillions pas pour la faire vivre parmi nous. Mais on aurait tort de croire qu'elle est notre invention, parce que nous ne décidons pas de ce qu'elle est, nous ne pouvons pas faire qu'elle soit ce qu'elle n'est pas, ou qu'elle ne soit pas ce qu'elle est. Quand nous travaillons nous la découvrons. Tout se passe comme si elle avait toujours été là de toute éternité, et nous sommes les derniers à l'apprendre. Nous ne savons pas par avance ce qu'est la raison, nous le découvrons tous les jours, et nous devons l'apprendre.

Les conditions d'apparition de la raison sont générales : des êtres qui parlent, c'est à dire qu'ils émettent volontairement des signaux pour influencer l'imagination et la volonté de leurs semblables, et qui veulent trouver ensemble des vérités et des preuves, en respectant le principe d'équivalence des observateurs et toutes les règles de l'esprit critique. Ces conditions ne dépendent pas spécifiquement de notre humanité sur la Terre. D'autres êtres vivants, sur d'autres planètes, en d'autres temps, ou dans d'autres univers, pourraient également développer la même raison, parce que ses conditions d'apparition sont universelles.

Que pouvons-nous espérer ?[modifier | modifier le wikicode]

Avant de chercher, il faut en général chercher quoi chercher, choisir soi-même les problèmes auxquels on va consacrer son travail. Mais on ne sait pas très bien ce qu'on cherche quand on cherche quoi chercher. On veut des problèmes intéressants, des sujets prometteurs, on rêve de faire des découvertes majeures, de faire progresser le savoir et la raison. Mais les conditions du problème ne sont pas bien déterminées. Que cherchons-nous quand nous cherchons à faire progresser la raison ? Et comment pouvons-nous le chercher si nous ne savons pas ce que nous cherchons ?

La raison nous rend capable, mais de quoi ? Que pouvons-nous réaliser avec les compétences que nous développons rationnellement ? Que pouvons-nous espérer ?

Si la liste des problèmes que nous pouvons résoudre rationnellement était connue d'avance, nous saurions quoi espérer. Mais justement elle n'est pas connue d'avance. Nous ne connaissons pas l'étendue des compétences que la raison peut nous donner.

Nous voulons satisfaire un désir d'intelligibilité. Nous voulons comprendre. Nous voulons des explications. Nous ne savons pas où cela nous mène, mais il n'est pas nécessaire de le savoir pour être poussé par ce désir. On peut vouloir sans savoir très bien ce qu'on veut, il suffit de rechercher une satisfaction. Nous sommes guidés par les idées même si nous ne savons pas très bien ce qu'elles sont.

Comme nous ne savons pas de quoi la raison nous rend capable, nous pouvons placer nos espoirs très haut, que le règne de la raison vienne, que sa volonté soit faite, sur la terre comme au ciel, que le présent éphémère soit la splendeur de la vérité éternelle, ou très bas, la raison ne sera jamais plus qu'une pauvre consolation dans une vallée de larmes.

Le développement de la raison est l'histoire d'un étonnement perpétuellement renouvelé. Les sciences ont dépassé nos espérances. La Nature nous a révélé beaucoup plus de secrets que ce que nous pouvions rêver. Il n'est plus possible d'être sceptique. La puissance de la science est devenue incontestable.

Pour savoir de quoi la raison nous rend capable, la meilleure façon, et la seule, est d'essayer. Si on n'essaie pas on n'a aucune chance de se rendre compte de ce qui marche. C'est pourquoi il faut espérer. On pèche plus souvent par défaut d'espoir que par excès.

La preuve d'Anselme[modifier | modifier le wikicode]

Nous ne savons pas très bien ce qu'est Dieu mais nous savons que nous ne pouvons lui attribuer aucun défaut. S'il avait une imperfection il ne serait pas Dieu. Il réunit en lui toutes les perfections. Sa sagesse est parfaite. Il choisit toujours le meilleur des possibles. Sa puissance n'est limitée par aucun adversaire. Il en va de même pour toutes les qualités qu'on peut songer à lui attribuer. Il est toujours le meilleur, ou la somme de toutes les perfections.

Un être fictif est atteint d'une imperfection, justement qu'il est seulement fictif, qu'il n'est rien de plus qu'un produit de l'imagination. Puisque Dieu réunit en lui toutes les perfections, il ne peut pas être fictif, donc il existe.

Tel est l'argument (Anselme d'Aoste 1078) de Saint Anselme, archevêque de Canterbury, pour prouver l'existence de Dieu.

On accuse parfois Anselme de commettre une faute de logique, surtout depuis Kant (1781). Mais si on la comprend bien, la preuve d'Anselme est tout à fait logique et rationnelle.

Pour un libre penseur rationaliste, l'affirmation initiale, qu'on ne peut attribuer à Dieu aucun défaut, est simplement une hypothèse avec laquelle on peut raisonner, comme avec n'importe quelle hypothèse. Rien ne nous interdit de faire des hypothèses et de voir, par le raisonnement, si elles peuvent nous enseigner quelque chose.

L'argument d'Anselme prouve avec une logique impeccable, parfaitement rigoureuse, que penser à un Dieu fictif est comme penser à un cercle carré. On raisonne mal sur Dieu, sur l'être sans défaut, si on le conçoit seulement comme un produit de notre imagination. Un être sans défaut ne peut pas être purement imaginaire, parce qu'être seulement imaginaire est un défaut. La logique, notre faculté naturelle de raisonner, suffit pour le prouver.

Comme toutes les preuves mathématiques, la preuve d'Anselme révèle une vérité tautologique. La conclusion, que Dieu existe, est déjà affirmée dans la prémisse, puisqu'elle fait l'hypothèse qu'il existe un être sans défaut. Mais ce caractère tautologique n'invalide pas la preuve, au contraire. Tous les raisonnements révèlent des vérités tautologiques, sauf s'ils commettent des erreurs de logique.

La preuve d'Anselme ne suffit pas pour convaincre un sceptique. Elle montre seulement qu'on peut raisonner correctement sur un être sans défaut, et qu'il doit être plus qu'une fiction pour être vraiment sans défaut. Mais cela ne suffit pas pour prouver que cet être sans défaut n'est pas une fiction, puisqu'on peut raisonner correctement sur des fictions.

Que nous puissions raisonner correctement sur un être sans défaut est le point important. La lumière naturelle suffit pour connaître le meilleur. Tout se passe comme si Dieu nous avait donné la faculté de raisonner et l'idée d'un être sans défaut pour que nous puissions le connaître. Un sceptique peut toujours répondre qu'un tel savoir est hypothétique, ce qu'il est, mais cela n'empêche pas de le développer. Si c'est vraiment un bon savoir, il suffit de découvrir par le raisonnement tout ce qu'il peut nous enseigner pour s'en rendre compte. Un bon savoir porte des fruits.

Anselme prouve l'existence de Dieu à partir de l'idée d'un être sans défaut, mais dire que Dieu existe, ce n'est que savoir très peu de Lui. La prémisse, que Dieu est sans défaut, le meilleur, la somme de toutes les perfections, est beaucoup plus importante que la conclusion, qu'il existe, parce qu'elle est beaucoup plus riche de conséquences, parce qu'elle nous apprend tout ce que nous avons besoin de savoir sur Dieu.

Il y a de nombreuses façons d'exister. Quand on affirme l'existence de Dieu, on ne parle pas de n'importe quelle façon d'exister, on veut surtout dire qu'il existe en tant que Créateur, qu'il nous a prouvé son existence en créant l'Univers, que la Création est la révélation de sa vérité. L'existence de Dieu, c'est la Création, c'est la matière et la lumière dans lesquelles nous vivons.

Puisque Dieu est le meilleur, il a la meilleure des existences. Être le meilleur et ne pas nous en faire profiter est de la faiblesse ou de l'égoïsme et ne peut donc pas être le meilleur. Dieu a créé le monde parce qu'il est généreux. Il ne serait pas le meilleur sans cette générosité.

L'affirmation que Dieu est la somme de toutes les perfections est une hypothèse ouverte. A elle seule elle reste très indéterminée. Elle nous invite à raisonner. Il faut la compléter en affirmant quelles sont ces perfections que nous pouvons attribuer à Dieu. Quand on affirme qu'il est le meilleur on ne sait pas d'avance ce que c'est qu'être le meilleur, on doit l'apprendre.

Anselme est le saint des penseurs rationalistes (Descartes, Spinoza, Leibniz, Hegel ... mais pas Kant, parce qu'il se faisait des illusions sur la raison) et de tous les croyants, chrétiens ou non, qui croient que la science est un don de Dieu.

La théologie rationnelle est la connaissance rationnelle de Dieu. Mais comment Dieu peut-il être connu rationnellement ? A partir de son œuvre, y compris la raison. Toute la création, sans exception, peut être interprétée comme la parole de Dieu. Tout parle, tout dit la parole de Dieu. En donnant la création, Dieu a donné sa parole et les êtres capables de l'entendre. La raison est le savoir et la sagesse qu'il nous fait partager.

Les épidémies, la famine, la misère, la torture, les massacres et toutes les horreurs, font partie de la création. Si Dieu est le meilleur, pourquoi laisse-t-il exister toutes les horreurs ? L'existence du mal n'est-elle pas une preuve que tous les discours sur les perfections divines sont vains et insensés ? (Voltaire 1759)

On ne peut pas toujours raisonner sur les perfections divines comme sur les perfections humaines (Spinoza 1677). Pour un être humain, laisser le mal exister dans sa demeure n'est sûrement pas une perfection. Mais transposer ce raisonnement à l'Univers et à son créateur ne semble pas légitime. Nous ne savons pas ce que pourrait être un univers qui ne laisserait pas exister le mal, parce qu'il nous priverait de notre liberté, et parce que la privation de liberté est un mal. Mais surtout nous ne sommes pas en position de juger ce que Dieu aurait dû faire et qu'il n'a pas fait. Croire que nous pouvons savoir mieux que Dieu ce qu'il aurait dû faire est vain et insensé. Évidemment nous ne pouvons pas lui apprendre ce que c'est qu'être le meilleur, c'est lui qui nous l'apprend.

Du point de vue de certains athées (pas tous) l'expression théologie rationnelle est contradictoire, comme un cercle carré. Ils ne font pas la différence entre la religion et la superstition et considèrent que les croyances religieuses ne sont que des fantasmes. Le développement des sciences et de la raison est supposé nous ouvrir les yeux et nous débarrasser de ces vaines illusions. Mais cette prétendue opposition entre la raison et les religions est contredite par l'histoire du développement des savoirs. De très nombreux savants ont fait progresser les sciences en cherchant à connaître Dieu à partir de son œuvre. Et l'existence même de la raison, de notre capacité à la développer, peut être interprétée comme une preuve de la générosité divine. Athées ou croyants, nous ne savons pas par avance ce qu'est la raison, nous le découvrons tous les jours, et nous devons l'apprendre. Les athées ne sont pas les seuls à s'opposer à la déraison, les croyants aussi. Et il n'est pas nécessaire d'être athée pour être scientifique. Si l'athéisme conduit à ignorer tout ce que les religions enseignent sur la raison, il devient aveuglant.


- Ah bon, tu ne sais pas que Dieu existe ?

- Je ne l'ai jamais vu. Pourquoi je croirais qu'il existe ?

- On ne peut pas le voir. Pour le reconnaître dans sa création, il faut le connaître par la pensée. Si tu le cherches dans ta pensée, et si tu veux le trouver, tu le trouveras. Il n'abandonne jamais personne, surtout pas ceux qui le cherchent.


« Dieu, personne ne l'a jamais contemplé. Si nous nous aimons, Dieu habite en nous et son amour se réalise en nous. Nous savons que nous somme en lui et qu'il est en nous grâce au Souffle qu'il nous a donné. » (1 Jean 4, 12-13, traduit par Florence Delay et Alain Marchadour)


La bague de mariage entre Dieu et la vie (Genèse 9, 8-17) :

Double rainbow.jpg


Chapitre suivant >>>


Applications

Le savoir épistémologique est appliqué à chaque fois que nous acquérons ou utilisons volontairement du savoir. Pour acquérir du savoir il faut savoir le reconnaître et l'évaluer quand on le trouve, et il faut savoir se donner les moyens de l'acquérir. Le savoir épistémologique est toujours au cœur du savoir. Il accompagne toutes les formes de savoir. Aucune ne peut s'en passer, parce que pour savoir, il faut savoir reconnaître le savoir.

Le savoir épistémologique est de toute première importance pour la recherche et l'évaluation des principes des sciences. Les mathématiciens qui discutent des principes des mathématiques font un travail qui est en même temps mathématique et épistémologique. Il en va de même pour toutes les autres sciences. La recherche fondamentale est donc une sorte de recherche épistémologique appliquée.

Les applications de l'épistémologie peuvent être très concrètes. Dans tous les domaines pratiques où l'acquisition et l'utilisation d'un bon savoir sont d'une importance cruciale, donc à peu près toujours, un solide savoir épistémologique peut faire la preuve de son utilité. La pédagogie et la thérapie cognitive sont directement concernées, mais plus généralement la plupart des enjeux importants pour les êtres humains dépendent de nos capacités à acquérir et utiliser collectivement le savoir : la santé publique, l'écologie, l'économie et la finance, la justice et la démocratie, la vérité et le mensonge dans les médias, la fiabilité et la sécurité des équipements ...

L'intelligence artificielle est aussi une application de l'épistémologie, parce qu'on peut développer de nouvelles techniques en imitant la vie.

  1. La pédagogie de l'autonomie
  2. Qu'est-ce que la métaphysique ?
  3. Principes logiques
  4. L'incomplétude des principes mathématiques
  5. La vérité des principes relativistes
  6. Pourquoi l'entropie est-elle réelle ?
  7. La théorie quantique des destinées multiples
  8. L'origine et l'évolution de la vie et de l'esprit
  9. Les vertus thérapeutiques de l'autonomie


La pédagogie de l'autonomie

Les arguments d'autorité[modifier | modifier le wikicode]

Un argument d'autorité consiste à dire qu'il faut croire un énoncé parce que X l'a dit, où X est une personne qui fait autorité. Un argument d'autorité est un aveu d'ignorance. On sait qu'un énoncé est un savoir quand on sait le justifier, quand on sait pourquoi il est un savoir. Faire appel à l'autorité d'autrui revient à admettre qu'on ne sait pas le justifier, qu'on n'est pas capable de le reconnaître comme un savoir, donc qu'on ne sait pas.

Lorsque la parole se réduit à la communication d'un argument d'autorité - crois-moi parce que je le dis, ou parce que X l'a dit, - oui je te crois parce que tu l'as dit, ou parce que X l'a dit - il y a seulement un ignare qui parle à un ignare. Ni celui qui parle, ni celui qui écoute et approuve, ne savent de quoi ils parlent, puisque pour savoir il faut justifier rationnellement ce qu'on dit. Ils ne partagent pas le savoir mais seulement leur ignorance.

Tenir pour vrai ce qu'on croit parce qu'on l'a pensé revient à s'incliner devant un argument d'autorité, c'est donc toujours une façon d'ignorer.

Il faut distinguer les arguments d'autorité des arguments d'observation. Tenir pour vrai ce qu'on croit parce qu'on l'a observé, et parce qu'on était bien placé pour l'observer, n'est pas pareil que s'incliner devant l'arbitraire.

L'autorité de la raison[modifier | modifier le wikicode]

Lorsqu'on donne des preuves, des justifications rationnelles de ce qu'on dit, on ne fait pas appel à l'autorité arbitraire d'une personne ou d'une tradition, mais seulement à l'autorité de la raison. On ne demande pas à être cru sur parole. On demande au contraire que nos justifications soient soumises à un examen critique. Sont-elles de bonnes justifications ? Prouvent-elles vraiment ce qu'elles prétendent prouver ? Lorsqu'on impose un argument d'autorité on demande la soumission à ceux qui écoutent ou qui lisent, on ne leur accorde pas la liberté d'exercer leur raison. Lorsqu'on donne des justifications rationnelles on leur demande au contraire d'exercer leur raison et d'affirmer ainsi leur liberté.

Savoir et liberté sont inséparables. Pour que le savoir puisse se développer, il faut que la liberté de donner des preuves soit respectée, donc la liberté de contester tous les arguments d'autorité. Inversement il n'y a pas de véritable liberté dans l'ignorance, parce que pour affirmer sa liberté on a besoin d'un savoir éthique (pour savoir ce qui mérite d'être fait) et d'un savoir empirique (pour savoir comment le faire).

L'erreur fondationnaliste[modifier | modifier le wikicode]

Puisqu'un savoir doit toujours être justifié pour être un savoir, on pourrait songer à imposer une discipline pédagogique très rigoureuse : demander à l'élève de récuser toutes les croyances qu'il ne sait pas justifier, puis lui enseigner de façon progressive un savoir qui est toujours justifié à partir du savoir préalablement reconnu. Le savoir premier, reconnu au départ, regrouperait toutes les formes de savoir qui se justifient d'elles-mêmes. Elles constitueraient ainsi des fondations à partir desquelles tout le reste du savoir pourrait être prouvé par le raisonnement. Le fondationnalisme consiste à croire que l'ensemble du savoir peut être prouvé et enseigné à partir d'un savoir fondamental qui se justifie de lui-même. Pour constituer ce savoir fondamental, on peut songer aux bonnes observations, aux lois confirmées par de bonnes expériences et aux principes dont la vérité peut être admise par définition des termes employés.

Le fondationnalisme est une erreur à la fois épistémologique et pédagogique. L'idéal fondationnaliste n'est pas un bon idéal de savoir tout simplement parce qu'il ne peut pas être atteint et parce qu'il est souvent vain d'essayer de s'en rapprocher. Il faudrait que nous soyons capables de reconnaître dès le départ, avant même de commencer à apprendre, un savoir qui se justifie pleinement de lui-même et qui suffise pour justifier tout le reste. Mais nous n'en sommes pas capables.

Nos facultés naturelles nous permettent parfois de reconnaître les bonnes observations et les bonnes expériences, mais leur fiabilité est limitée aux domaines qui nous sont les plus familiers, et même là elles ne sont pas infaillibles. En général pour reconnaître les bonnes observations et les bonnes expériences il faut avoir acquis beaucoup de savoir au préalable. Le savoir empirique ne peut pas progresser d'une façon linéaire et cumulative en prenant les bonnes observations et les lois empiriques bien vérifiées comme fondations, parce que les théories servent à justifier et évaluer les observations et les expériences.

Dire que les principes sont vrais par définition ne suffit pas pour les justifier pleinement. On ne veut pas qu'ils soient seulement vrais par définition, on veut surtout qu'ils soient de bons principes, qu'ils portent des fruits, qu'ils nous donnent les moyens de développer un bon savoir. Mais nous ne pouvons pas le savoir par avance, avant de nous servir des principes pour raisonner et acquérir du savoir. Même le savoir abstrait ne peut pas progresser d'une façon linéaire et cumulative en prenant les principes comme fondations, parce que les principes doivent être évalués à partir de leurs applications.

Savoir reconnaître, justifier et évaluer le savoir ne s'apprend pas en un jour. Les chemins de l'acquisition du savoir procèdent rarement de certitudes bien justifiées en certitudes bien justifiées. Le débutant est plongé dans un océan d'incertitudes, où tout est plus ou moins hypothétique, où on avance en tâtonnant, avec de fréquents retours en arrière. Au début on ne sait pas justifier grand chose, ou pas très bien. On acquiert petit à petit la capacité à reconnaître, justifier et évaluer le savoir en même temps qu'on acquiert du savoir, en se confrontant à des exemples, en étudiant des principes, des raisonnements, des théories, des observations et des expériences. C'est seulement à la fin, quand on est devenu vraiment compétent, qu'on est vraiment capable de reconnaître, de justifier et d'évaluer le savoir acquis.

Devenir un enseignant pour soi-même[modifier | modifier le wikicode]

L'élève (l'apprenant, le débutant, l'étudiant, le néophyte) est dans une position semblable à celle du chercheur, expérimentateur ou théoricien. Lorsqu'il invente un nouvel instrument d'observation, une nouvelle expérience, un nouveau modèle ou une nouvelle théorie, le chercheur doit se prouver à lui même, et aux autres, par l'expérience et le raisonnement, que c'est un bon instrument, que l'expérience est bien contrôlée, que le modèle explique le réel, ou que la théorie permet d'acquérir du bon savoir. On ne le sait pas d'avance. Au début tout est très incertain, très hypothétique. C'est seulement à la fin, quand on a obtenu de bonnes preuves, qu'on sait qu'on a acquis un bon savoir.

Évidemment un élève ne peut pas trouver tout seul en quelques années toutes les preuves que les êtres humains ont mis des siècles à découvrir. Il acquiert du savoir en étudiant les preuves qu'on lui donne. Il doit vérifier qu'elles sont de bonnes preuves en s'assurant qu'il pourrait se les donner à lui-même, qu'elles sont en accord avec ses facultés naturelles d'observation et de raisonnement. Les preuves qu'on lui donne doivent être des preuves qu'il pourrait se donner.

En même temps qu'on apprend à reconnaître la valeur des preuves qu'on nous donne, on découvre qu'on est soi-même capable de découvrir des preuves, d'abord les plus faciles, les plus courtes, les plus simples, puis des preuves de plus en plus difficiles. On devient ainsi de plus en plus capable de répondre aux questions qu'on se pose et on progresse en autonomie. Le rôle de l'enseignant est d'assister l'élève dans son apprentissage de l'autonomie, de lui donner les moyens de se donner des preuves. L'élève doit s'enseigner à lui-même le savoir qu'il acquiert, l'enseignant doit lui en donner les moyens.

On acquiert du savoir en se donnant des preuves, en se les enseignant à soi-même. Et en même temps qu'on se donne des preuves, on découvre qu'on est capable de savoir, on se prouve à soi-même qu'on est capable de se donner des preuves. Chaque bonne preuve, en plus de prouver ce qu'elle affirme, nous prouve que nous sommes capables de prouver la vérité, et donc de l'enseigner, à soi-même et aux autres.

S'approprier les principes de la science[modifier | modifier le wikicode]

Toutes les sciences s'efforcent de rassembler des principes pour expliquer et prouver tout ce qu'elles nous donnent à connaître. Quand on apprend une science on doit apprendre à se servir de ses principes. Pour le néophyte, ils sont en général très hypothétiques. On apprend petit à petit, en raisonnant à partir d'eux, tout ce qu'ils peuvent nous enseigner, et on reconnaît ainsi leur valeur. On se rend alors capable de développer soi-même la science, à partir des mêmes principes, ou en les modifiant et en les complétant. On s'est approprié le pouvoir de raisonner et de savoir qui nous est donné par les grands principes de la science.

Les sciences sont très nombreuses et diversifiées, et si on compte comme principes toutes les prémisses qui peuvent apparaître dans leurs raisonnements, les principes sont encore plus nombreux, de quoi remplir des milliers de pages dans une encyclopédie. Mais certains principes sont plus fondamentaux que d'autres. Il y a des principes des principes, c'est à dire des principes qui nous servent à trouver et à justifier les autres principes. Les principes des principes sont les grands principes qui nous ouvrent les portes de tous les savoirs. Lorsqu'il s'efforce de les comprendre pour se les approprier, le débutant se rend capable de savoir tout ce qui peut être su.

Les principes des principes de la logique, des mathématiques, de la physique et de la biologie sont présentés et expliqués dans les chapitres suivants. Comme les principes des principes de la psychologie et de l'épistémologie ont été présentés dans les deux premières parties, ce livre donne une vue d'ensemble des principes les plus fondamentaux des sciences les plus fondamentales.


Chapitre suivant : Qu'est-ce que la métaphysique ? >>>


Qu'est-ce que la métaphysique ?

Les plus grandes questions[modifier | modifier le wikicode]

La métaphysique étudie les plus grandes questions.

Ce principe n’est pas très éclairant tant qu’on n’a pas dit ce qu’il faut entendre par « grande » question.

Qu’est ce qu’il y a ? Qu’est-ce qui se passe ? Et alors ?

Qu’est ce qu’il y a ? Qu’est-ce qui existe ? Qu’est-ce qui est ? Les corps, les âmes, les vérités et tout ce qui va avec.

Qu’est-ce qui se passe ? Les corps et les âmes sont en mouvement permanent. Entre leur naissance et leur mort ils changent sans cesse. Qu’est ce qui leur arrive ?

Et alors ? Les êtres et leurs mouvements ont-ils un sens ? Ont-ils un but à atteindre ? Y a-t-il des leçons à retenir ?

Ces questions sont considérées comme parmi les plus grandes parce qu’elles sont à la fois très générales, très fondamentales et ultimes. Elles sont très générales parce qu’elles portent sur tout ce qui est, pas seulement sur une domaine particulier de l’être. Elles sont fondamentales parce que tout le savoir que nous développons est fondé sur les réponses que nous leur donnons. Elles sont ultimes parce qu’elles nous interrogent sur tout ce que nous pouvons espérer savoir.

La vue d’ensemble[modifier | modifier le wikicode]

Toutes les disciplines particulières, sauf la métaphysique, étudient certains êtres particuliers et leurs façons d’être particulières. Elles apportent des réponses particulières aux grandes questions, ce qu’il y a, ce qui se passe et à quelles fins. Cela suggère que la métaphysique pourrait n’avoir pas grand chose à ajouter. Les sciences particulières apportent des réponses solides aux grandes questions sur les corps, les âmes et les vérités, la métaphysique ne peut que les répéter et les approuver.

Pour bien comprendre, il faut souvent avoir une vue d’ensemble et reconnaître l’unité de toutes les parties. Pourquoi tout cela, les corps, les âmes et les vérités, est-il tout ensemble ? Il n’y a que la métaphysique qui peut poser la question parce que les sciences particulières ne reconnaissent que des parties de la totalité (Aristote, Métaphysique 1003 a21). Elles apportent de nombreuses réponses particulières aux grandes questions mais elles ne peuvent pas donner la vue d’ensemble.

La métaphysique est une science[modifier | modifier le wikicode]

La science rassemble tous les savoirs qu’on développe avec le raisonnement. Dès que les raisonnements apportent du savoir, il s’agit de la science.

Les raisonnements sont bons s’ils respectent la logique, s’ils s’appuient sur de bons principes et s’ils conduisent à des conclusions importantes, c'est à dire qu'elles enrichissent vraiment le savoir.

Les principes sont bons s’ils portent des fruits, s’ils conduisent à des conclusions importantes.

Pour que la métaphysique soit une science, il suffit qu’elle porte des fruits en raisonnant logiquement avec de bons principes. Comment reconnaît-on les fruits de la métaphysique ?

La physique porte des fruits lorsqu’elle nous rend plus capable de comprendre ce qu’est la matière et ce que nous pouvons faire avec elle. La métaphysique porte des fruits lorsqu’elle nous rend plus capable de comprendre tout ce qui est et ce que nous pouvons faire avec.

La métaphysique prend la science à la source[modifier | modifier le wikicode]

Pour développer les sciences nous devons identifier des principes solides, fiables, que l’on peut choisir comme prémisses dans nos raisonnements. Chaque théorie particulière doit être identifiée par les principes (ses axiomes et ses définitions) avec lesquels on peut prouver ses conclusions (ses théorèmes). Les principes ne sont pas tous donnés d’avance une fois pour toutes. Nous devons inventer nos théories en choisissant leurs principes. Nous devons également justifier les principes, c’est à dire montrer qu’ils sont bons. La réflexion sur les principes est au cœur de toutes les sciences. Nous ne pourrions pas développer les sciences si nous n’étions pas capables d’évaluer leurs principes. Comme les principes sont à la source de toutes les sciences, on prend la science à la source quand on réfléchit sur les principes pour les évaluer et les choisir.

Les principes métaphysiques sont les plus généraux et les plus fondamentaux, ils sont donc partagés par toutes les sciences. Même lorsque que des sciences particulières adoptent des principes qui leur sont propres, elles ont besoin des principes métaphysiques pour justifier leurs principes particuliers. La métaphysique nous rend donc capables de prendre la science à la source.

Il ne faut pas concevoir la métaphysique comme une discipline séparée et indépendante des autres sciences. Toutes les sciences ont une part métaphysique, parce qu’elles contribuent à la vue d’ensemble de tout ce qui est.

L’esprit, le Monde et Dieu[modifier | modifier le wikicode]

La vue d’ensemble que l’on recherche en métaphysique ne se réduit pas à la cosmologie, la science de l’Univers. Du point de vue de la cosmologie moderne, la présence de l’esprit dans l’Univers ressemble à un accident très improbable et un détail presque insignifiant, qui peut être ignoré quand on présente la vue d’ensemble. Mais la métaphysique demande une vue d’ensemble qui montre la place de l’esprit dans le Monde. Elle nous interroge à la fois sur le Monde, sur l’esprit, et sur leur relation. La cosmologie et la psychologie sont parmi les sciences les plus importantes pour la métaphysique.

Pour les croyants la métaphysique nous interroge à la fois sur le Monde, sur l’esprit, sur Dieu et sur leurs relations. De ce point de vue, la cosmologie, la psychologie et la théologie sont les trois piliers de la métaphysique.


Chapitre suivant : Principes logiques >>>


Principes logiques

Les principes les plus fondamentaux de la logique sont exposés. Ensemble, ils suffisent pour trouver toutes les conséquences logiques. On peut les considérer comme les principes des principes logiques, parce qu'ils suffisent pour justifier tous les autres principes logiques.

Dans la suite P désigne une liste finie de prémisses.

La règle de particularisation[modifier | modifier le wikicode]

Si Pour tout x, C(x) est une conséquence logique des prémisses P et si a est un individu alors C(a) est une conséquence logique des mêmes prémisses.

Cette règle est la plus importante de toute la logique, parce que la puissance des raisonnements vient des lois avec lesquelles on raisonne. A chaque fois qu'on applique une loi à un individu, on apprend ce qu'elle nous enseigne et on révèle la puissance de raisonner qu'elle nous donne.

Dans la règle de particularisation, C(a) est la formule obtenue à partir de C(x) en substituant a à toutes les occurrences de x dans C(x).

La règle de généralisation[modifier | modifier le wikicode]

Si C(a) est une conséquence logique des prémisses P et si a est un individu qui n'est pas mentionné dans ces prémisses alors Pour tout x, C(x) est une conséquence logique des mêmes prémisses.

Un exemple d'usage de cette règle est le Je philosophique, ou cartésien. On dit Je sans faire aucune hypothèse particulière sur l'individu ainsi nommé. Dès lors tout ce qu'on dit sur lui peut être appliqué à tous les individus. Si par exemple on a prouvé Je ne peux pas penser sans être on peut déduire Tout individu ne peut pas penser sans être.

Dans la règle de généralisation, C(x) est la formule obtenue à partir de C(a) en substituant x à toutes les occurrences de a dans C(a). Ce point (toutes les occurrences) est subtil mais important. Les premières formulations modernes de la logique l'ont parfois négligé, ce qui a fait que leurs principes conduisaient à des absurdités.

La règle de détachement[modifier | modifier le wikicode]

Si A et Si A alors B sont des conséquences logiques des prémisses P, alors B aussi.

La règle d'incorporation d'une hypothèse[modifier | modifier le wikicode]

Si B est une conséquence logique des prémisses P et A, alors Si A alors B est une conséquence logique des prémisses P.

Le principe du raisonnement par l'absurde[modifier | modifier le wikicode]

Si B et non B sont des conséquences logiques des prémisses P et A, alors non A est une conséquence logique des prémisses P.

La règle de suppression de la double négation[modifier | modifier le wikicode]

Si non non A est une conséquence logique des prémisses P, alors A aussi.

La règle de répétition[modifier | modifier le wikicode]

Toute prémisse incluse dans P est une conséquence logique des prémisses P.

Les raisonnements sans hypothèse et les lois logiques[modifier | modifier le wikicode]

Les six premières règles logiques peuvent être appliquées même si P est une liste vide de prémisses, c'est à dire qu'on n'a posé aucune hypothèse au départ. La règle d'incorporation d'une hypothèse nous permet toujours de passer d'un raisonnement sous hypothèse à un raisonnement sans hypothèse.

Les conclusions des raisonnements sans hypothèse sont des vérités logiques universelles, toujours vraies quelle que soit l'interprétation des concepts qu'elles mentionnent, sauf l'interprétation des concepts logiques (implication, négation ...). On les appelle aussi des lois logiques, ou des tautologies.

Les règles dérivées[modifier | modifier le wikicode]

Ces 6+1 première règles suffisent pour trouver toutes les conséquences logiques. C'est le théorème de complétude de la logique, prouvé par Kurt Gödel, dans sa thèse de doctorat (Gödel 1929). Toutes les autres règles logiques peuvent être dérivées à partir d'elles. Elles sont donc une solution complète à l'ancien problème, posé mais non résolu par Aristote, de trouver une liste de tous les principes logiques.

Montrons par exemple qu'on peut dériver la règle suivante :

Si Si A alors B et Si B alors C sont des conséquences logiques des prémisses P alors Si A alors C aussi.

Comme Si A alors B est une conséquence logique des P, A et Si A alors B sont des conséquences logiques des prémisses P et A. D'après la règle de détachement, B est donc une conséquence logique des prémisses P et A. Comme Si B alors C est aussi une conséquence logique des mêmes prémisses, une nouvelle application de la règle de détachement permet de conclure que C est une conséquence logique des prémisses P et A. D'après la règle d'incorporation d'une hypothèse, Si A alors C est une conséquence logique des prémisses P. Ce qu'il fallait démontrer.

Les autres connecteurs logiques (la conjonction et, la disjonction ou, l'équivalence si et seulement si et le quantificateur existentiel Il existe un x tel que) peuvent être définis à partir de ces trois premiers : le quantificateur universel Pour tout x , l'implication Si alors et la négation non.

A des fins pédagogiques, il vaut mieux compléter l'énoncé de ces 6+1 règles, par d'autres, deux par connecteur logique, parce qu'elles sont également fondamentales. Mais toutes ces nouvelles règles peuvent être dérivées à partir des six premières et des définitions des autres connecteurs logiques à partir des trois premiers.

La règle de la preuve directe d'existence

Si a est un individu et si C(a) est une conséquence logique des prémisses P, alors Il existe un x tel que C(x) est une conséquence logique des mêmes prémisses.

Dans la règle de la preuve directe d'existence, C(x) est une formule obtenue en substituant x à certaines, pas forcément toutes, occurrences de a dans C(a).

La règle de détachement pour un énoncé existentiel

Si Il existe un x tel que C(x) et Si C(a) alors D sont des conséquences logiques des prémisses P et si a n'est mentionné ni dans les P, ni dans D, alors D est une conséquence logique des P.

La règle d'analyse

Si A et B est une conséquence logique des prémisses P alors A et B sont toutes les deux des conséquences logiques des mêmes prémisses.

La règle de synthèse

Si A et B sont des conséquences logiques des prémisses P alors A et B est aussi une conséquence logique des mêmes prémisses.

La règle de détachement pour une disjonction

Si A ou B, Si A alors C et Si B alors C sont toutes les trois des conséquences logiques des prémisses P alors C aussi.

La règle d'affaiblissement d'une thèse

Si A est une conséquence logique des prémisses P, alors A ou B et B ou A sont toutes les deux des conséquences logiques des mêmes prémisses.


Chapitre suivant : L'incomplétude des principes mathématiques >>>


L'incomplétude des principes mathématiques

Kurt Gödel a prouvé, en 1931, que nous ne pouvons pas donner explicitement une liste complète de tous les principes mathématiques. Plus précisément, une liste explicite de principes ne peut jamais suffire pour prouver toutes les vérités mathématiques, même si on se limite aux vérités sur les nombres naturels. C'est le premier théorème d'incomplétude de Gödel. L'incomplétude des principes est nécessaire. Elle ne vient pas de notre manque d'imagination ou de travail. Les mathématiciens sont capables de donner des listes d'axiomes très puissants, qui suffisent en général pour prouver toutes les vérités qu'on souhaite prouver. Mais ces listes sont incomplètes au sens où elles ne suffisent pas pour prouver toutes les vérités mathématiques. Elles peuvent être enrichies avec de nouveaux axiomes plus puissants mais elles ne peuvent jamais être définitivement complétées. Il y aura toujours des vérités mathématiques qu'elles ne permettent pas de prouver.

Ce théorème d'incomplétude est parfois interprété à tort comme une preuve qu'il y a des vérités que nous ne pourrons jamais connaître, qu'il y a des questions sensées auxquelles nous ne pourrons jamais répondre, qu'il y a des solutions que nous ne pourrons jamais trouver. Cette interprétation commet une faute de logique. Gödel a prouvé que pour toute théorie T cohérente et définie par une liste explicite d'axiomes il existe au moins une vérité V que T ne peut pas prouver. Mais cela ne prouve pas qu'il existe une vérité V qu'aucune théorie ne peut prouver. De fait, quand on a trouvé une vérité V improuvable dans une théorie T, il est en général très facile de définir une théorie T+, en ajoutant à T un nouvel axiome, qui permet de prouver V.

Le principe de Hilbert (1930), « Nous devons savoir, nous saurons », tient toujours, même après Gödel. Rien ne permet d'affirmer qu'il y a des vérités mathématiques que nous ne pourrons jamais connaître.

On est en général très étonné la première fois qu'on entend parler du théorème d'incomplétude de Gödel, parce qu'on est habitué à identifier vérité mathématique et prouvabilité. Nous savons qu'un théorème est vrai quand nous savons le prouver. Mais cet étonnement est facilement dissipé quand on comprend qu'une liste explicite d'axiomes ne peut pas suffire pour prouver l'existence de tous les êtres mathématiques, même si on se limite aux plus élémentaires, les nombres naturels et les ensembles de nombres naturels.

Résumé

On commence par prouver le premier théorème d'incomplétude de Gödel d'une façon qui élimine les difficultés techniques et permet de se concentrer sur le cœur de l'argument, un énoncé vrai qui dit de lui-même qu'il est improuvable. Gödel prouve que cet énoncé est vrai sous l'hypothèse où la théorie T qui permet de le formuler est vraie. Mais cette preuve de la vérité de l'énoncé "improuvable" ne peut pas être formalisée dans T. L'énoncé est improuvable à partir des axiomes de T mais il n'est pas absolument improuvable, puisque Gödel a prouvé sa vérité. Pour formaliser cette preuve, on a besoin d'une théorie qui prouve que les axiomes de T sont vrais. Or Tarski a prouvé qu'une théorie ne peut jamais définir un prédicat de vérité pour elle-même. C'est pourquoi la preuve de l'énoncé "improuvable" ne peut pas être formalisée dans T. Plus généralement, une théorie ne permet pas de prouver tous les énoncés vrais qu'elle énonce parce qu'elle ne peut jamais définir assez de prédicats ou d'ensembles pour donner ces preuves. On applique le principe du raisonnement par récurrence aux prédicats ou aux ensembles d'une théorie. Si des prédicats ou des ensembles ne sont pas définis dans la théorie, on ne peut pas s'en servir pour raisonner par récurrence. On peut en conclure que l'incomplétude mathématique est une conséquence de l'indénombrabilité, puisqu'une théorie ne peut jamais définir un nombre indénombrable d'ensembles, et donc qu'il y a toujours des ensembles qu'elle ne peut pas définir.

Le théorème de Cantor, que l'ensemble des ensembles de nombres naturels n'est pas dénombrable, les théorèmes d'incomplétude de la prouvabilité de Gödel, le théorème d'indéfinissabilité de la vérité de Tarski, le paradoxe de l'ensemble de tous les ensembles qui ne sont pas éléments d'eux-mêmes de Russell et les théorèmes d'indécidabilité de Church et Turing sont tous des manifestations de la même incomplétude mathématique.

On présentera les deux principaux systèmes d'axiomes, de Peano et Zermelo, avec lesquels on fonde habituellement les mathématiques. On expliquera pourquoi ils sont vrais, et donc cohérents, et comment le prouver.

On terminera en montrant que l'incomplétude des principes mathématiques n'est finalement pas très étonnante, parce que si on savait trouver toutes les solutions d'un problème indécidable, on aurait une sorte d'omniscience, on saurait comment trouver toutes les solutions de tous les problèmes.


Le premier théorème d'incomplétude de Gödel[modifier | modifier le wikicode]

La preuve ici proposée n'est pas conventionnelle. Gödel raisonne sur une théorie arithmétique. Il montre que les formules peuvent être représentées par des nombres et que les relations de conséquence logique entre formules peuvent alors être représentées par des relations entre des nombres. Toute la difficulté technique de sa preuve vient de là : montrer que les relations logiques entre formules peuvent être déterminées par des relations numériques entre les nombres qui représentent ces formules. On élimine cette difficulté en raisonnant non sur une théorie des nombres mais d'emblée sur une théorie des formules.

Rien n'interdit de faire une théorie qui permet de raisonner sur ses propres formules. Cette façon de faire n'est pas aussi convaincante que celle de Gödel, parce qu'elle ne prouve pas que la théorie des nombres est incomplète mais seulement qu'une bizarre théorie de ses propres formules est incomplète. On pourrait même croire que l'énoncé paradoxal qui est au cœur de la preuve vient seulement de la bizarrerie de la théorie et craindre qu'elle ne soit pas cohérente, donc pas une bonne théorie mathématique. Cette crainte n'est pas fondée. Si on s'y prend correctement, il est facile de faire une théorie mathématique vraie et donc cohérente qui énonce des vérités sur ses propres formules. C'est la façon la plus facile et la plus rapide de prouver l'incomplétude mathématique. Mais cela ne suffit pas pour prouver l'incomplétude de la théorie des nombres.

La preuve qui suit est identique à celle de Gödel, sauf sur un point, qu'on raisonne sur une théorie des formules, et donc que les formules ne sont pas représentées par des nombres.

T est une théorie qui considère ses propres formules comme des individus, ou des objets. Elle contient le prédicat binaire est une conséquence logique de et admet parmi ses axiomes les principes logiques. Toute liste finie de prémisses peut être identifiée à une unique formule, leur conjonction.

Elle a aussi d'autres prédicats et d'autres axiomes qui permettent de raisonner sur la façon dont les formules sont construites. En particulier, elle doit permettre de définir un prédicat est une formule à une variable libre. Les formules qui ont des variables libres ne sont ni vraies, ni fausses. Il faut attribuer des valeurs à leurs variables f, x, y ... avant que leur vérité puisse être décidée. Par exemple f est une formule est une formule à une variable libre f. La théorie T doit aussi permettre de définir un prédicat ternaire défini par g est obtenu à partir d'une formule f à une variable libre en substituant x à toutes les occurrences de sa variable. On suppose que tous les axiomes ont été correctement choisis, donc qu'ils sont vrais, et suffisants pour prouver les vérités formelles les plus élémentaires.

Une fois que la liste de ses axiomes est définie, T permet de définir un prédicat est prouvable dans T, parce que pour être prouvable, il suffit d'être une conséquence logique d'une conjonction finie d'axiomes.

T permet alors de définir le prédicat suivant :

Gödel(f) égale par définition à f est une formule à une variable libre et il existe g tel que g n'est pas prouvable dans T et g est obtenu à partir de f en substituant f à toutes les occurrences de sa variable libre.

Gödel(f) est une formule à une variable libre f, parce que la variable g est liée par le quantificateur existentiel.

On peut alors prouver que Gödel(Gödel(f)) est un énoncé vrai mais improuvable dans T.

Gödel(Gödel(f)) veut dire par définition Gödel(f) est une formule à une variable libre et Gödel(Gödel(f)) n'est pas prouvable dans T.

Si Gödel(Gödel(f)) était prouvable dans T alors elle serait fausse, puisqu'elle dit d'elle-même qu'elle n'est pas prouvable dans T. Or on a supposé que tous les axiomes de T sont vrais. Tous les théorèmes de T, c'est à dire les énoncés prouvables dans T, sont donc également vrais. Il en résulte que Gödel(Gödel(f)) ne peut pas être un théorème de T et donc qu'elle est vraie, puisque c'est exactement ce qu'elle affirme. On a donc trouvé un énoncé vrai et improuvable dans T.

Pour transposer cette preuve à la théorie des nombres il suffit de montrer que les prédicats est prouvable dans la théorie des nombres et g est obtenu à partir d'une formule f à une variable libre en substituant x à toutes les occurrences de sa variable peuvent être représentés par des relations arithmétiques entre les nombres qui représentent des formules.

Note technique : pour formuler correctement la théorie T il faut faire attention à l'usage des variables de formule. f est une variable de formule, mais elle n'est pas à elle toute seule une formule bien formée de T. Il en résulte que Pour toute formule f, f, par exemple, n'est pas non plus une formule bien formée de T. Une formule bien formée doit toujours contenir des prédicats constants appliqués à des constantes ou des variables. En outre, quand une formule A(f) est appliquée une autre formule B(f), c'est à dire qu'on a formé A(B(f)), la variable f est libre dans B(f) mais pas dans A(B(f)), parce que B(f) y est une constante.

L'infini indénombrable[modifier | modifier le wikicode]

Un ensemble est dénombrable lorsqu'on peut identifier tous ses éléments en les numérotant, avec des nombres naturels : 0, 1, 2, 3, 4 ... Un ensemble dénombrable peut être fini ou infini. L'ensemble de tous les nombres naturels est infini dénombrable. Cantor (1874) a prouvé qu'il y a des ensembles infinis encore plus grands. En particulier, l'ensemble des ensembles de nombres naturels n'est pas dénombrable.

On le prouve par l'absurde. Supposons que l'ensemble des ensembles de nombres naturels soit dénombrable. Cela veut dire qu'ils peuvent tous être identifiés par un numéro. Définissons alors l'ensemble C des nombres qui ne sont pas dans l'ensemble qui porte leur numéro et soit n le numéro de C. Mais si n n'est pas dans C alors il est dans C par définition de C. Donc il doit être dans C. Mais alors il n'est pas dans C, encore par définition de C. n est dans C si et seulement si il n'est pas dans C. C'est une absurdité. Donc l'ensemble C ne peut pas exister. Donc l'ensemble des ensembles de nombres naturels n'est pas dénombrable.

On peut en conclure immédiatement qu'une théorie des nombres est toujours incomplète, parce qu'elle ne permet jamais de définir tous les ensembles de nombres. L'ensemble des êtres définis et nommés par une théorie est toujours dénombrable, parce que pour définir et nommer on se sert d'un alphabet fini. On peut toujours numéroter les mots formés à partir d'un alphabet fini. Il suffit de les ranger par ordre de longueur, puis par ordre alphabétique pour les mots d'une même longueur. Le numéro d'un mot est alors son numéro d'ordre.

La preuve du théorème de Gödel ressemble à celle du théorème de Cantor, parce qu'une formule à une variable libre peut être considérée comme le nom de l'ensemble de tous les êtres pour lesquels elle est vraie. La preuve de Gödel définit l'ensemble de tous les nombres pour lesquels il n'est pas prouvable qu'ils sont dans l'ensemble nommé par la formule qu'ils numérotent.

Il n'est a priori pas évident que l'incomplétude de Gödel résulte de l'indénombrabilité de l'ensemble des ensembles de nombres. L'énoncé vrai et improuvable de Gödel porte seulement sur les nombres, pas sur les ensembles de nombres. On aurait pu espérer que l'arithmétique permette de prouver toutes les vérités qui ne portent que sur des nombres, qu'elle n'a pas besoin pour cela de prouver l'existence de tous les ensembles de nombres. Mais cet espoir est vain.

Pour prouver des vérités arithmétiques, on se sert du principe du raisonnement par récurrence, qu'on peut énoncer comme suit :

Si un ensemble de nombres contient zéro et s'il contient toujours le successeur de chacun de ses éléments alors il contient tous les nombres naturels.

Une théorie des nombres qui ne porte pas explicitement sur les ensembles de nombres applique ce principe aux formules à une variable libre. Celles-ci servent à représenter les ensembles de nombres.

Il n'est pas étonnant qu'une théorie explicite ne puisse jamais prouver toutes les vérités sur les nombres, parce qu'il y a toujours des ensembles de nombres qu'elle ne permet pas de définir et qui peuvent être nécessaires pour prouver certaines vérités sur les nombres. Un énoncé vrai sur les nombres est improuvable lorsque la théorie ne permet pas de définir l'ensemble de nombres dont on a besoin pour le prouver. La suite montrera que pour l'énoncé vrai et improuvable de Gödel, l'ensemble qui manque est l'ensemble des numéros des vérités arithmétiques.

Le théorème d'indéfinissabilité de la vérité de Tarski[modifier | modifier le wikicode]

On peut dire la vérité en disant simplement ce qu'on a à dire, mais on peut aussi la dire en insistant d'une façon redondante et en disant que ce qu'on dit est vrai. Nous nous servons d'un prédicat de vérité que nous pouvons attribuer ou non à tout ce que nous disons. Tarski (1933) a prouvé qu'un tel prédicat de vérité ne peut pas exister dans une théorie mathématique si elle est vraie.

Commençons par raisonner comme plus haut sur une théorie T qui parle de ses propres formules.

Si T contenait un prédicat de vérité Il est vrai que, alors les formules Il est vrai que f si et seulement si f seraient vraies pour toutes les formules f de T. Il est vrai que la neige est blanche si et seulement si la neige est blanche, par définition de la vérité. C'est avec ce principe que Tarski a fondé une théorie de la vérité mathématique (Tarski 1933) que l'on comprend aujourd'hui comme la théorie des modèles.

Montrons par l'absurde qu'un prédicat de vérité ne peut pas exister dans la théorie T si elle est vraie.

Supposons qu'un prédicat est vraie soit défini dans T pour toutes les formules de T.

Définissons la formule Tarski(f) à une variable libre par f est une formule à une variable libre et il existe une formule g telle que g n'est pas vraie et g est obtenue à partir de f par substitution de f à toutes les occurrences de sa variable libre.

Tarski(Tarski(f) veut dire par définition que Tarski(Tarski(f)) n'est pas vraie. Tarski(Tarski(f)) est vraie si et seulement si elle n'est pas vraie, ce qui est une absurdité. Donc le prédicat est vraie ne peut pas exister dans la théorie T si elle est vraie.

Pour transposer cette preuve à la théorie des nombres il suffit de raisonner sur le prédicat est le numéro d'une formule vraie. Une théorie des nombres ne permet jamais de définir un tel prédicat si elle est vraie.

Tarski est à la fois le théoricien qui a su définir la vérité mathématique et qui a prouvé qu'elle est indéfinissable dans toutes les théories mathématiques.

Le théorème de Tarski fournit une autre preuve, indirecte, du premier théorème d'incomplétude de Gödel : si une théorie permet de définir un prédicat de sa propre prouvabilité et si tous ses théorèmes sont vrais, alors il doit y avoir au moins un énoncé vrai et improuvable, sinon le prédicat de prouvabilité serait un prédicat de vérité.

Comment prouver l'improuvable ?[modifier | modifier le wikicode]

Revenons à la théorie T qui permet de définir un prédicat de prouvabilité est prouvable dans T et un énoncé vrai et improuvable dans T. En présentant cet énoncé "improuvable" nous avons prouvé qu'il était vrai. La preuve est facile mais elle repose sur l'hypothèse que la théorie T est elle-même vraie. Or la théorie T ne permet pas de définir un prédicat de vérité pour elle-même, si elle est vraie, seulement un prédicat de prouvabilité. On ne peut donc pas formaliser la preuve informelle de l'énoncé "improuvable" avec les moyens de la théorie T. C'est pourquoi cet énoncé prouvable est improuvable dans T. Mais la définition de la vérité mathématique par Tarski permet de définir une théorie T+ avec un prédicat de vérité limité à T : est une formule vraie de T. La preuve informelle de l'énoncé vrai et improuvable dans T peut alors être formalisée dans T+. L'énoncé improuvable dans T est donc un théorème prouvé dans T+. Mais bien sûr T+ n'est pas une théorie complète, parce qu'on peut trouver un nouvel énoncé vrai et improuvable dans T+ qui requiert un prédicat de vérité limité à T+ pour être prouvé.

Pour formaliser dans T+ la preuve informelle, on doit prouver dans T+ que tous les théorèmes de T sont vrais. On le prouve en raisonnant par récurrence. Si un ensemble de formules contient tous les axiomes de T et toutes les conséquences logiques immédiates de ses éléments alors il contient tous les théorèmes de T, par définition de l'ensemble des théorèmes de T. Il suffit donc de prouver que tous les axiomes de T sont vrais, et que les conséquences logiques immédiates de formules vraies sont également vraies, pour prouver que tous les théorèmes de T sont vrais. Mais pour formaliser cette preuve informelle on a besoin dans T+ d'un prédicat de vérité pour les formules de T.

Pour transposer cette preuve à la théorie des nombres il suffit de raisonner sur le prédicat est le numéro d'une formule vraie de la théorie. On peut toujours enrichir une théorie arithmétique avec de nouveaux axiomes pour que ce prédicat de vérité, limité à la théorie initiale, soit définissable. On peut ainsi prouver dans la théorie enrichie l'énoncé vrai et improuvable dans la théorie initiale. Il suffit de formaliser la preuve informelle.

Les preuves de cohérence[modifier | modifier le wikicode]

Une théorie est cohérente, ou non-contradictoire, ou consistante, lorsqu'elle ne permet jamais de prouver à la fois une formule et sa négation, sinon elle est incohérente, contradictoire, absurde, inconsistante.

Bien sûr on attend d'une théorie mathématique qu'elle soit cohérente. Une théorie incohérente ne permet pas de faire la différence entre le vrai et le faux.

Pour prouver qu'une théorie est cohérente, la façon la plus directe est simplement de prouver qu'elle est vraie, c'est à dire que tous ses théorèmes sont vrais. Une théorie vraie ne peut pas être incohérente, parce que si une formule est vraie, sa négation est fausse et n'est donc pas vraie.

Pour prouver que tous les théorèmes d'une théorie sont vrais, il suffit de prouver que tous ses axiomes sont vrais, parce que les conséquences logiques des formules vraies sont toujours vraies.

La vérité mathématique d'une formule est toujours définie à partir d'un modèle, un être théorique qui existe en tant qu'être pensé. Être mathématiquement vrai, c'est être vrai d'un modèle mathématique.

Pour prouver qu'une théorie est cohérente, il suffit donc de prouver que ses axiomes sont vrais pour un modèle théorique.

Avec cette méthode, on prouve facilement d'une façon informelle que les axiomes d'une théorie des nombres, les axiomes de Peano par exemple, sont cohérents. Mais on ne peut pas formaliser cette preuve à l'intérieur de la théorie dont on prouve la cohérence, parce qu'elle ne peut pas avoir de prédicat de vérité pour elle-même. De fait, Gödel a prouvé qu'une théorie cohérente ne peut jamais prouver sa propre cohérence. Ce second théorème d'incomplétude de Gödel est souvent interprété à tort. On croit que les preuves de cohérence sont très difficiles, ou inaccessibles, ou qu'elles ne pourraient jamais être rationnellement justifiées parce qu'elles seraient dans un cercle vicieux. Mais il y a une explication beaucoup plus directe. Les preuves de cohérence sont parfois très faciles à trouver, et irréfutables, sans aucune erreur de logique, et sans que le moindre doute puisse subsister, mais elles ne peuvent pas être formalisées à l'intérieur de la théorie dont la cohérence est prouvée, parce qu'elles requièrent un prédicat de vérité pour cette théorie. Le théorème de Tarski de l'indéfinissabilité d'un prédicat de vérité explique donc le second théorème d'incomplétude de Gödel.

Le second théorème d'incomplétude de Gödel[modifier | modifier le wikicode]

Une théorie vraie ne peut pas prouver sa propre cohérence.

Raisonnons sur la théorie T et son énoncé vrai et improuvable dans T, Gödel(Gödel(f)).

Montrons par l'absurde que T ne peut pas prouver sa propre cohérence. Si elle le pouvait elle pourrait prouver que Gödel(Gödel(f)) et non Gödel(Gödel(f)) n'est pas prouvable dans T.

Or elle peut prouver Si non Gödel(Gödel(f)) alors (Gödel(Gödel(f)) est prouvable dans T) par définition de Gödel(f). Elle pourrait donc prouver Si non Gödel(Gödel(f)) alors (non Gödel(Gödel(f)) n'est pas prouvable dans T). Mais non Gödel(Gödel(f)) veut dire que Gödel(Gödel(f)) est prouvable dans T par définition de Gödel(f). Donc T pourrait prouver Si non Gödel(Gödel(f)) alors ((Gödel(Gödel(f)) est prouvable dans T) n'est pas prouvable dans T.

En outre T peut prouver que Pour toute formule f, si f est prouvable dans T alors la formule qui affirme que f est prouvable dans T est prouvable dans T. C'est un point parfois considéré comme difficile dans la preuve de Gödel. Mais pour la théorie T il est presque évident, parce qu'en donnant une preuve d'un théorème on prouve en même temps qu'il est prouvable. Comme T peut prouver Si non Gödel(Gödel(f)) alors (Gödel(Gödel(f)) est prouvable dans T), elle peut aussi prouver Si non Gödel(Gödel(f)) alors ((Gödel(Gödel(f)) est prouvable dans T) est prouvable dans T).

Comme T pourrait tirer des conclusions contradictoires à partir de non Gödel(Gödel(f)), elle pourrait prouver Gödel(Gödel(f)) par l'absurde. Mais Gödel(Gödel(f)) affirme d'elle-même qu'elle n'est pas prouvable dans T. Donc T ne serait pas vraie.

Il en résulte que T ne peut pas prouver sa propre cohérence si elle est vraie.

On peut transposer ce raisonnement à la théorie des nombres en numérotant les formules.

La science de tout ce qui peut être imaginé[modifier | modifier le wikicode]

On imagine toujours en attribuant des concepts. L'imagination visuelle par exemple attribue des qualités visuelles (couleur, luminosité ...) à tout ce qui est imaginé. Les êtres qu'on se représente et les concepts qu'on leur attribue, y compris les relations, définissent une structure mathématique. De façon générale une structure, ou un système, ou un modèle, mathématique est défini par l'ensemble de ses constituants, ou des êtres qui lui appartiennent, et par des concepts et des relations qu'on leur attribue. Comme les mathématiques donnent les moyens de connaître tous les modèles mathématiques, elles permettent d'étudier n'importe quel ensemble d'êtres imaginés à partir des concepts que l'imagination leur attribue, elles sont la science de tout ce qui peut être imaginé, ou conçu.

La théorie des ensembles de Zermelo[modifier | modifier le wikicode]

Les ensembles sont omniprésents en mathématiques. Un concept peut toujours être associé à l'ensemble des êtres pour lesquels il est vrai, l'extension du concept. Le concept de nombre pair définit l'ensemble des nombres pairs. La relation est plus grand que entre nombres définit l'ensemble de tous les couples de nombres (x,y) tels que x est plus grand que y.

Les nombres ne sont en général pas considérés comme des ensembles, les constituants des modèles non plus. Une théorie mathématique devrait donc inclure à la fois des êtres de base, les nombres et les autres constituants des modèles qui ne sont pas des ensembles, et tous les ensembles qu'on peut construire à partir d'eux. Mais il est plus commode de définir une théorie pure des ensembles. Cela simplifie les axiomes.

Les nombres naturels peuvent être définis comme des ensembles. On peut par exemple identifier 0 à l'ensemble vide {}, 1 à {0}, 2 à {0,1} et plus généralement n à {0...n-1}. Tous les autres nombres peuvent être construits à partir des nombres naturels. Tous les constituants des modèles peuvent toujours être numérotés par des nombres naturels, ou identifiés à des systèmes de nombres, ou à des ensembles construits à partir des nombres. Une théorie pure des ensembles permet donc en principe d'étudier tout ce qui peut être imaginé.

Pour faire une théorie on a besoin d'axiomes qui permettent de prouver l'existence des êtres sur lesquels on raisonne. Un nombre réduit de principes (Zermelo 1908) suffit pour prouver l'existence de tous les êtres mathématiques sur lesquels on raisonne habituellement :

  • L'axiome de l'ensemble vide : Il existe un ensemble vide.
  • L'axiome de la paire : Si deux ensembles existent, l'ensemble qui les contient tous les deux, et seulement eux, existe aussi.
  • L'axiome de la somme : Si un ensemble existe, l'ensemble de tous les éléments de ses éléments existe aussi.
  • L'axiome de l'infini : Il existe un ensemble qui contient tous les nombres naturels.
  • L'axiome de séparation : Si E est un ensemble et si A(x) est une formule sensée qui porte sur les ensembles alors l'ensemble de tous les x dans E tels que A(x) est vraie existe.
  • L'axiome de l'ensemble des parties : Si un ensemble existe, l'ensemble de toutes ses parties, ou sous-ensembles, existe aussi.
  • L'axiome du choix : Il sera présenté plus loin.

Il faut leur ajouter :

  • L'axiome d'extensionnalité : Deux ensembles sont égaux lorsqu'ils ont les mêmes éléments.

et bien sûr les principes logiques, et on a des fondements suffisants pour prouver la plupart des vérités mathématiques.

Les trois premiers axiomes permettent de construire les nombres naturels. La réunion de deux ensembles est la somme de leur paire. Le successeur d'en ensemble x est la réunion x U {x}. On définit alors : 0 = {}, 1 = 0 U {0} = {0}, 2 = 1 U {1} = {0,1} ...

Le quatrième et le cinquième axiome permettent de prouver l'existence de l'ensemble N des nombres naturels. C'est l'ensemble qui contient tous les nombres naturels et qui est inclus dans tous les ensembles qui contiennent tous les nombres naturels. On retrouve ainsi le principe du raisonnement par récurrence comme une conséquence de la définition de l'ensemble des nombres naturels.

A partir de là, le sixième axiome permet de construire la hiérarchie des premiers ensembles infinis : N, l'ensemble P(N) des parties de N, P(P(N))=P2(N), P(P(P(N)))=P3(N) ...

Ces axiomes ne permettent pas de définir tous les ensembles. En particulier, l'existence de l'ensemble {N, P(N), P(P(N)) ...} qui contient tous les Pn(N) pour tous les nombres naturels n ne peut pas être prouvée à partir des axiomes de Zermelo. Elle peut être prouvée avec un nouvel axiome, l'axiome de remplacement, proposé par Fraenkel (1922), beaucoup plus puissant pour prouver l'existence des grands ensembles infinis. Mais même avec ce nouvel axiome, il reste des ensembles que la théorie ne permet pas de définir.

Pour les mathématiques ordinaires, et même pour les mathématiques d'un niveau très avancé, la théorie de Zermelo est plus que suffisante pour construire tous les ensembles qu'on veut construire et pour prouver tout ce qu'on veut prouver. En particulier, les nombres réels, les espaces construits à partir des nombres réels, les fonctions qui y sont définies, les espaces de ces fonctions, les fonctionnelles, et donc tous les objets de l'analyse, peuvent tous êtres construits en se limitant aux premiers niveaux de la hiérarchie des ensembles infinis. Les grands ensembles infinis que la théorie de Zermelo ne permet pas de construire sont beaucoup plus rarement utilisés.

L'interprétation de l'axiome de séparation pose une difficulté. Qu'est-ce qu'une formule sensée ? Selon Fraenkel et Skolem, toute formule bien formée à partir des prédicats fondamentaux est élément de et est égal à, et des connecteurs logiques, est une formule sensée. L'axiome de séparation peut donc toujours leur être appliqué. Mais Zermelo n'a pas été convaincu par cette approche, parce que ces formules dites sensées peuvent contenir des affirmations sur tous les ensembles, comme si l'univers de tous les ensembles avait une existence objective. Mais nous ne savons pas ce que pourrait être un tel univers. Nous ne savons donc pas toujours quel sens donner aux formules qui servent à construire les ensembles dans la théorie ZFC proposée par Fraenkel et Skolem.

Cette difficulté n'est pas gênante pour les mathématiques courantes, parce qu'on se limite aux "petits" ensembles infinis. On peut exiger des formules sensées auxquelles l'axiome de séparation est appliqué qu'elles ne contiennent que des quantificateurs bornés, c'est à dire qu'elles ne contiennent pas d'affirmations sur tous les ensembles, mais seulement sur tous les éléments d'ensembles déjà définis. Avec ces limitations, et sans l'axiome de remplacement, on n'a pas toute la puissance de ZFC, mais on a une puissance bien suffisante pour les mathématiques courantes, et on sait mieux de quoi on parle.

Le paradoxe de Russell[modifier | modifier le wikicode]

Au lieu de l'axiome de séparation, on aurait pu songer à un axiome plus simple :

Si A(x) est une formule sensée alors l'ensemble de tous les x tels que A(x) existe.

Cet axiome a été proposé par Frege (1879) pour fonder toutes les mathématiques, mais Russell (1901, publié en 1903) s'est rendu compte qu'il conduisait à une contradiction. x n'est pas élément de x est une formule sensée. En général les ensembles ne sont pas éléments d'eux-mêmes, mais il pourrait y avoir des exceptions, comme l'ensemble de tous les ensembles. L'ensemble de tous les x tels que x n'est pas élément de x, de tous les ensembles qui ne sont pas éléments d'eux-mêmes, existe, si on adopte l'axiome de Frege. Est-il élément de lui-même ? De sa définition il résulte qu'il est élément de lui-même si et seulement si il n'est pas élément de lui-même. C'est une absurdité, donc il ne peut pas exister, donc l'axiome de Frege est faux.

Le théorème de Cantor prouve qu'une théorie des ensembles ne peut jamais définir tous les ensembles, parce qu'elle ne peut en définir qu'un nombre dénombrable. Le théorème de Tarski prouve qu'une théorie des ensembles ne peut jamais définir l'ensemble de toutes ses vérités. Le paradoxe de Russell prouve qu'une théorie des ensembles ne peut jamais définir tous les ensembles, parce qu'elle ne peut jamais définir l'ensemble de tous les ensembles qu'elle peut définir et qui ne sont pas éléments d'eux-mêmes.

En général, une théorie des ensembles ne définit pas l'ensemble de tous les ensembles qu'elle peut définir, parce qu'on exige habituellement que les ensembles soient bien fondés, c'est à dire qu'ils ne sont ni éléments d'eux-mêmes, ni éléments de leurs éléments, ni ... ainsi de suite. Mais on peut aussi faire une théorie d'ensembles qui ne sont pas tous bien fondés et qui accueille l'ensemble de tous les ensembles qu'elle peut définir. Le paradoxe de Russell nous avertit que même une telle théorie ne peut pas définir tous les ensembles.

Le théorème de Tarski et le paradoxe de Russell sont très semblables. La formule Tarski(f) affirme que f n'est pas vraie d'elle-même. Comme Tarski(f) peut être identifiée à l'ensemble des f pour lesquelles elle est vraie, la preuve du théorème de Tarski est presque identique à la preuve que l'ensemble de tous les ensembles qui ne sont pas dans eux-mêmes ne peut pas exister.

La vérité des axiomes de Peano[modifier | modifier le wikicode]

Pour les mathématiques ordinaires on peut souvent se contenter d'une théorie beaucoup moins puissante que celle de Zermelo, simplement l'arithmétique élémentaire, la théorie des nombres naturels. Dedekind (1888) et Peano (1889) ont donné des systèmes d'axiomes suffisants pour prouver la plupart de ses théorèmes. L'arithmétique à la façon de Peano peut être considérée comme la théorie mathématique la plus fondamentale. Et elle suffit pour prouver une grande partie des plus grands théorèmes, parce que les théorèmes sur les nombres réels peuvent être traduits en théorèmes sur les nombres naturels.

Les axiomes de Peano :

  • 0 est un nombre naturel.
  • Un nombre naturel n a toujours un unique successeur sn qui est aussi un nombre naturel.
  • Deux nombres naturels différents ont des successeurs différents.
  • 0 n'est le successeur d'aucun nombre naturel.

Pour tous les nombres naturels n et p :

  • leur somme n+p existe et est unique, de même pour leur unique produit n.p
  • n+0=0+n=n
  • n+sp=sn+p=s(n+p)
  • 0.n=n.0=0
  • n.sp=n.p+n
  • sn.p=n.p+p
  • Tout ensemble de nombres naturels qui contient 0 et qui contient toujours le successeur de chacun de ses éléments contient tous les nombres naturels.

On définit un modèle d'une théorie en définissant un ensemble de vérités atomiques. Une formule est atomique lorsqu'elle ne contient pas de connecteurs logiques. Les formules atomiques de l'arithmétique de Peano sont les égalités entre expressions numériques et les formules qui affirment qu'elles sont des nombres naturels. Une expression numérique est formée à partir de 0, s, + et .

Par exemple ss0+ss0=ssss0 (2+2=4) est une formule atomique, et elle est vraie. Il en va de même pour s0+(ss0.ss00) est un nombre naturel.

L'ensemble de toutes les égalités numériques vraies peut être construit de nombreuses façons. C'est un peu laborieux, parce qu'il faut se donner suffisamment de règles pour engendrer toutes ces vérités élémentaires, sans en oublier aucune, mais ce n'est pas très difficile, parce que c'est très élémentaire. N'importe quel ordinateur sait faire très facilement la différence entre les égalités vraies et les autres. Il est donc clair que cet ensemble de vérités atomiques existe. Il est également clair que tous les axiomes de Peano sont vrais pour ce modèle, sauf peut-être le dernier, qui pose une difficulté d'interprétation.

Pour faire de l'arithmétique on a besoin de raisonner sur les ensembles de nombres naturels. On peut donc songer à compléter les axiomes de Peano par des axiomes sur l'existence des ensembles de nombres, mais cela n'est pas nécessaire. Les formules arithmétiques à une variable libre suffisent pour nommer des ensembles de nombres. Par exemple la formule A(n) définie par Il existe p tel que n=2.p nomme l'ensemble de tous les nombres pairs. En appliquant le dernier axiome à toutes ces formules arithmétiques qui définissent des ensembles, on définit l'arithmétique de Peano au premier ordre. Il est facile de montrer que toutes les formules ainsi prises comme axiomes sont nécessairement vraies pour le modèle défini ci-dessus. On peut donc conclure que tous les axiomes de Peano sont vrais pour notre modèle. Comme une théorie vraie est nécessairement cohérente, on a prouvé du même coup la cohérence des axiomes de Peano.

La vérité des axiomes de Zermelo[modifier | modifier le wikicode]

On peut définir un modèle des axiomes de Zermelo en prenant comme univers d'ensembles l'ensemble M défini comme suit :

Soit S(x) = x U P(x), la réunion de x et de l'ensemble de ses parties. M est la réunion de N avec S(N), S(S(N)) ... c'est à dire de tous les Sn(N) pour tout nombre naturel n.

Montrons que tous les axiomes sont vrais pour cet univers M d'ensembles.

De la définition de M, il résulte immédiatement que l'axiome de l'ensemble vide et l'axiome de l'infini y sont vrais.

Comme Sn(N) est inclus dans Sn+1(N), Sn(N) est inclus dans Sp(N) si n<p.

Soient x et y deux éléments de M. On doit donc avoir n et p tels que x est élément de Sn(N) et y est élément Sp(N). Si n<=p, x et y sont tous les deux dans Sp(N) et leur paire est donc dans Sp+1(N). Si n>=p, {x,y} est dans Sn+1(N). L'axiome de la paire est donc vrai dans M.

Montrons par récurrence qu'un élément d'un élément de Sp(N) est aussi élément de Sp(N). L'énoncé est vrai pour N=S0(N) parce que tout nombre naturel n={0 ... n-1}. Comme les éléments des éléments de P(x) sont dans x, l'énoncé est vrai pour Sn+1(N) s'il est vrai pour Sn(N), donc il est vrai pour tout nombre naturel n.

Il en résulte que la somme d'un élément de Sn(N) est incluse dans Sn(N) et est donc un élément de Sn+1(N). L'axiome de la somme est donc vrai dans M.

Il en résulte également que les parties d'un élément de Sn(N) sont toutes incluses dans Sn(N) et donc toutes éléments de Sn+1(N). L'ensemble des parties d'un élément de Sn(N) est donc inclus dans Sn+1(N) et est donc un élément de Sn+2(N). L'axiome de l'ensemble des parties est donc vrai dans M.

L'axiome de séparation est nécessairement vrai dans M, puisque toutes les parties des éléments de M sont des éléments de M.

La vérité dans M de l'axiome du choix sera montrée un peu plus loin.

De la vérité de ses axiomes pour l'ensemble M, on peut conclure que la théorie de Zermelo est cohérente. Il y a cependant une différence entre cette preuve de cohérence et la précédente, sur la cohérence de l'arithmétique. On n'a pas construit explicitement l'ensemble des vérités atomiques. On n'a pas nommé tous les éléments du modèle et on n'a pas dit comment engendrer l'ensemble des formules atomiques vraies pour tous ces éléments. On ne peut pas le faire, parce que l'ensemble M est indénombrable.

Faut-il en conclure que cette preuve de cohérence est sans valeur ? Non. Mais elle éveille un doute. Sommes-nous bien sûr que l'ensemble que nous construisons existe ? Parler d'ensembles dont on ne peut même pas nommer tous les éléments, n'est-ce pas prendre le risque de l'absurdité ?

Nous savons que les ensembles indénombrables existent parce que nous pouvons y penser. Rien n'interdit de penser à l'ensemble de tous les ensembles de nombres naturels. On peut même le voir en imagination :

L'arbre binaire infini est construit en partant d'une racine, qui se sépare en deux branches, l'une à gauche, l'autre à droite, qui à leur tour se séparent en deux branches, et ainsi de suite à l'infini. Un chemin qui part de la racine et ne s'arrête jamais définit un ensemble de nombres naturels. Si à l'étape n le chemin prend la branche à gauche alors n fait partie de l'ensemble, mais pas si le chemin prend la branche à droite. L'ensemble de tous les chemins de l'arbre binaire infini est donc une représentation de l'ensemble de tous les ensembles de nombres naturels. Or on peut voir en imagination l'arbre binaire infini en le regardant se déployer à l'horizon. On peut donc voir tous ses chemins d'un seul coup d'œil, et ils sont indénombrables.

Il y a un nombre indénombrable de points sur une ligne, même si elle est de longueur finie. Comme on peut voir des lignes et des surfaces, on peut voir l'indénombrable.

Pour que la preuve de cohérence des axiomes de Zermelo soit fausse, il faudrait que nous ayons tort de concevoir les ensembles indénombrables, qu'à notre insu les raisonnements sur l'indénombrable nous conduisent à l'absurdité. Mais pourquoi craindre qu'on puisse être ainsi dupé par notre propre raison ? Il semble bien qu'on ne commet aucune erreur quand on raisonne sur l'ensemble des parties d'un ensemble, même s'il est infini.

La preuve de cohérence des axiomes de Zermelo peut être formalisée dans ZFC, parce que l'axiome de remplacement permet de définir M dans ZFC. Mais on n'a pas besoin d'un axiome aussi fort pour formaliser cette preuve. Il suffit d'ajouter aux axiomes de Zermelo un élargissement de l'axiome de l'infini : Il existe un ensemble qui contient N et qui contient toujours x U P(x) quand il contient x. On obtient ainsi une théorie plus puissante qui permet de prouver la cohérence de la précédente. Si on veut prouver la cohérence de cette nouvelle théorie, il suffit de se donner un nouvel axiome de l'infini : Il existe un ensemble qui contient M et qui contient toujours x U P(x) quand il contient x. On peut définir ainsi une suite de théories toujours plus puissantes telles que la cohérence de l'une peut toujours être prouvée par la suivante.

La cohérence de ZFC peut elle aussi être prouvée en exhibant un modèle indénombrable, mais il est plus difficile à construire, parce que l'axiome de remplacement permet de construire des ensembles infinis beaucoup plus grands.

Il est en principe possible, et souhaitable, de donner une autre preuve de la cohérence des axiomes ensemblistes, en contruisant explicitement un modèle dénombrable, en définissant explicitement l'ensemble de ses vérités atomiques. On sait que c'est possible en principe parce que Löwenheim (1915) et Skolem ont prouvé que toute théorie cohérente admet un modèle dénombrable, mais jusqu'à présent, personne à ma connaissance n'a réussi à en trouver un pour la théorie de Zermelo, ni a fortiori pour ZFC.

L'axiome du choix[modifier | modifier le wikicode]

La façon la plus directe de prouver qu'un ensemble existe est de le définir, ce qui revient à le construire à partir d'ensembles déjà définis. L'ensemble vide suffit pour amorcer la construction de tous les ensembles que nous définissons. Mais on peut aussi donner des preuves indirectes d'existence. On prouve qu'un ensemble existe et a certaines propriétés sans le définir explicitement, sans le construire, sans dire précisément de quel ensemble on parle. Le raisonnement par l'absurde permet de donner ces preuves indirectes d'existence. On commence par supposer qu'aucun ensemble ne vérifie les propriétés demandées et on en déduit une contradiction. On est alors en droit de conclure qu'il existe au moins un ensemble qui a les propriétés demandées, mais on ne s'est pas donné la peine de le construire.

Ces preuves indirectes d'existence nous permettent de prouver qu'on peut toujours faire un nombre fini de choix arbitraires pour prouver l'existence d'un ensemble. Plus précisément, si on a une liste finie d'ensembles non-vides et disjoints, on peut prouver qu'il existe au moins un ensemble qui contient un élément et un seul de chacun des ensembles de la liste. On n'a pas construit ce nouvel ensemble, on n'a pas choisi ses éléments, on s'est contenté de prouver qu'il existe. Les principes logiques et les axiomes de construction d'ensembles finis suffisent pour prouver son existence. Mais si la liste d'ensembles non-vides et disjoints est infinie, ces principes et ces axiomes ne permettent pas de prouver l'existence d'un ensemble qui contient un élément et un seul de chacun des ensembles de la liste. L'axiome du choix affirme précisément qu'un tel ensemble existe (Zermelo 1904) :

L'axiome du choix : Si E est un ensemble d'ensembles non-vides et disjoints alors il existe un ensemble qui contient un élément et un seul de chacun des éléments de E.

Montrons que l'axiome du choix est vrai dans l'univers M d'ensembles. Si E est une ensemble d'ensembles non-vides et disjoints et s'il est dans Sn(N) alors l'ensemble qui choisit un élément de chacun des éléments de E est inclus dans Sn(N), puisque les éléments des éléments de E sont dans Sn(N), et il est donc un élément de Sn+1(N), donc dans M. Donc l'axiome du choix est vrai dans M.

Les preuves de cohérence sont-elles prises dans un cercle vicieux ?[modifier | modifier le wikicode]

Les preuves de cohérence qui exhibent une modèle sont formalisées dans une théorie T+ plus forte que la théorie T0 dont elles prouvent la cohérence, parce qu'elles définissent l'ensemble des vérités de T0 et que cet ensemble ne peut pas être défini dans T0. Si une théorie est absurde, toute théorie obtenue en rajoutant des axiomes est également absurde. Une théorie absurde peut tout prouver, une affirmation et son contraire, y compris que l'absurde n'est pas absurde. Notre méthode pour prouver la cohérence d'une théorie ne permet donc pas de faire la différence entre les théories cohérentes et les théories incohérentes, puisqu'une théorie "plus forte" qu'une théorie incohérente pourrait prouver qu'elle est cohérente. C'est pourquoi on croit parfois que de telles preuves ne prouvent rien, mais on se trompe.

On ne raisonne pas sur n'importe quelle théorie T0 dont on ignorerait tout. T0 est l'arithmétique de Peano ou la théorie de Zermelo, ou d'autres théories que l'on choisit pour fonder notre savoir mathématique. On sait d'avance que ces théories nous permettent de prouver des vérités, parce que sans elles nous n'aurions pas de savoir mathématique, et il semble assez clair que nous en avons. Si on est très pessimiste on peut craindre que nos théories formelles aient accueilli à notre insu des fautes de formulation qui pourraient conduire à des contradictions. Mais on ne doute pas que ces théories nous révèlent souvent la vérité, sauf si on renonce au savoir mathématique. Quand on prouve que les théories formelles sont vraies et cohérentes, on confirme ce que nous croyons déjà intuitivement. Et on se prouve à soi-même que nos facultés naturelles de raisonnement sont suffisantes pour raisonner correctement sur la raison. Ce n'est donc pas un cercle vicieux. C'est le cercle vertueux de la raison qui se comprend elle-même.

L'indépendance de l'hypothèse du continu[modifier | modifier le wikicode]

L'ensemble P(N) des parties de N, c'est à dire l'ensemble de tous les ensembles de nombres naturels, est strictement plus grand que N. Mais est-il le plus petit des ensembles strictement plus grands que N ? Cantor a conjecturé que oui, mais il n'a pas réussi à le prouver. Cette conjecture, que l'ensemble des ensembles de nombres naturels est le plus petit ensemble strictement plus grand que l'ensemble des nombres naturels, est appelée l'hypothèse du continu. Elle fait partie de la liste des grands problèmes que Hilbert a proposé en 1900 aux mathématiciens du XXe siècle.

Cohen (1963) a montré que cette hypothèse est indépendante des axiomes de ZFC, habituellement retenus pour fonder les mathématiques. Ni elle-même, ni sa négation, ne peuvent être prouvées à partir de ces axiomes.

On peut chercher de nouveaux axiomes pour prouver l'hypothèse du continu. L'axiome de constructibilité est un candidat, parce qu'il permet de prouver cette conjecture. Mais il n'est habituellement pas retenu, parce qu'il n'a pas le caractère d'évidence intuitive qu'on est en droit d'attendre d'un axiome. Il est un peu compliqué à formuler et sa signification est tout sauf claire, parce qu'il marie une approche constructiviste et une approche anticonstructiviste. Il exige que les ensembles soient construits étape par étape, comme le demandent les constructivistes, mais il autorise un nombre arbitrairement infini d'étapes, ce qui est habituellement interdit par les constructivistes.

On ne sait pas si l'hypothèse du continu peut être prouvée, ou réfutée, à partir de nouveaux axiomes dont la vérité serait évidente.

L'indépendance de l'hypothèse du continu est parfois appelée indécidabilité, mais il faut proscrire cet usage, parce qu'il incite à confondre l'indépendance d'une formule par rapport à des axiomes, qui est une indépendance relative, avec l'indécidabilité des problèmes et des ensembles, expliquée plus loin, qui est une indécidabilité absolue.

Les théories, les logiciels et les ensembles récursivement énumérables[modifier | modifier le wikicode]

Il existe une correspondance très étroite entre les théories mathématiques et les logiciels, les programmes informatiques. Quand on a défini explicitement une théorie, on peut toujours écrire un programme qui prouve tous ses théorèmes. Il suffit qu'il imprime d'une façon ordonnée tous les axiomes et toutes les conséquences logiques immédiates des formules qu'il a précédemment imprimées. Cette méthode de recherche de preuves n'a qu'un intérêt théorique. En pratique, l'ordinateur imprimerait un déluge de formules sans intérêt avant de trouver un théorème qui mérite d'être écrit. Et même avec les ordinateurs les plus puissants, il faudrait en général attendre un temps démesuré pour trouver ainsi des preuves ou des réfutations de conjectures intéressantes.

On peut donner plusieurs définitions, toutes équivalentes, des ensembles récursivement énumérables. Les conditions suivantes, choisies parmi de nombreuses autres, définissent toutes les trois l'énumérabilité récursive d'un ensemble E :

  • Toutes les vérités atomiques d'appartenance à E sont des théorèmes, des énoncés prouvables, d'une théorie explicite.
  • Il existe un logiciel qui répond toujours oui lorsqu'on lui présente le nom d'un élément de E, et qui ne répond pas, ou qui répond non, lorsqu'on lui présente le nom d'un être qui n'est pas dans E.
  • Il existe un nombre fini d'expressions de départ et un nombre fini de règles de production (Smullyan 1961) qui suffisent pour engendrer toutes les vérités atomiques d'appartenance à E.

L'ensemble des théorèmes d'une théorie explicite est toujours un ensemble récursivement énumérable. Si on présente un théorème à un logiciel chercheur de preuves, il finira toujours par reconnaître que c'est un théorème, parce qu'il examine toutes les preuves possibles, aussi longues soient-elles. Si on lui présente un non-théorème, il ne répondra pas, parce qu'il cherchera pour l'éternité une preuve qui n'existe pas.

Les ensembles et les problèmes indécidables[modifier | modifier le wikicode]

Les ensembles récursivement énumérables sont toujours dénombrables. Comme tous leurs éléments peuvent être nommés, on peut toujours définir leur complémentaire dans l'ensemble de tous les êtres nommés, dès qu'on s'est fixé un système de désignation.

Un ensemble est décidable lorsque lui-même et son complémentaire sont récursivement énumérables, sinon il est indécidable.

Un problème est indécidable lorsque l'ensemble de ses solutions est indécidable.

Un exemple d'ensemble indécidable est l'ensemble de toutes les vérités dans l'arithmétique de Peano. Le premier théorème d'incomplétude de Gödel prouve que cet ensemble de vérités n'est pas récursivement énumérable et donc pas décidable. S'il était récursivement énumérable, on pourrait trouver une liste complète d'axiomes qui suffise pour prouver toutes les vérités arithmétiques, mais Gödel a prouvé qu'une telle liste ne peut pas exister.

Dire qu'un problème est indécidable ne veut pas dire que nous sommes incapables de le résoudre, ni qu'il a des solutions que nous ne trouverons jamais, cela veut seulement dire qu'il n'existe pas de théorie explicitement définie qui apporte toutes les solutions du problème. Les théories que nous définissons ne peuvent résoudre un problème indécidable que partiellement, jamais totalement. Avec les problèmes indécidables, nous n'en aurons jamais fini, c'est la galère assurée pour l'éternité. Mais nous pouvons quand même chercher et trouver des solutions, et aucune solution n'est a priori inaccessible. Il suffit d'être suffisamment créatif pour inventer une théorie qui permette de la trouver.

L'incomplétude des principes mathématiques vient de l'existence des ensembles indécidables. Si tous les ensembles de vérités étaient récursivement énumérables, on pourrait donner des listes d'axiomes qui suffisent pour les trouver toutes. Mais l'indécidabilité montre que les ensembles de vérités ne sont pas toujours récursivement énumérables.

Machines et théories universelles[modifier | modifier le wikicode]

Un ordinateur programmable est une machine universelle, au sens où elle est capable d'exécuter tous les programmes concevables. Si le programme est écrit une fois pour toutes, en mémoire morte (ROM, Read Only Memory), l'ordinateur est seulement une machine particulière.

Une machine universelle peut faire tout ce que les autres machines, universelles ou particulières, peuvent faire. Il suffit de lui donner le programme. Toutes les machines universelles sont donc essentiellement équivalentes. Elles peuvent toutes faire exactement les mêmes choses.

En pratique, les ordinateurs sont limités par leur puissance de calcul et par leur espace de stockage. Mais la puissance de calcul n'est qu'un problème de rapidité et l'espace de stockage peut en principe être agrandi sans limites. Il suffit d'imaginer un ordinateur monté sur un robot qui se déplace dans une base de données qu'on peut toujours agrandir.

Une théorie universelle est une théorie qui permet de prouver tout ce que les autres théories permettent de prouver. Par exemple, la logique peut être formalisée comme une théorie universelle. Il suffit de se donner suffisamment d'axiomes pour que toutes les formules vraies de la forme C est une conséquence logique de P soient prouvable, pour toutes les formules bien formées C et P. Comme n'importe quel théorème de n'importe quelle théorie est toujours prouvé à partir d'une conjonction finie d'axiomes, la logique ainsi formalisée est une théorie universelle.

En prouvant que les relations logiques entre formules peuvent être représentées par des relations arithmétiques entre des nombres qui représentent les formules, Gödel a prouvé que l'arithmétique est elle aussi une théorie universelle, même si on la limite à l'arithmétique de Peano au premier ordre.

L'existence des théories universelles pose un paradoxe. Comme toute théorie explicite, une théorie U universelle ne peut pas prouver toutes les vérités. Ces vérités qu'elles ne peut pas prouver sont en principe prouvables dans une théorie plus riche U+, qui a davantage d'axiomes. Mais comme la théorie initiale U est universelle, elle peut prouver tout ce que U+ peut prouver, ce qui semble contraire à l'hypothèse que U+ est plus riche que U. En particulier, la preuve de cohérence de l'arithmétique du premier ordre peut être formalisée dans l'arithmétique du premier ordre, puisqu'elle peut être formalisée dans une théorie explicite et puisque l'arithmétique du premier ordre est une théorie universelle. Mais le second théorème d'incomplétude de Gödel semble interdire une telle possibilité.

L'explication de ce paradoxe est un peu subtile. La théorie U+ peut être formalisée dans U, mais U "ne sait pas" que U+ est un enrichissement de U, c'est à dire que U peut prouver que tous les théorèmes de U+ sont des théorèmes de U+ mais elle ne peut pas prouver que les théorèmes de U+ valent pour elle-même. U peut donc formaliser la preuve de sa propre cohérence sans le dire explicitement, sans affirmer qu'il s'agit de sa propre cohérence.

L'indécidabilité du problème de l'arrêt[modifier | modifier le wikicode]

Le problème de l'arrêt : Étant donnés une programme informatique et un état initial de la mémoire, l'ordinateur va-t-il s'arrêter et fournir une réponse, ou va-t-il tourner indéfiniment sans jamais donner de réponse ?

On a supposé que l'ordinateur n'est pas limité en espace de stockage et qu'il ne subit pas d'influence extérieure pendant qu'il calcule.

Turing a prouvé que le problème se l'arrêt est indécidable (1936).

L'ensemble des couples (programme, état initial) d'une machine qui s'arrête est récursivement énumérable, parce qu'un ordinateur peut simuler tous les autres. Si on lui présente un programme et un état initial, il n'a qu'à faire tourner le programme sur l'état initial et attendre qu'il s'arrête. S'il s'arrête, l'ordinateur répond qu'il s'arrête. S'il ne s'arrête pas, l'ordinateur ne s'arrête pas et ne répond pas.

En revanche l'ensemble des couples (programme, état initial) d'une machine qui ne s'arrête pas n'est pas récursivement énumérable. On le prouve par l'absurde. S'il était récursivement énumérable, il y aurait un programme P tel que pour tout couple (programme p, état initial i), la machine s'arrête et répond que p ne s'arrête pas à partir de i à chaque fois que c'est vrai. Un programme peut être écrit en mémoire et est donc lui aussi un état initial possible. A partir de P on pourrait alors écrire un programme P' tel que pour tout programme p, la machine s'arrête et répond que p ne s'arrête pas à partir de l'état initial p à chaque fois que c'est vrai. Et on pourrait donner P' comme état initial de la mémoire de la machine qui tourne avec P' . Cette machine va-elle s'arrêter ? Par construction, elle s'arrête si et seulement si elle ne s'arrête pas. C'est une absurdité. Donc P' ne peut pas exister, et donc P non plus. L'ensemble des couples (programme, état initial) d'une machine qui ne s'arrête pas n'est donc pas récursivement énumérable. Le problème de l'arrêt est donc indécidable.

L'indécidabilité de l'ensemble des lois logiques[modifier | modifier le wikicode]

L'ensemble des lois logiques est une théorie universelle, parce qu'une formule est une théorème d'une théorie si et seulement si l'affirmation qu'elle résulte d'une conjonction finie de ses axiomes est une loi logique. En connaissant toutes les lois logiques, on connaît donc tous les théorèmes de toutes les théories.

Lorsqu'une théorie est définie avec un nombre fini d'axiomes, une formule n'est pas un théorème si et seulement si l'affirmation qu'elle résulte de la conjonction des axiomes n'est pas une loi logique.

Les théories fondamentales (l'arithmétique de Peano, la théorie de Zermelo ...) sont en général définies avec des schémas d'axiomes. L'axiome de séparation par exemple est un schéma qui permet de formuler autant d'axiomes qu'il y a de formules sensées, en nombre infini. Il en va de même pour le principe du raisonnement par récurrence quand on le formule dans l'arithmétique du premier ordre. Mais ces théories qui ont un nombre infini d'axiomes sont toujours équivalentes à des théories qui n'en ont qu'un nombre fini. En introduisant des classes, qui sont comme des ensembles, mais trop grandes pour être vraiment considérées comme des ensembles, à la façon de Gödel et Bernays, la théorie de Zermelo n'a plus qu'un nombre fini d'axiomes.

Même quand les théories ont un nombre infini d'axiomes, on exige toujours qu'il y ait un nombre fini de principes ou de règles qui suffisent pour engendrer mécaniquement tous les axiomes, sinon la théorie n'est pas explicite. C'est pourquoi les théories explicites sont toujours équivalentes à des théories à nombre fini d'axiomes.

Si l'ensemble des lois logiques était décidable, tous les ensembles récursivement énumérables seraient décidables : Toutes les vérités d'appartenance à un ensemble E récursivement énumérable sont des théorèmes d'une théorie à nombre fini d'axiomes. Le complémentaire de E est donc l'ensemble de tous les x tels que Si les axiomes alors x est dans E n'est pas une loi logique. Si l'ensemble des lois logiques était décidable, cet ensemble serait récursivement énumérable, et donc E serait décidable.

La preuve de l'indécidabilité du problème de l'arrêt montre qu'il existe au moins un ensemble récursivement énumérable qui n'est pas décidable. L'ensemble des lois logiques n'est donc pas décidable.

La preuve du premier théorème d'incomplétude permet de prouver plus directement l'indécidabilité de l'ensemble des lois logiques. Si l'ensemble des lois logiques était décidable, la théorie T pourrait avoir assez d'axiomes pour prouver toutes les formules vraies de la forme f n'est pas une conséquence logique de g. Elle pourrait donc prouver toutes les formules vraies de la forme f n'est pas prouvable dans T. Comme Gödel(Gödel(f)) n'est pas prouvable dans T, elle pourrait le prouver. Mais Gödel(Gödel(f)) dit d'elle même qu'elle n'est pas prouvable dans T. T pourrait alors prouver que Gödel(Gödel(f)) n'est pas prouvable dans T, ce qui est absurde. Donc l'ensemble des lois logiques est indécidable.

L'indécidabilité de l'ensemble des lois logiques, ou de l'Entscheidungsproblem (Hilbert 1928) a été prouvée indépendamment et avec des méthodes différentes par Church et Turing en 1936.

L'universalité est la cause de l'indécidabilité[modifier | modifier le wikicode]

Les problèmes dont nous savons prouver l'indécidabilité sont toujours des problèmes complets, au sens où si nous avions une méthode pour trouver toutes leurs solutions, nous aurions du même coup une méthode pour résoudre tous les problèmes. De ce point de vue, l'incomplétude des principes mathématiques n'est finalement pas très étonnante. On n'est pas obligé de la voir comme un signe d'incapacité, parce qu'elle est une conséquence de l'universalité de la pensée. Nous pouvons raisonner sur tous les problèmes, sur toutes les théories. Nous pouvons énoncer des lois universelles qui valent pour tout ce qui est concevable et pensable. Mais nous n'avons pas de méthodes ou de principes qui suffisent pour résoudre tous les problèmes. Nos méthodes, même les plus puissantes, ne peuvent pas tout résoudre. Nous ne sommes que des créatures. Savoir trouver toutes les solutions d'un problème indécidable serait une sorte d'omniscience, parce qu'on saurait du même coup comment trouver toutes les solutions de tous les problèmes.

Une liste finie de principes suffit pour engendrer toutes les lois logiques. C'est le théorème de complétude de la logique de Gödel. L'ensemble des lois logiques est donc récursivement énumérable. Mais puisque l'ensemble des lois logiques est indécidable, l'ensemble des formules qui ne sont pas des lois logiques n'est pas récursivement énumérable. Les lois logiques sont vraies dans tous les mondes possibles. Les négations des lois logiques sont des absurdités, fausses dans tous les mondes possibles. Une formule qui n'est ni une loi logique, ni la négation d'une loi logique, est vraie dans certains mondes et fausse dans d'autres, elle décrit des mondes possibles, des mondes qu'on peut imaginer. Tout système fini d'axiomes qui décrit un monde possible est tel que la négation de sa conjonction n'est pas une loi logique. L'ensemble des formules qui ne sont ni des lois logiques, ni des absurdités est l'ensemble de tous les axiomes et de tous les systèmes finis d'axiomes qui portent sur au moins un monde qu'on peut imaginer. Dire qu'il n'est pas récursivement énumérable veut dire qu'on ne peut pas donner une liste finie de principes qui suffise pour engendrer toutes ces systèmes d'axiomes. L'imagination déborde tous les cadres. Quelle que soit la liste finie de principes qu'on se donne, il y a toujours des mondes possibles qu'elle ne permet pas d'étudier. L'incomplétude mathématique est donc une conséquence de l'universalité et de la puissance de l'imagination.


Chapitre suivant : La vérité des principes relativistes >>>


La vérité des principes relativistes

Le principe de relativité générale[modifier | modifier le wikicode]

Les lois de la physique ne doivent pas dépendre du système de coordonnées avec lequel elles sont formulées. (Einstein 1916)

Qu'est-ce que ça veut dire ?

Un système de coordonnées nous permet de nommer des objets physiques. Un point de l'espace par exemple peut être nommé avec trois nombres, ses trois coordonnées, dès qu'on s'est donné un système de repérage. Quand on change de système de coordonnées, on change les noms des objets physiques, mais on ne change pas les objets eux-mêmes ni leurs relations. Les vérités ne doivent pas dépendre de la façon dont les objets sont nommés. Les mêmes vérités peuvent être dites quelle que soit la façon dont nous nommons les objets, elles sont seulement formulées différemment. Le principe de relativité générale, proposé par Einstein comme une avancée théorique majeure, parce qu'il est au fondement de sa théorie de la gravitation, ressemble donc à une trivialité : la vérité demeure quand on change sa formulation.

Une formulation plus moderne du principe de relativité générale ne modifie pas cette apparence de trivialité :

Toutes les lois de la physique doivent pouvoir être formulées par des relations géométriques, indépendantes du système de coordonnées, entre objets géométriques, indépendants du système de coordonnées. (Thorne & Blandford, Modern Classical Physics, p.1154, abrégé dans la suite par MCP)

Plus simplement dit, les lois de la physique doivent énoncer des vérités sur des relations entre des objets.

Mais si le principe de relativité générale est seulement une trivialité, pourquoi est-il le plus grand principe de toute la physique classique ? Pourquoi nous permet-il de comprendre d'une façon unifiée à la fois la physique de Newton, la théorie de la relativité restreinte et la théorie de la relativité générale ? Pourquoi a-t-il conduit Einstein à la découverte de la loi fondamentale de la gravitation ?

La façon dont on applique le principe de relativité générale lui donne une signification physique, c'est à dire qu'elle nous conduit à formuler des lois qu'on peut confronter à l'observation. Plus précisément on postule que tous les objets physiques sont déterminés avec des scalaires, des vecteurs et des tenseurs et que les lois physiques sont toujours des égalités entre scalaires, ou entre vecteurs, ou entre tenseurs. Trois espace-temps sont de première importance pour définir les objets physiques avec des scalaires, des vecteurs et des tenseurs : l'espace-temps classique de Newton, l'espace-temps de Minkowski, pour la théorie de la relativité restreinte, et l'espace-temps courbe de la relativité générale. Les propriétés géométriques de l'espace-temps imposent des contraintes sur les scalaires, les vecteurs et les tenseurs qu'on peut y définir et sur les lois physiques qu'on peut leur appliquer. Le principe de relativité générale à lui tout seul n'a pas de signification physique, mais il en acquiert une dès qu'il est accompagné des principes de la géométrie de l'espace-temps.

Quand on applique le principe de relativité générale on respecte en outre en général le principe de localité :

Les lois de la physique doivent être des égalités entre scalaires, ou entre vecteurs, ou entre tenseurs, définis au même point de l'espace-temps.

La loi de la gravitation universelle de Newton ne respecte pas le principe de localité, parce qu'elle postule une action instantanée à distance, mais c'est une faiblesse de la théorie et une exception dans la physique newtonienne. En général, la physique de Newton et de ses successeurs respecte le principe de localité. La dynamique des solides et des fluides incompressibles est aussi une exception, mais ce n'est pas une objection fondamentale, parce que les solides et les fluides incompressibles ne sont que des modèles approximatifs de la réalité. Tous les solides et tous les fluides sont toujours compressibles, au moins un peu.

Le principe de relativité générale a été curieusement nommé, parce qu'il affirme que les lois de la physique ne sont pas relatives à un système de coordonnées ou à un observateur particulier. C'est donc un principe qui affirme le caractère absolu de la vérité physique. Les théories de la relativité restreinte et générale qu'il permet de fonder sont également des théories de la vérité absolue. Le principe de relativité serait donc mieux nommé si on l'appelait le principe d'absoluité, mais Einstein en a décidé autrement, et son usage s'est imposé.

Qu'est-ce qu'un tenseur ?[modifier | modifier le wikicode]

Un tenseur de rang n est par définition une application linéaire qui associe un scalaire, c'est à dire un nombre réel indépendant du système de coordonnées, à n vecteurs (MCP, p.11).

Dans un espace vectoriel euclidien le produit scalaire de deux vecteurs est un tenseur, de rang 2, de toute première importance. En particulier, il permet d'identifier un vecteur avec le tenseur de rang 1 défini par . De même, une application linéaire de dans peut être identifiée à un tenseur de rang 2 défini par

Les scalaires et les vecteurs sont des objets géométriques, indépendants du système de coordonnées. Comme les tenseurs sont des applications qui attribuent des scalaires à des vecteurs, ils sont aussi des objets géométriques, indépendants du système de coordonnées.

Un malentendu sur la relativité de la vérité[modifier | modifier le wikicode]

La théorie de la relativité d'Einstein se distingue de la physique de Newton sur un point principal, la relativité de la simultanéité. Selon Einstein, deux événements simultanés pour un observateur ne sont pas forcément simultanés pour un autre, s'il est en mouvement par rapport au premier, tandis que Newton postule implicitement que la simultanéité des événements est absolue, la même pour tous les observateurs.

Mais on aurait tort de croire que la théorie de la relativité nous force à renoncer à la vérité absolue. Les théories d'Einstein, comme toutes les théories scientifiques, affirment que la vérité est absolue, la même pour tous. Toute vérité qui peut être reconnue comme un savoir scientifique par un être rationnel peut être reconnue ainsi par tous les autres. La vérité est la même pour tous ou elle n'est pas scientifique. Une science qui ne pourrait être connue que par quelques uns est une absurdité. Nous sommes tous égaux devant la vérité scientifique.

Quand des vérités sont relatives, à un observateur, à un point de vue, à des hypothèses ou à des principes, il est toujours absolument vrai qu'elles le sont. Si un énoncé e est vrai du point de vue de A mais pas du point de vue de B, qu'il est vrai du point de vue A est vrai pour A comme pour B. e est une vérité relative, mais l'affirmation que e est vrai du point de vue de A est une vérité absolue.

On croit souvent nier le caractère absolu de la vérité scientifique quand on remarque que la science accueille de très nombreuses théories qui se contredisent parfois les unes les autres, et qu'aucune ne peut prétendre être la vérité absolue. Mais c'est une erreur. Quand nous sommes scientifiques, nous connaissons la vérité absolue tous les jours, puisque même quand nos vérités sont relatives, il suffit d'affirmer qu'elles sont relatives pour dire la vérité absolue. Qu'aucune théorie scientifique ne puisse prétendre être à elle-seule la vérité absolue, complète, ultime et définitive, ne prouve pas qu'il n'y a pas de vérité absolue, mais seulement que nous ne la connaissons pas totalement.

La physique newtonienne et le principe de relativité de Galilée[modifier | modifier le wikicode]

Newton nous a appris à faire de la physique en étudiant les solutions d'une unique équation :

est la force exercée sur une particule, sa masse et son accélération. Cette équation est la loi fondamentale de la dynamique newtonienne.

Les particules sont ou bien des points matériels, ou bien des particules de solide ou de fluide. Les points matériels sont les particules élémentaires de la physique classique. Les particules de solide ou de fluide sont de petites régions au voisinage d'un point d'un solide ou d'un fluide.

En plus des points matériels, des solides et des fluides, la physique classique accueille les champs de forces exercées et subies par la matière.

Pour la physique newtonienne, les vecteurs sont toujours des vecteurs de l'espace euclidien à trois dimensions. Un vecteur peut être identifié à une flèche qui sépare deux points de l'espace. Deux flèches qui partent de points différents représentent le même vecteur si elles sont parallèles, de même longueur et de même sens.

Avec un repère, les vecteurs servent à représenter les positions, les vitesses et les accélérations des particules. Un repère, ou un référentiel, est une sorte de rocher à partir duquel on peut faire des mesures géométriques. Si on choisit sur le rocher un point comme origine, la position de tout autre point est repérée par le vecteur qui le sépare de l'origine. Un vecteur vitesse est la dérivée temporelle d'un vecteur position. Un vecteur accélération est la dérivée temporelle d'un vecteur vitesse.

La position et la vitesse d'une particule sont toujours relatives au repère qui permet de les mesurer. En revanche, l'existence des repères inertiels donne un caractère absolu à l'accélération. Un repère inertiel est un rocher qui n'est soumis à aucune force et qui ne tourne pas sur lui-même. La Terre n'est pas exactement un repère inertiel, parce qu'elle tourne sur elle-même et parce qu'elle est attirée par le Soleil, mais en première approximation, elle peut souvent être considérée comme un repère inertiel. Si on est attaché à un repère qui n'est pas inertiel, comme un manège, ou un train qui freine, ou qui accélère, ou qui change de direction, on ressent les effets de la rotation, ou de l'accélération, tandis qu'un repère inertiel, ou presque inertiel, nous laisse nous reposer tranquillement.

Galilée a remarqué que dans un bateau sur une mer calme, on peut faire les mêmes expériences que si on reste au port. Tant que le mouvement du bateau n'est pas agité, aucune expérience sur le bateau ne permet de dire s'il est immobile ou en mouvement par rapport à la Terre. Ceci est général. Si un repère a une vitesse constante par rapport à un repère inertiel alors il est lui aussi inertiel. Tous les repères inertiels ont des vitesses constantes les uns par rapport aux autres et ils sont tous physiquement équivalents, au sens où toute expérience qui peut être faite dans l'un peut être reproduite dans l'autre. C'est le principe de relativité de Galilée :

Les résultats d'une expérience ne dépendent pas du repère inertiel dans lequel elle est faite.

Einstein l'a nommé principe de relativité, parce qu'il montre que la vitesse et l'immobilité sont toujours relatives, qu'il n'y a pas d'espace absolu. Comme aucun repère inertiel n'est privilégié, les lois de la physique interdisent d'identifier un état de repos absolu. Le mouvement et le repos d'un corps sont toujours relatifs à un autre corps. Parler de repos ou de mouvement par rapport à l'espace vide n'a pas de sens physique. Mais ce principe de relativité peut aussi être considéré comme un principe d'absoluité, puisqu'il affirme que les lois de la physique sont les mêmes pour tous les observateurs, quel que soit le repère inertiel où ils font leurs mesures.

Comme tous les repères inertiels ont des vitesses constantes les uns par rapport aux autres, l'accélération d'une particule ne dépend pas du repère inertiel dans lequel elle est mesurée. La loi fondamentale de la dynamique newtonienne est en accord avec le principe de relativité de Galilée parce qu'elle ne mentionne que des forces, qui sont des grandeurs absolues, indépendantes du choix d'un repère, et des accélérations, qui sont elles aussi des grandeurs absolues, indépendantes du choix d'un repère, pourvu qu'il soit inertiel.

Les déformations sont également des grandeurs absolues, les mêmes pour tous les observateurs. Elles sont représentées par des vecteurs qui mesurent l'écart entre la position déformée et la position initiale. Il est naturel de les mesurer dans un repère où le matériau est au repos, mais un autre repère convient également.

La physique newtonienne est en général très bien adaptée à l'étude des mouvements de la matière ordinaire, les solides et les fluides. Il suffit souvent de mesurer quelques paramètres, la densité, l'élasticité, la viscosité ... pour calculer et prédire les mouvements d'un matériau. Quelques lois simples sur l'existence des forces d'élasticité ou de viscosité suffisent pour appliquer la loi fondamentale de Newton, . Le principe de relativité générale et le principe de localité sont des outils très puissants pour trouver les lois du mouvement, parce que les scalaires, les vecteurs et les tenseurs qui permettent d'énoncer ces lois sont peu nombreux. De fait, toute la physique classique newtonienne peut être retrouvée comme une conséquence du principe de relativité générale quand on l'applique à l'espace-temps newtonien (MCP, p.10).

En revanche, la physique newtonienne n'est pas bien adaptée à l'étude des interactions fondamentales. La loi de la gravitation universelle ne respecte pas le principe de localité et les lois de l'électromagnétisme, les équations de Maxwell et de Lorentz, formulées dans un cadre newtonien, ne respectent pas le principe de relativité de Galilée. La théorie de la relativité restreinte d'Einstein résout le second problème, tandis que sa théorie de la relativité générale résout le premier.

L'espace-temps de Minkowski[modifier | modifier le wikicode]

La constance de la vitesse de la lumière[modifier | modifier le wikicode]

Les équations de Maxwell prédisent que la lumière a une vitesse constante dans le vide, et la même dans toutes les directions. Cette prédiction semble incompatible avec le principe de relativité de Galilée. Si la lumière avance à la vitesse par rapport à un repère inertiel, alors elle devrait être immobile par rapport à un autre repère inertiel qui avance à la même vitesse par rapport au premier. Si on était capable d'aller aussi vite que la lumière, elle pourrait être immobile par rapport à nous, et nous ne pourrions même plus nous voir dans un miroir.

La constance de la vitesse de la lumière dans le vide a d'abord été interprétée comme la preuve de l'existence d'une immobilité absolue. Un repère inertiel serait absolument immobile pourvu qu'il attribue toujours à la lumière la vitesse dans le vide. Dans tout repère inertiel en mouvement par rapport à lui, la lumière aurait une vitesse différente. On supposait aussi que la lumière était une sorte de vibration d'une matière transparente et inconnue qu'on appelait l'éther. L'immobilité absolue était alors conçue comme l'immobilité par rapport à cet hypothétique éther. Il fallait aussi renoncer à la portée universelle du principe de relativité de Galilée, puisqu'il était contredit par les équations de Maxwell.

C'est ce dernier point qui a interpellé Einstein, parce que les lois de l'électromagnétisme semblent souvent au contraire en très bon accord avec le principe de relativité de Galilée. C'est pourquoi Einstein a fait le choix a priori surprenant d'interpréter les équations de Maxwell en conservant le principe de relativité de Galilée. C'est un choix surprenant parce qu'il conduit au principe suivant :

La vitesse de la lumière est la même, dans toutes les directions, quel que soit le repère inertiel où elle est mesurée.

En particulier, la lumière avance à 300000 km/s par rapport à la Terre, mais si je la poursuis à la vitesse de 299000 km/s alors elle avance quand même à 300000 km/s par rapport à moi. C'est une conclusion absurde seulement en apparence. Einstein a montré que la relativité de la simultanéité par rapport au mouvement de l'observateur suffit pour faire disparaître l'apparence d'absurdité.

La relativité de la simultanéité[modifier | modifier le wikicode]

Que la simultanéité soit relative ou absolue est une question empirique dès qu'on a précisé comment on observe la simultanéité de deux événements. Pour cela il suffit de mesurer des distances sur un repère inertiel et d'y placer un émetteur d'ondes sphériques, des ondes sonores par exemple, qui se propagent dans un milieu matériel attaché au repère. Deux points situés à la même distance de l'émetteur reçoivent une impulsion sonore simultanément, par définition de la simultanéité. Einstein se servait de la lumière elle-même, et non des ondes sonores, pour définir la simultanéité des événements, mais cela affaiblissait son raisonnement, parce qu'il devait postuler que la lumière a la même vitesse dans toutes les directions. Ce postulat n'est pas nécessaire pour définir la simultanéité.

Les résultats empiriques sont clairs. Toutes les expériences jusqu'à ce jour confirment les prédictions de la théorie d'Einstein. La simultanéité des événements est donc relative au mouvement de l'observateur et la vitesse de la lumière est la même dans toutes les directions, quel que soit le repère inertiel où elle est mesurée.

Les dispositifs de mesure spatio-temporelle[modifier | modifier le wikicode]

Un règle rigide, ou un compas, permet de mesurer la distance entre ses extrémités en la comparant à d'autres distances. Une règle rigide est donc un dispositif de mesure d'une longueur, ou d'un intervalle, spatial. Le point important est que la règle soit rigide, pour que la distance mesurée soit toujours la même. On peut concevoir sur le même modèle des dispositifs de mesure des intervalles spatio-temporels. Une simple horloge est un tel dispositif. Elle permet de pointer deux événements qui sont toujours séparés par la même durée. On peut aussi se servir de deux horloges fixées à un même support rigide, chacune étant utilisée pour pointer un certain événement. Si le dispositif qui déclenche les deux horloges est régulier, l'intervalle spatio-temporel entre les deux événements pointés peut être toujours le même. De tels dispositifs permettent de mesurer l'espace-temps de la même façon que les règles rigides permettent de mesurer l'espace.

Un intervalle est du genre temps lorsqu'il est sur la trajectoire d'un point matériel massif. Il est du genre lumière lorsqu'il est sur la trajectoire d'un rayon de lumière dans le vide. Tous les autres intervalles sont du genre espace. Lorsqu'un intervalle est du genre espace, il existe toujours un repère inertiel pour lequel ses extrémités sont des événements simultanés. Les dispositifs de mesure spatio-temporels permettent de mesurer les trois genres d'intervalle. Une seule horloge suffit pour mesurer les intervalles du genre temps. Deux horloges fixées sur une règle rigide et convenablement synchronisées permettent de mesurer des intervalles du genre espace ou genre lumière.

Tous les intervalles du genre lumière sont égaux[modifier | modifier le wikicode]

La théorie permet d'attribuer un nombre réel à tous les intervalles spatio-temporels, quel que soit leur genre, ou plus précisément à leur carré. Les intervalles du genre lumière en particulier sont tous égaux à zéro et donc tous égaux entre eux. C'est a priori surprenant. Cela veut dire par exemple que l'intervalle spatio-temporel entre l'émission d'un photon et sa réception trois mètres plus loin est égal à l'intervalle entre son émission et sa réception trois années-lumière plus loin, comme si le photon en avançant ne s'éloignait jamais de son point de départ. N'est-ce pas le pays des merveilles ?

Les dispositifs de mesure spatio-temporelle et la relativité de la simultanéité permettent de comprendre ce résultat contre-intuitif. Imaginons une fusée lancée vers une étoile à trois années-lumière de la Terre. Un photon est émis à l'arrière de la fusée et il est reçu à l'avant, trois mètres plus loin, du point de vue de la fusée, donc une infime fraction de seconde plus tard. Mais à cause de la relativité de la simultanéité, ce qui dure une infime fraction de seconde du point de vue de la fusée peut durer trois années du point de vue de la Terre, pourvu que la fusée soit suffisamment rapide. Le même dispositif spatio-temporel mesure à la fois un intervalle lumière de trois années-lumière et un intervalle lumière de trois mètres. Il établit ainsi leur égalité.

La métrique de Minkowski et les tenseurs de l'espace-temps[modifier | modifier le wikicode]

Dans l'espace euclidien, la distance peut être définie à partir du produit scalaire, parce que la longueur d'un vecteur est la racine carrée de son carré scalaire :

C'est pourquoi on dit du produit scalaire qu'il définit la métrique de l'espace euclidien.

Inversement le produit scalaire peut être défini à partir de la distance, avec la formule :

Lorsqu'on introduit des coordonnées cartésiennes le carré scalaire est la formule de Pythagore :

Dans l'espace-temps de Minkowski, on peut aussi définir un produit "scalaire" à partir de la mesure des intervalles, mais on l'appelle parfois pseudo-scalaire, parce qu'il n'a pas toutes les propriétés du produit scalaire habituel.

Comme dans l'espace euclidien les vecteurs de l'espace-temps peuvent être identifiés à des intervalles, mais ce sont des intervalles entre des événements et non des intervalles entre des points de l'espace. Les vecteurs ont donc quatre composantes, une composante temporelle et trois composantes spatiales.

Les intervalles du genre temps peuvent être mesurés en secondes et les intervalles du genre espace en mètre. Le produit "scalaire" les distingue en leur attribuant aux uns un carré scalaire positif et aux autres un carré scalaire négatif. Le carré scalaire des intervalles du genre lumière est nul.

Si on choisit que les intervalles du genre temps ont un carré scalaire négatif, le carré scalaire d'un intervalle est :

Si on choisit comme unité de distance la seconde-lumière, 300000 km environ, et le carré scalaire s'écrit plus simplement :

À partir du carré scalaire et donc de la mesure des intervalles spatio-temporels on peut définir le produit "scalaire" spatio-temporel comme dans l'espace euclidien.

Les tenseurs sont définis comme dans l'espace euclidien, sauf que le tenseur fondamental est le produit "scalaire" de Minkowski.

Pourquoi la physique newtonienne est-elle quand même vraie ?[modifier | modifier le wikicode]

La physique newtonienne postule implicitement que la simultanéité des événements est absolue et elle applique le principe de relativité générale aux vecteurs tridimensionnels de l'espace euclidien et à leurs tenseurs. Or la théorie de la relativité a montré que la simultanéité des événements est relative et qu'il faut appliquer le principe de relativité générale aux vecteurs quadridimensionnels de l'espace-temps et à leurs tenseurs.

La physique newtonienne est fausse mais seulement un peu fausse, et souvent sa fausseté est négligeable, indétectable compte-tenu de l'imprécision des mesures. Les vecteurs tridimensionnels sont comme des ombres des vecteurs quadridimensionnels. Tant que les vitesses sont petites devant celle de la lumière, ces ombres sont peu déformées, et on commet une faible erreur si on raisonne sur les ombres plutôt que sur les quadrivecteurs. C'est seulement lorsque les vitesses s'approchent de celle de la lumière que la fausseté de la physique newtonienne devient détectable.

La courbure de l'espace-temps et la gravitation[modifier | modifier le wikicode]

La chute libre et les orbites des planètes[modifier | modifier le wikicode]

La théorie de Newton explique la chute libre à la surface de la Terre et la trajectoire de la Lune avec la même force d'attraction gravitationnelle :

Gravitation.gif

Tout se passe comme si la Lune n'arrêtait pas de tomber sur la Terre, mais elle tombe toujours à côté, et finalement elle ne fait que tourner autour du corps sur lequel elle tombe. De façon générale, les satellites et les projectiles obéissent tous à la même loi. Les orbites des planètes et les trajectoires de tous les satellites peuvent être considérées comme des trajectoires de chute libre, sauf que c'est une chute qui n' a pas de fin.

La théorie de Newton montre donc, contre Aristote, que les mêmes lois expliquent le mouvement des corps terrestres et célestes.

La grande idée d'Einstein[modifier | modifier le wikicode]

Einstein a été conduit à la théorie de la relativité générale en comprenant que la chute libre est identique à l'apesanteur. Si on se trouve dans un ascenseur en chute libre, tout se passe comme si on était dans un ascenseur en apesanteur, jusqu'à ce qu'il s'écrase sur le sol. Cela permet de produire expérimentalement de l'apesanteur à la surface de la Terre. Il suffit de se servir d'un avion qui simule une trajectoire de chute libre. Tant qu'il reste sur une telle trajectoire, tous les passagers sont en apesanteur :

Physicist Stephen Hawking in Zero Gravity NASA.jpg

Stephen Hawking à bord d'un Boeing 727 lors d'une expérience d'apesanteur

Pour la physique newtonienne, être en chute libre est être soumis à la force de la gravité. Pour la physique einsteinienne, être en chute libre est n'être soumis à aucune force, parce qu'un corps en chute libre se comporte de la même façon que s'il était en apesanteur. Selon Einstein, la force de gravité n'existe pas, la gravitation n'est pas une force.

Pour la physique newtonienne, un corps au repos à la surface de la Terre a une accélération nulle et n'est donc soumis à aucune force, ou plus précisément il est soumis à deux forces qui se compensent exactement, l'attraction gravitationnelle de la Terre et la force de réaction du sol. Pour la physique einsteinienne, un corps au repos à la surface de la Terre est en permanence soumis à la force de réaction du sol. Celle-ci n'est pas compensée par la force de gravité, qui n'existe pas. Si aucune force n'agissait sur le corps, il resterait sur une trajectoire de chute libre et ne serait donc pas au repos à la surface de la Terre.

Dans l'espace-temps de Newton, et dans celui de Minkowski, les corps qui ne soumis à aucune force vont toujours en ligne droite et à des vitesses constantes les uns par rapport aux autres. Ces trajectoires rectilignes sont les géodésiques, c'est à dire les lignes de plus court chemin, de ces espaces-temps. Dans un espace-temps courbe, tous les corps en chute libre et tous les satellites en orbite ne sont soumis à aucune force, et leurs trajectoires sont toutes des géodésiques.

Dans un espace plat, tel qu'une feuille de papier, les lignes de plus court chemin sont toujours des lignes droites, mais un espace courbe peut accueillir d'autres lignes géodésiques. Sur une sphère par exemple, les géodésiques sont les grands cercles. Les espaces-temps de Newton et de Minkowski sont plats, au sens où les géodésiques sont toujours des lignes droites, mais l'espace-temps de la relativité générale est un espace-temps courbe, parce que les géodésiques y sont libres d'adopter davantage de formes.

Dans la théorie de Newton, les corps massifs exercent des forces gravitationnelles les uns sur les autres. Dans la théorie d'Einstein, ces forces n'existent pas, mais les corps affectent la courbure de l'espace-temps là où ils sont présents. Le Soleil par exemple courbe l'espace-temps par sa présence et fait apparaître ainsi à son voisinage des géodésiques qui reviennent sur elles-mêmes. Les trajectoires des planètes sont justement de telles géodésiques.

L'égalité de la masse inerte et de la masse pesante[modifier | modifier le wikicode]

La masse inerte est par définition le coefficient d'inertie qui apparaît dans la loi fondamentale de la dynamique newtonienne :

C'est un coefficient d'inertie parce qu'il mesure la capacité d'un corps à résister à l'action d'une force. Plus il est élevé, plus l'effet d'une force est petit.

La masse inerte mesure la façon dont un corps subit les forces exercées par d'autres corps. La masse pesante mesure quant à elle la façon dont un corps agit sur les autres corps. Elle est le coefficient qui apparaît dans la loi de la gravitation universelle :

Deux corps de masses et séparés par une distance exercent chacun sur l'autre une force attractive égale à

est la constante de la gravitation universelle.

On observe que tous les corps soumis à la gravitation subissent tous la même accélération, quelle que soit leur masse et le matériau dont ils sont faits. On peut expliquer cette observation en postulant que la masse inerte est toujours égale à la masse pesante , parce qu'un corps de masse inerte et de masse pesante soumis à la gravitation d'un corps de masse pesante a une accélération égale à

si

La théorie de Newton n'impose pas l'égalité . En principe ces deux coefficients pourraient être différents, et l'accélération d'un corps soumis à la gravitation pourrait dépendre du matériau qui le constitue. Mais les mesures plus précises n'ont jamais permis d'observer une telle variation.

La théorie d'Einstein quant à elle impose que la trajectoire d'un corps soumis à la gravitation ne dépende pas de son matériau, parce que tous les corps, quelle que soit leur matériau, doivent suivre les mêmes géodésiques. Elle impose donc que les masses inerte et pesante soient égales, ce qui est très exactement ce qu'on observe.

Relativité restreinte et relativité générale[modifier | modifier le wikicode]

La métrique de l'espace euclidien est décrite avec le tenseur métrique euclidien, c'est à dire le produit scalaire, qu'on peut définir à partir de la longueur des vecteurs et donc à partir de la mesure des longueurs dans l'espace.

La métrique de l'espace-temps de Minkowski est décrite avec le tenseur métrique minkowskien, c'est à dire le produit "scalaire" de Minkowski, qu'on peut définir à partir de la mesure des intervalles dans l'espace-temps.

La métrique d'un espace-temps courbe est décrite avec un tenseur métrique riemannien. C'est l'analogue pour un espace-temps courbe du tenseur métrique minkowskien pour un espace-temps plat.

La géométrie différentielle est l'outil mathématique adapté pour définir les espaces-temps courbes et leurs tenseurs métriques. Elle permet ainsi de définir tous les vecteurs et les tenseurs qui peuvent exister dans ces espaces-temps. Pour autoriser toutes les formes d'espace-temps concevables, elle autorise tous les systèmes de coordonnées. Le même objet peut donc toujours être représenté même après un changement arbitraire du système de coordonnées. Plus précisément, on ne s'intéresse qu'aux changements de coordonnées qui respectent la structure différentielle de l'espace-temps, c'est à dire les difféomorphismes.

Les changements arbitraires de systèmes de coordonnées sont nécessaires pour définir les espaces-temps courbes en toute liberté. Pour les espaces-temps plats, de Newton ou de Minkowski, de tels changements de coordonnées ne sont pas interdits, mais ils ne sont pas nécessaires. On peut toujours se limiter à des coordonnées cartésiennes, définies avec des repères orthonormés. C'est pourquoi l'espace-temps de Minkowski peut être défini avec un principe de relativité restreinte :

Les lois de la physique ne doivent pas dépendre du système de coordonnées orthonormé avec lequel elles sont formulées.

L'espace-temps courbe de la relativité générale doit lui être défini avec un principe de relativité générale :

Les lois de la physique ne doivent pas dépendre du système de coordonnées avec lequel elles sont formulées.

Mais le principe de relativité générale peut aussi être appliqué à l'espace-temps de Minkowski, ou à celui de Newton, et on ne s'en prive pas, puisqu'on ne se sert pas toujours de repères cartésiens pour les étudier.

Les principes relativistes sont confirmés par leurs fruits[modifier | modifier le wikicode]

Les succès de la physique montrent qu'on peut énoncer des vérités sur les objets et les relations que l'on définit. Le principe de relativité générale, qu'on devrait appeler le principe d'absoluité, est donc confirmé à chaque fois qu'une théorie physique nous fait découvrir des vérités.

La physique newtonienne applique le principe de relativité générale à l'espace euclidien. Les vecteurs et les tenseurs de l'espace euclidien suffisent pour représenter tous les mouvements de la matière ordinaire, pourvu que leurs vitesses soient petites devant celle de la lumière. Le principe de relativité générale appliqué à l'espace euclidien est donc confirmé à chaque fois que les théories qu'il permet de formuler sont en accord avec les observations, c'est à dire toujours, ou presque toujours.

La théorie de la relativité restreinte applique le principe de relativité générale à l'espace-temps de Minkowski. Les vecteurs et les tenseurs de l'espace-temps de Minkowski suffisent pour représenter tous les mouvements de la matière, tant qu'on peut ignorer la gravitation et les effets quantiques. Le principe de relativité générale appliqué à l'espace-temps de Minkowski est donc confirmé par toutes les expériences de physique classique, sauf celles qui mettent en jeu la gravitation.

La théorie de la relativité générale applique le principe de relativité générale aux espace-temps courbes. Les vecteurs et les tenseurs qu'on peut y définir suffisent pour représenter tous les mouvements de la matière, tant qu'on peut ignorer les effets quantiques. Le principe de relativité générale appliqué aux espace-temps courbes a toujours été confirmé par toutes les expériences qui auraient pu le réfuter et il a conduit à des prédictions remarquables : le Big Bang, les trous noirs, les ondes gravitationnelles ...


Chapitre suivant : La théorie quantique des destinées multiples >>>


Pourquoi l'entropie est-elle réelle ?

La réalité de l'entropie thermodynamique[modifier | modifier le wikicode]

Pour connaître la matière dans tous ses états, l'entropie est l'un des concepts les plus fondamentaux et les plus importants. Avec lui on peut expliquer à peu près tout, sans lui à peu près rien. On peut toujours attribuer une entropie aux divers fragments de matière dès que des conditions très générales sont réunies, être en équilibre thermique ou proche d'un équilibre thermique, et on peut en général la mesurer. Du point de vue de la science empirique et de la théorie thermodynamique, l'entropie est une grandeur réelle, elle décrit des propriétés réelles de la matière. Dans les cours de thermodynamique on dit qu'elle est une fonction d'état pour dire qu'elle est déterminée par l'état réel du système. L'entropie existe réellement, pas seulement dans l'imagination des théoriciens.

Du point de vue de la physique statistique, la réalité de l'entropie est pourtant un problème.

Les trois définitions de l'entropie statistique[modifier | modifier le wikicode]

La physique statistique nous demande de distinguer deux notions d'état pour un système physique, l'état microscopique, ou microétat, et l'état macroscopique, ou macroétat.

  • Le macroétat est l'état tel qu'il est défini par la thermodynamique. Il dépend de paramètres macroscopiques : le volume, l'énergie interne, le nombre de moles, la pression, la température, la tension superficielle, le potentiel chimique, l'aimantation, le champ extérieur appliqué ou tout autre paramètre macroscopique mesurable qui sert à déterminer l'état d'équilibre du système étudié.
  • Le microétat est l'état instantané du système. Il dépend de tous les états de ses constituants microscopiques. En physique classique, il est déterminé par les positions et les vitesses de toutes les particules constituantes. En physique quantique, le microétat est l'état quantique du système qui est déterminé avec l'équation de Schrödinger.

Le macroétat n'évolue pas ou lentement et de façon en général déterministe. Le microétat change en général tout le temps, très rapidement et d'une façon aléatoire.

Il semble que l'état réel d'un système est toujours son microétat. Le macroétat n'est qu'une description grossière qui ignore tous les détails microscopiques.

Sauf cas exceptionnel, on ne connaît jamais exactement le microétat d'un système macroscopique, parce qu'il faudrait connaître les états quantiques de tous ses constituants microscopiques, qui sont beaucoup trop nombreux pour être recensés, et la façon dont ils sont intriqués.

Comme le microétat est en général inconnu, la physique statistique raisonne sur la distribution de probabilités des microétats possibles. L'entropie est toujours définie à partir de cette distribution de probabilités. Elle est calculée avec la formule de Gibbs :

où les sont les probabilités de tous les microétats possibles . est la constante de Boltzmann.

Pour un système quasi-isolé, on peut montrer qu'à l'équilibre tous les microétats possibles sont également probables (cf. complément). D'une façon un peu mystérieuse, on appelle microcanonique cette distribution de probabilités. Si est le nombre des microétats possibles. Les sont alors égales à puisqu'elles sont toutes égales. La formule de Gibbs conduit alors à la formule de Boltzmann :

Boltzmann est le premier (1872-1875) qui a défini l'entropie statistique. Gibbs est venu ensuite et a généralisé la formule de Boltzmann pour des distributions de probabilités a priori quelconques (1902).

En mécanique quantique, on compte le nombre des microétats d'une base. Ce nombre est la dimension de l'espace des microétats possibles. Lorsque l'entropie est définie avec une distribution de probabilités, on peut attribuer des probabilités aux microétats de base, mais le mieux est de raisonner sur l'opérateur densité.

L'entropie mesure le manque d'information sur le microétat d'un système, donc l'ignorance de l'observateur. Mais alors il semble qu'elle n'est pas une grandeur réelle puisqu'elle dépend de la façon dont l'observateur est informé. Faut-il en conclure que la thermodynamique a tort de postuler que l'entropie est une fonction d'état ?

Pour répondre il faut distinguer trois façons d'interpréter la définition mathématique de l'entropie à partir de l'ensemble des microétats possibles, parce qu'on peut donner trois définitions d'un microétat possible :

  • Un microétat accessible au système étudié. Tous les microétats accessibles peuvent être visités par le système lors de son cheminement aléatoire.
  • Un microétat compatible avec les contraintes macroscopiques qui définissent le macroétat.
  • Un microétat compatible avec l'information dont l'observateur dispose.

Cela conduit à trois formes d'entropie qui seront appelées sur cette page l'entropie d'accessibilité, l'entropie des contraintes et l'entropie d'information.

En général mais pas nécessairement, ces trois entropies sont égales parce que tous les microétats compatibles avec les contraintes macroscopiques sont accessibles, et parce que ces contraintes sont précisément l'information dont l'observateur dispose.

L'entropie d'accessibilité peut être plus petite que l'entropie des contraintes, parce qu'il se peut que le système soit empêché d'accéder à une partie des microétats compatibles avec les contraintes macroscopiques. En particulier, si le système est bloqué dans l'un de ses microétats de plus basse énergie, donc le nombre de microétats accessibles mais les microétats de plus basse énergie peuvent être très nombreux. Le nombre de microétats compatibles avec les contraintes macroscopiques peut donc être beaucoup plus grand que 1, . Avec , l'entropie d'un système à température nulle est toujours nulle, mais avec elle peut être très différente. Comme l'entropie de température nulle, qu'on appelle aussi l'entropie résiduelle, est une grandeur mesurable qui est parfois non-nulle, il ne faut pas ignorer la différence entre l'entropie d'accessibilité et l'entropie des contraintes.

L'entropie d'information peut être plus petite que l'entropie des contraintes ou que l'entropie d'accessibilité dès que l'observateur est informé sur des détails microscopiques. Elle peut être plus grande que l'entropie des contraintes lorsque l'observateur ne connaît pas toutes les contraintes macroscopiques que le système observé doit respecter.

Clairement l'entropie d'information dépend en général de l'observateur et n'est pas déterminée par l'état réel du système étudié. La physique statistique nous invite en revanche à considérer que l'entropie des contraintes est une grandeur réelle. Mais cela n'est pas du tout évident a priori, puisqu'elle est comme l'entropie d'information une mesure du manque d'information sur le microétat du système. L'entropie d'accessibilité semble beaucoup plus réelle, parce qu'elle dépend de l'espace des microétats qui peuvent être réellement visités.

L'entropie des contraintes est une sorte d'entropie d'information. C'est l'entropie d'information d'un observateur qui est informé des contraintes macroscopiques qui déterminent l'équilibre d'un système thermodynamique.

Pour justifier la réalité de l'entropie statistique on suppose en général que l'entropie des contraintes est égale à l'entropie d'accessibilité (Diu, Guthmann, Lederer, Roulet 1989). On suppose en outre que les grandeurs thermodynamiques mesurables peuvent être définies à partir de moyennes calculées sur l'ensemble de tous les microétats accessibles. Quand le microétat change tout le temps il est naturel de considérer une moyenne temporelle qui prend en compte ces variations. Mais ces justifications de la réalité de l'entropie statistique se heurtent à de nombreuses difficultés.

Les sections suivantes montrent que l'entropie thermodynamique n'est pas l'entropie d'accessibilité mais l'entropie des contraintes lorsqu'elles sont différentes, et qu'il faut raisonner sur l'entropie d'information pour comprendre l'impossibilité du mouvement perpétuel de seconde espèce.

La réalité de l'entropie d'accessibilité[modifier | modifier le wikicode]

Ensembles statistiques, ergodicité et moyennes temporelles[modifier | modifier le wikicode]

La physique statistique est développée d'une façon mathématiquement rigoureuse en raisonnant sur des ensembles statistiques de systèmes physiques (Gibbs 1902). La probabilité d'un microétat est interprétée comme la probabilité qu'un système choisi aléatoirement dans l'ensemble statistique soit dans ce microétat. La théorie ergodique permet en principe de relier les grandeurs définies avec un ensemble statistique aux grandeurs définies avec un unique système physique. Les moyennes sur l'ensemble sont identifiées aux moyennes temporelles du système. Mais on raisonne en général sur des moyennes de très long terme, parce qu'il faut des durées immenses par rapport à l'âge de l'Univers pour qu'un système macroscopique explore une fraction appréciable de son espace des microétats accessibles. Or les mesures thermodynamiques sont en général assez rapides. Tant que les systèmes ne sont pas trop éloignés d'un équilibre thermique, une fraction de seconde peut suffire. On peut même souvent les mesurer en continu. On n'attend jamais des milliards d'années.

Si on calcule correctement une grandeur d'équilibre, avec un ensemble statistique adapté, le résultat est confirmé par l'observation. Mais la durée de celle-ci peut être assez brève, juste le temps que le système atteigne son équilibre. Même quand on attend des heures, ou rarement des semaines, pour que l'équilibre thermodynamique soit atteint, ce n'est pas suffisant pour explorer l'espace des microétats accessibles en son entier. Pourquoi alors le résultat calculé avec une distribution de probabilités sur cet espace est-il identique au résultat observé ?

Le principe des sondages et la méthode Monte-Carlo[modifier | modifier le wikicode]

Le principe des sondages peut expliquer l'égalité entre les grandeurs thermodynamiques réellement mesurées et les grandeurs calculées avec des ensembles statistiques qui n'ont aucune réalité physique. Une moyenne calculée sur un échantillon représentatif peut être une excellente approximation de la moyenne calculée sur l'ensemble tout entier, pourvu que l'échantillon soit suffisamment nombreux et vraiment représentatif. Lors d'une mesure thermodynamique, le système n'explore qu'une petite partie de son espace de microétats accessibles, mais elle peut être suffisamment grande et représentative pour que la grandeur mesurée soit identique à celle qui a été calculée avec un ensemble statistique.

Une mesure thermodynamique ressemble à la méthode Monte-Carlo. Pour évaluer une moyenne on la calcule à partir d'un échantillon choisi au hasard. Les théoriciens se servent des générateurs pseudo-aléatoires des ordinateurs pour choisir leurs échantillons. Les expérimentateurs font confiance à la Nature. Elle est comme un générateur aléatoire qui choisit à chaque observation un échantillon représentatif qui confirme nos prédictions théoriques. La méthode Monte-Carlo est plus proche de la réalité physique que les ensembles statistiques qu'elle sert à étudier. Quand on fait une mesure thermodynamique la Nature elle-même applique la méthode Monte-Carlo avant de nous fournir le résultat.

Qu'une moyenne temporelle brève soit représentative de l'espace de tous les micro-états accessibles n'est a priori pas du tout évident, et même plutôt exclu, parce qu'on observe seulement une petite partie de la trajectoire du système et qu'elle peut être très différente des autres parties. Comment se fait-il que la Nature soit un générateur aléatoire fiable qui nous donne des échantillons vraiment représentatifs des moyennes de très long terme ?

La décohérence quantique[modifier | modifier le wikicode]

Les lois thermodynamiques doivent être justifiées à partir de la physique quantique, comme toutes les autres lois physiques, parce que la théorie quantique est la physique la plus fondamentale. On peut alors se demander si les probabilités des ensembles statistiques peuvent être interprétées comme des probabilités quantiques. La théorie de la décohérence le suggère. Si on observe un système qui interagit avec un environnement qu'on n'observe pas, on doit le décrire avec un opérateur densité qui définit une distribution de probabilités sur les états du système. Même si l'état initial est précisément déterminé, l'évolution ultérieure est décrite par une distribution de probabilités. Cet effet de décohérence peut être très rapide. Mais les distributions de probabilités obtenues par décohérence ne sont pas en général les distributions des ensembles statistiques de la thermodynamique. La décohérence à elle-seule ne suffit pas pour résoudre le problème des moyennes de court-terme, mais elle peut aider à le résoudre, parce qu'elle est un effet très rapide, très puissant et très général qui introduit beaucoup de hasard dans l'évolution des systèmes physiques.

L'entropie microscopique[modifier | modifier le wikicode]

Les distributions de probabilités calculées par la physique statistique (Maxwell-Boltzmann, Fermi-Dirac, Bose-Einstein) déterminent les probabilités des états des constituants microscopiques d'un système thermodynamique. Ces probabilités, qui déterminent les vitesses d'une molécule dans un gaz, ou des nombres d'occupation d'états quantiques, permettent de définir une entropie microscopique, c'est à dire une entropie par molécule, ou par état quantique d'une particule. L'entropie du système tout entier est la somme des entropies microscopiques de ses constituants pourvu qu'ils soient statistiquement indépendants (cf. complément). Pour tenir compte de l'indiscernabilité des particules il faut raisonner sur les nombres d'occupation des états quantiques.

La réalité de l'entropie microscopique n'est pas incompatible avec la brièveté des observations parce que l'espace des états accessibles d'un constituant microscopique est petit. Cela suffit pour justifier la réalité de l'entropie microscopique et à partir de là l'entropie macroscopique aussi. Mais pour cela on a besoin de justifier l'indépendance statistique des constituants microscopiques.

L'indépendance des constituants microscopiques[modifier | modifier le wikicode]

Les constituants microscopiques d'un système en équilibre thermodynamique ne peuvent pas être parfaitement indépendants. Pour qu'ils le soient il faudrait qu'ils n'interagissent pas du tout les uns avec les autres. Mais s'ils n'interagissent pas, ils ne peuvent pas échanger d'énergie et l'équilibre thermique est alors exclu.

Pour qu'un équilibre thermodynamique puisse s'établir, il suffit de supposer que les constituants interagissent faiblement les uns avec les autres d'une façon très diversifiée, c'est à dire que chaque constituant interagit faiblement avec un grand nombre d'autres constituants. Par exemple une molécule d'un gaz est couplée à toutes les autres, à cause des collisions, mais c'est un couplage faible parce que la probabilité d'une collision particulière est très petite.

Un constituant microscopique ne peut avoir à lui tout seul qu'un très faible effet sur son environnement, parce qu'il est tout petit par rapport à lui. Si en outre cet effet est dilué sur de nombreuses autres parties, la possibilité d'une réaction de l'environnement à l'effet de ce constituant est négligeable. Tout se passe comme si l'environnement restait statistiquement toujours presque le même, quel que soit l'état du constituant microscopique. L'état d'un constituant est donc statistiquement presque indépendant de l'état de son environnement. Comme cela est vrai pour tous les constituants microscopiques faiblement couplés, ils sont tous presque indépendants les uns des autres. On peut en conclure que l'entropie macroscopique est le somme des entropies microscopiques.

Pour justifier la réalité de l'entropie statistique, la théorie ergodique ne suffit pas, il faut surtout prouver la quasi-indépendance statistique des constituants microscopiques.

Manque d'information, laisser-faire et équilibre[modifier | modifier le wikicode]

Le manque d'information sur l'état réel d'un système thermodynamique ne vient pas de la paresse ou de l'incompétence de l'observateur mais de la nature des phénomènes observés. Les expériences thermodynamiques laissent les systèmes observés atteindre ou s'approcher d'un équilibre. On ne contrôle qu'un petit nombre de grandeurs macroscopiques et on laisse l'équilibre s'établir en ignorant les microétats. Si on essayait de les connaître plus précisément, on pourrait empêcher le système de s'approcher de l'équilibre et on ne pourrait pas observer justement ce qu'on veut observer, l'équilibre ou la proximité de l'équilibre. Laisser le système vagabonder au hasard dans son espace de microétats est une condition nécessaire pour qu'on puisse observer un équilibre thermodynamique. Paradoxalement, l'ignorance des microétats, qui est une propriété subjective de l'observateur, est une condition nécessaire pour qu'un équilibre thermodynamique, un événement réel, objectif, puisse se produire. C'est pourquoi l'entropie, qui mesure un manque d'information, est une propriété matérielle objective. Elle est le manque d'information qui rend possible l'équilibre thermodynamique réellement observé.

La différence entre l'entropie thermodynamique et l'entropie d'accessibilité[modifier | modifier le wikicode]

Un verre est un liquide figé. Plus précisément, c'est un liquide dont la viscosité est tellement élevée qu'on ne peut pas observer son écoulement, sauf sur des durées très longues, des jours, des siècles ou davantage. On peut donc le considérer comme un solide mais sa structure microscopique est aussi désordonnée que celle d'un liquide.

Lors de la transition liquide-verre, la variation de l'entropie thermodynamique est continue, donc l'entropie thermodynamique d'un verre est égale à celle du liquide à la même température. Mais l'entropie d'accessibilité est beaucoup plus petite, parce que le verre est bloqué dans une configuration particulière tandis que le liquide peut explorer toutes les configurations compatibles avec les contraintes macroscopiques.

L'existence des verres prouve donc que l'entropie thermodynamique est l'entropie des contraintes et non l'entropie d'accessibilité si elles sont différentes. L'entropie thermodynamique est donc une sorte d'entropie d'information. C'est l'entropie d'information d'un observateur qui est informé des contraintes.

L'entropie de température nulle est la différence entre l'entropie des contraintes et l'entropie d'accessibilité à . Plus exactement elle est la limite de cette différence quand tend vers zéro. Les matériaux qui ont une entropie de température nulle sont des solides désordonnés tels que les verres. L'entropie de température nulle est égale à est le nombre de microétats compatibles avec les contraintes macroscopiques.

Qu'il faille compter des microétats qui ne sont pas visités par un système thermodynamique est a priori surprenant. Le manque d'information sur la configuration microscopique d'un solide désordonné dépend de l'observateur. Si nous observons les détails microscopiques d'une configuration, nous réduisons ce manque d'information. On est donc tenté d'affirmer que l'entropie thermodynamique devrait être l'entropie d'accessibilité et non l'entropie des contraintes si elle doit être une grandeur réelle. Mais il faudrait alors renoncer à la loi de non-décroissance de l'entropie puisque l'entropie d'accessibilité est réduite spontanément lors de la transition liquide-verre.

Pourquoi faut-il tenir compte de microétats qui ne sont pas visités par un système pour calculer correctement son entropie thermodynamique ?

Comme l'entropie mesure le manque d'information sur les microétats d'un système on est tenté de conclure que l'observation des détails microscopiques d'un solide désordonné devrait réduire son entropie. Mais alors l'entropie thermodynamique ne pourrait pas être une grandeur réelle, mesurable, la même pour tous les observateurs, elle ne serait rien d'autre qu'une entropie d'information arbitraire. Pourquoi alors l'entropie thermodynamique est-elle vraiment une grandeur réelle ?

Les deux problèmes ci-dessus sont étroitement liés. Pour les résoudre il faut comprendre que l'information peut être utilisée comme un carburant et que la thermodynamique nous demande de raisonner sur l'entropie d'information.

L'information comme carburant[modifier | modifier le wikicode]

Le démon de Maxwell[modifier | modifier le wikicode]

Un démon de Maxwell montre que l'information peut être transformée en travail :

Considérons un gaz dans un récipient. On place une cloison en son milieu. Elle est munie d'une petite porte commandée par un dispositif qui détecte la vitesse des molécules incidentes. Il ouvre la porte seulement si une molécule qui vient de la gauche va plus vite que la moyenne ou si une molécule qui vient de la droite va moins vite que la moyenne. De cette façon le compartiment de droite est réchauffé tandis que celui de gauche est refroidi (Maxwell 1871). On peut se servir de cette différence de température pour faire fonctionner un moteur thermique.

Le dispositif d'ouverture de porte est un démon de Maxwell. Il acquiert de l'information qui peut être ensuite transformée en travail. L'information est donc une sorte de carburant.

Maxwell a inventé son "démon" pour montrer que la loi de non-décroissance de l'entropie est seulement une vérité statistique qui pourrait être transgressée si on était capable de modifier les équilibres statistiques des constituants microscopiques. En son temps, l'existence des atomes et des molécules était encore très hypothétique. Envisager la possibilité de les manipuler était donc hors de question. Mais dès que les constituants microscopiques de la matière furent mieux connus, la possibilité d'un dispositif mécanique qui fonctionne comme un démon de Maxwell pouvait être prise au sérieux.

À ce jour nos capacités d'observation et de manipulation des constituants microscopiques ne permettent pas de réaliser le dispositif imaginé par Maxwell, mais la microscopie à effet tunnel permet d'observer et de manipuler les atomes. On peut alors imaginer un dispositif qui permet de récupérer du travail après avoir réduit l'entropie du système observé, donc une sorte de démon de Maxwell en principe réalisable :

Considérons un cristal qui peut accueillir des atomes en surface. On suppose qu'initialement atomes sont répartis aléatoirement sur sites et que la température est suffisamment faible pour qu'ils y restent. C'est donc un désordre figé. On commence par observer la configuration exacte des atomes de surface, ce qu'on peut faire avec un microscope à effet tunnel, puis on les déplace et on les rassemble avec le même microscope sur une fraction de la surface. L'activité du microscope ressemble à un travail de compression isotherme sur un gaz, sauf que ce n'est pas un gaz mais un désordre figé en surface.

Initialement le nombre de configurations possibles est égal au nombre de façons de placer atomes sur sites. Le désordre figé des atomes en surface apporte donc une contribution à l'entropie thermodynamique du cristal :

où on s'est servi de l'approximation de Stirling :

Après avoir ordonné tous les atomes .

La loi de non-décroissance de l'entropie semble donc transgressée, comme Maxwell l'avait prédit, parce qu'on peut manipuler les atomes.

Le déplacement des atomes ne requiert en principe aucun travail parce que le travail d'arrachage d'un atome peut être récupéré lors de la redéposition. Mais comme un microscope à effet tunnel consomme de l'énergie et dissipe de la chaleur, il ne diminue pas l'entropie thermodynamique totale. Cette objection est discutée plus loin.

Quantité d'information et travail[modifier | modifier le wikicode]

Pour convertir en travail la réduction de l'entropie thermodynamique du cristal on met sa surface en contact avec un récipient vide de volume dont les autres parois ne peuvent pas accueillir les atomes. On divise ce récipient avec une paroi mobile en deux parties à gauche et à droite dont les volumes sont respectivement et . On chauffe le cristal pour vaporiser les atomes dans le volume . On laisse ensuite le gaz obtenu se détendre de façon isotherme dans la totalité du récipient, ce qui fournit un travail . On refroidit ensuite le cristal pour laisser les atomes se redéposer à la surface du cristal. Si on procède de façon réversible, avec une succession de bains thermiques, la chaleur fournie lors du chauffage par chaque bain thermique utilisé est exactement égale à la chaleur qu'il récupère lors du refroidissement, parce que la chaleur spécifique à volume constant d'un gaz ne dépend pas de son volume. Le cristal et les bains thermiques qui ont servi à la réchauffer sont donc revenus à leur état initial.

On a supposé qu'une paroi absorbante pouvait faire un vide parfait dans un volume arbitrairement grand. Une telle paroi ne peut pas exister sinon on pourrait faire un mouvement perpétuel de deuxième espèce : on place la paroi chargée d'atomes au contact d'un récipient vide, on la chauffe jusqu'à une température suffisamment chaude pour que tous les atomes soient vaporisés. On laisse alors le gaz se détendre de façon isotherme pour fournir du travail. On refroidit ensuite le gaz à une température suffisamment froide pour que tous les atomes se redéposent sur la paroi absorbante. Si on procède de façon réversible la chaleur fournie lors du chauffage par chaque bain thermique utilisé est exactement égale à la chaleur qu'il récupère lors du refroidissement. On pourrait donc revenir à l'état initial après avoir fourni du travail en n'extrayant la chaleur que d'un seul bain thermique.

Pour faire un calcul exact et compatible avec les lois de la thermodynamique il faut donc tenir compte de la densité d'équilibre d'un gaz au contact d'une paroi absorbante. Cette densité ne peut pas être nulle, mais elle peut être très petite, a priori aussi petite qu'on le veut si la paroi est suffisamment absorbante. Cela suffit pour justifier le calcul ci-dessus où elle est négligée.

Supposons que . Alors

Si en outre , on obtient

Or est égale à la réduction d'entropie d'information qu'on obtient lorsqu'on observe les positions de tous les atomes de surface. On obtient ainsi un exemple du théorème suivant :

Si l'entropie d'information est plus petite que l'entropie thermodynamique, alors la différence multipliée par la température mesure le maximum de la quantité de travail que le système peut fournir lorsqu'il ne peut recevoir de chaleur que d'un bain thermique à la température .

Ce théorème a été établi pour la première fois par Szilard en 1929. Mais son modèle est très irréaliste parce qu'il postule qu'une seule molécule peut pousser un piston comme si elle était un gaz ordinaire.

Pourquoi un démon de Maxwell ne peut-il pas réduire l'entropie totale ?[modifier | modifier le wikicode]

Pour que l'existence d'un démon de Maxwell soit compatible avec les lois de la thermodynamique il faut que l'une au moins des conditions suivantes soit satisfaite :

  1. Le fonctionnement du dispositif ne réduit pas l'entropie du système observé parce qu'il l'augmente avant de la diminuer.
  2. Le fonctionnement du dispositif augmente l'entropie de l'environnement.
  3. Le fonctionnement du dispositif augmente sa propre entropie.

Maxwell supposait que son démon devait voir les molécules. Mais pour les voir il faut éclairer le gaz et donc le réchauffer. Un tel réchauffement fait augmenter l'entropie du gaz et on peut s'attendre à ce que cette augmentation soit supérieure à la diminution provoquée par l'établissement d'une différence de température. Dans ce cas c'est la condition 1 qui empêche la réduction de l'entropie totale.

La microscopie à effet tunnel ne requiert pas d'éclairage et permet vraiment de diminuer l'entropie du système observé. Mais elle consomme de l'énergie et cède de la chaleur à l'environnement. On est tenté de conclure que l'acquisition d'information microscopique empêche un démon de Maxwell de réduire l'entropie totale parce qu'elle a un coût énergétique. Mais l'acquisition d'information n'a pas nécessairement un coût énergétique. Si le système complet constitué d'un détecteur et d'un système observé est parfaitement isolé de son environnement, cela n'empêche pas le détecteur d'acquérir de l'information. Lors d'une mesure quantique idéale par exemple, le système complet est isolé. Si le système observé est dans un état propre de la mesure, et s'il y a n tels états initiaux possibles, il y a également n états finaux possibles du détecteur, et le système observé n'est pas perturbé. Initialement, il y a n états initiaux possibles du système complet, parce que le détecteur est dans un unique microétat. Finalement il y a également n états finaux possibles du système complet parce que le système observé et le détecteur sont parfaitement corrélés. L'information est donc acquise sans augmenter l'entropie du système complet.

La physique n'interdit donc pas l'existence d'un système capable de détecter les atomes sans coût énergétique.

Faut-il conclure qu'un démon de Maxwell peut réduire l'entropie totale ?

Un dispositif qui acquiert de l'information doit la mettre en mémoire pour pouvoir l'utiliser. Si on observe un désordre figé, le dispositif d'enregistrement de l'information reproduit dans sa propre mémoire le désordre figé observé. Par exemple des atomes à la surface d'un cristal peuvent servir à enregistrer de l'information. Un atome peut enregistrer un bit d'information s'il a deux positions possibles. 0 est mémorisé par l'atome à gauche par exemple et 1 par l'atome à droite. Si initalement tous les atomes de la mémoire sont bien rangés, tous à gauche ou tous à droite, ils ne le sont plus après l'observation d'un désordre figé. L'entropie de la mémoire a donc augmenté.

Affirmer que l'entropie d'une mémoire augmente lorsqu'elle enregistre des informations est très paradoxal. Pour un observateur qui enregistre des informations, l'entropie de sa mémoire n'augmente pas, parce qu'il n'ignore pas dans quel état est sa mémoire. C'est seulement pour un observateur extérieur, qui ne sait pas quelles informations ont été enregistrées, que l'entropie d'information de la mémoire non-observée augmente.

Pour résoudre le problème il faut comprendre que la remise à zéro d'une mémoire requiert en général de l'énergie. Pour le prouver on a d'abord besoin de la loi de conservation de l'entropie d'information d'un système isolé.

La conservation de l'entropie d'information d'un système isolé[modifier | modifier le wikicode]

Si un système est isolé, son évolution spontanée conserve l'entropie d'information d'un observateur extérieur, c'est à dire que le nombre de microétats compatibles avec les informations d'un observateur extérieur ne change pas.

Cette loi est une conséquence du déterminisme hamiltonien de l'évolution d'un système isolé : des microétats distincts à un instant initial évoluent vers des microétats distincts à un instant ultérieur.

Si on calcule l'entropie d'information non avec le nombre de microétats mais avec une distribution de probabilités sur les microétats, la loi de conservation de l'entropie d'information d'un système isolé demeure parce que la distribution de probabilités sur les microétats finaux est la même que celle des états initiaux.

Lorsqu'un observateur acquiert des informations en observant un système, son entropie d'information peut diminuer mais le système observé n'est pas isolé.

Comme l'entropie thermodynamique est une sorte d'entropie d'information, la loi de conservation de l'entropie d'information d'un système isolé vaut aussi pour l'entropie thermodynamique. Comment alors se fait-il que l'entropie thermodynamique d'un système isolé puisse augmenter ?

Pourquoi l'entropie peut-elle augmenter ?[modifier | modifier le wikicode]

L'entropie thermodynamique et plus généralement l'entropie d'information d'un système parfaitement isolé ne peuvent pas augmenter parce que sa dynamique est hamiltonienne. Un système dont l'entropie augmente ne peut donc pas être parfaitement isolé. Lorsqu'on raisonne en thermodynamique sur un système isolé dont l'entropie augmente, on veut seulement dire qu'il est quasi-isolé, c'est à dire que l'énergie échangée avec son environnement peut être négligée par rapport à son énergie interne. Les perturbations de l'environnement introduisent du hasard dans l'évolution du système. Elle suffisent pour que sa dynamique ne soit pas hamiltonienne mais stochastique (Diu, Guthmann, Lederer, Roulet 1989).

Les calculs irréversibles réduisent-ils toujours l'entropie thermodynamique d'un ordinateur ?[modifier | modifier le wikicode]

Le raisonnement suivant suggère que les calculs irréversibles réduisent toujours l'entropie thermodynamique d'un ordinateur :

Lorsqu'un calcul est réversible, le nombre d'états finaux possibles est égal au nombre d'états initiaux possibles. Si le calcul est irréversible le nombre d'états finaux possibles est plus petit que le nombre d'états initiaux possibles. Un calcul irréversible permet donc de réduire le nombre d'états compatibles avec l'information disponible, et donc de réduire l'entropie d'information d'un ordinateur du point de vue d'un observateur extérieur qui n'est pas informé sur l'état de sa mémoire.

L'entropie d'information d'un système isolé ne peut pas décroître. Si l'observateur n'acquiert pas d'informations sur le système au cours de son évolution, l'entropie d'information ne peut décroître que si l'entropie thermodynamique décroît également. La thermodynamique impose qu'une telle réduction est accompagnée d'une augmentation d'entropie thermodynamique de l'environnement. Si l'entropie de l'environnement augmente parce qu'il absorbe de la chaleur, c'est qu'il a fallu fournir de l'énergie à l'ordinateur. On est ainsi conduit à une formule paradoxale : il faut travailler pour oublier. Plus précisément, il faut dépenser de l'énergie pour perdre des informations (Landauer 1961).

Mais il y a une faille dans le raisonnement précédent. On peut représenter un bit par l'état d'un gaz dans un récipient muni d'une paroi intérieure amovible. 0 est représenté par le gaz enfermé dans la partie gauche, 1 par le gaz également réparti à gauche et à droite. Retirer la paroi puis la remettre en place permet de faire un calcul irréversible :

Un calcul irréversible ne réduit donc pas forcément l'entropie thermodynamique d'un ordinateur.

Il suffit de se donner une condition supplémentaire pour prouver qu'un calcul irréversible réduit toujours l'entropie thermodynamique d'un ordinateur : les espaces de microétats qui font exister matériellement les divers états de la mémoire de l'ordinateur doivent être disjoints.

Le démon de Maxwell et l'impossibilité du mouvement perpétuel de deuxième espèce[modifier | modifier le wikicode]

Pour un observateur extérieur qui n'est pas informé des observations faites par le démon, la diminution de l'entropie thermodynamique du système sur lequel le démon agit est compensée par l'augmentation de l'entropie d'information du démon. C'est pourquoi le démon ne réduit pas l'entropie totale.

Pour qu'un démon de Maxwell fasse un mouvement perpétuel, il faut qu'il réinitialise sa mémoire au commencement de chaque cycle afin de faire de la place pour enregistrer les informations sur le système qu'il observe. Mais la remise à zéro d'une mémoire est un calcul irréversible qui réduit son entropie thermodynamique. Cette réduction doit être compensée par une augmentation d'entropie thermodynamique de l'environnement. Si le démon réduit sa propre entropie en chauffant l'environnement, il faut lui fournir de l'énergie pour compenser cette perte de chaleur. C'est donc la remise à zéro de la mémoire du démon de Maxwell qui est la source ultime de l'impossibilité du mouvement perpétuel de deuxième espèce (Bennett 1982).

La mémoire du démon peut être remise à zéro sans dissipation de chaleur par un observateur qui la manipule de l'extérieur, mais alors il faut tenir compte de la mémoire de l'observateur qui elle aussi doit être remise à zéro pour commencer un nouveau cycle.

Si la mémoire du démon peut être remise à zéro sans réduire sa propre entropie thermodynamique, parce que les espaces de microétats qui réalisent les états de mémoire ne sont pas disjoints, c'est que l'enregistrement des observations requiert une réduction d'entropie thermodynamique, qui doit être compensée par une augmentation ailleurs.

Dans tous les cas un démon de Maxwell ne peut pas faire un mouvement perpétuel de deuxième espèce.

La thermodynamique est une physique de l'observation[modifier | modifier le wikicode]

Pour comprendre la thermodynamique, il faut raisonner sur les trois formes d'entropie statistique, l'entropie d'accessibilité parce qu'elle explique pourquoi un système quasi-isolé évolue vers l'équilibre en augmentant son entropie, l'entropie des contraintes parce qu'elle est l'entropie thermodynamique mesurée par les expérimentateurs, et l'entropie d'information parce qu'elle permet d'expliquer pourquoi un démon de Maxwell ne peut pas faire un mouvement perpétuel de seconde espèce.

L'entropie thermodynamique est une sorte d'entropie d'information, parce que c'est l'observateur qui est informé des contraintes macroscopiques qui déterminent un équilibre thermodynamique, mais cela ne l'empêche pas d'être une grandeur réelle, parce que les contraintes macroscopiques imposées par un observateur existent réellement.

La thermodynamique ne nous invite pas seulement à raisonner sur les propriétés de la matière, elle nous invite également à raisonner sur le rôle des observations. Mais c'est toujours de la physique, parce que les observateurs sont réels eux aussi.

Compléments[modifier | modifier le wikicode]

Le mouvement perpétuel de seconde espèce[modifier | modifier le wikicode]

Une machine qui pourrait élever un poids ou faire avancer une voiture sans qu'on lui fournisse de l'énergie pourrait réaliser un mouvement perpétuel de première espèce. La loi de conservation de l'énergie, la première loi de la thermodynamique, interdit l'existence d'une telle machine. C'est une des lois les plus fondamentales de la physique. Tous les physiciens auraient tout faux si on pouvait inventer une semblable machine, mais personne ne l'a jamais inventée.

Le mouvement perpétuel de seconde espèce ne contredit pas la loi de de conservation de l'énergie. N'importe quel corps peut céder de l'energie s'il est refroidi, sauf s'il est à température nulle, égale à 0 Kelvin = -273.15 °Celsius = −459.67 °Fahrenheit. On peut donc imaginer une voiture, un bateau ou un avion qui pourrait avancer sans consommer de carburant. Il lui suffirait d'absorber de l'air ou de l'eau à la température ambiante et de la rejeter à une température plus froide. La différence d'énergie servirait à faire tourner le moteur.

Pour qu'un tel moteur puisse fonctionner il faudrait pouvoir séparer un corps dont la température est uniforme en deux parties, l'une plus chaude, l'autre plus froide. Mais c'est interdit par la seconde loi de la thermodynamique parce que cela réduirait l'entropie totale. L'impossibilité du mouvement perpétuel de seconde espèce résulte donc de la loi de non-décroissance de l'entropie totale, la seconde loi de la thermodynamique.

Croissance de l'entropie d'accessibilité et distribution microcanonique[modifier | modifier le wikicode]

Les sont tous les états accessibles d'un système presque isolé, c'est à dire que les perturbations par l'environnement ne modifient pas ou presque pas l'énergie du système. est la probabilités de transition par unité de temps de l'état à l'état . On suppose que toutes les évolutions microscopiques sont réversibles :

pour tout et tout .

est la probabilité de l'état à l'instant . Par définition des , on a :

parce que

Alors

Or

Donc

et sont de même signe et les sont toujours positifs, donc :

Paradoxalement l'hypothèse de réversibilité microscopique, , conduit à une loi d'irréversibilité des processus macroscopiques, puisque l'entropie d'un système quasi-isolé ne peut jamais diminuer.

La distribution microcanonique est une distribution d'équilibre :

parce que pour tout et tout .

C'est la seule distribution d'équilibre, parce que si les ne sont pas toutes égales, il y en a au moins une plus petite que les autres. Parmi tous les états tels que , il y en a au moins un pour lequel pour un tel que , sinon ils ne seraient pas accessibles. Alors

et la distribution n'est pas à l'équilibre.

La réalité de la croissance de l'entropie d'accessibilité[modifier | modifier le wikicode]

Le théorème de croissance de l'entropie d'accessibilité est prouvé d'une façon mathématiquement rigoureuse pour un ensemble statistique qui n'a pas d'existence réelle. définit la probabilité d'occupation de l'état à l'instant pour tous les systèmes d'un immense ensemble imaginé par les théoriciens. Elle décrit l'évolution de cet immense ensemble, pas l'évolution d'un système physique réel. Mais sous des conditions très générales, on peut interpréter les comme des probabilités vraiment mesurables, et comparer ainsi leur évolution aux quantités observées.

On suppose que l'évolution macroscopique du système est lente par rapport aux fluctuations microscopiques. L'environnement de chaque constituant microscopique est alors presque constant sur une durée suffisante pour qu'il explore son espace d'états et définisse ainsi des probabilités d'occupation de ces états. Pour chaque constituant microscopique on peut donc définir des probabilités d'occupation de ses états et en principe les mesurer. Si on suppose que tous les constituants microscopiques sont statistiquement indépendants, ces suffisent pour définir les probabilités de tous les états du système macroscopique.

Désordre figé et décroissance spontanée de l'entropie d'accessibilité[modifier | modifier le wikicode]

Lors de la transition liquide-verre, l'entropie d'accessibilité totale du liquide et du bain thermique qui le refroidit diminue. La diminution d'entropie d'accessibilité du verre n'est pas compensée par l'augmentation d'entropie d'accessibilité du bain thermique. Il semble donc que le théorème de croissance de l'entropie d'accessibilité est transgressé, alors qu'il est prouvé rigoureusement sous des conditions très générales. Mais lorsque le verre s'est figé dans un configuration désordonnée, les autres configurations restent théoriquement accessibles. Il y a une probabilité négligeable mais non-nulle que le bain thermique cède brièvement une partie de sa chaleur qui permettrait au verre d'être à nouveau liquide puis de redevenir verre dans une autre configuration désordonnée. Toutes les configurations sont donc en principe toujours accessibles, mais en pratique le verre reste figé dans une seule. Le théorème de croissance de l'entropie d'accessibilité considère que l'espace des états accessibles ne change pas. Il ignore la possibilité que des microétats deviennent en pratique inaccessibles.

L'entropie est une grandeur extensive lorsque les parties sont statistiquement indépendantes[modifier | modifier le wikicode]

L'entropie d'une somme est la somme des entropies des parties lorsqu'elles sont indépendantes :

Soient et deux parties indépendantes du système . Les et les sont les états accessibles de et respectivement.

Les entropies de et sont :

Les états accessibles de sont tous les états pour tous les et tous les . Si et sont indépendantes la probabilité de est et l'entropie de est :

La machine de Szilard[modifier | modifier le wikicode]

Pour mieux comprendre la transformation d'information en travail, Szilard (1929) nous a invité à raisonner sur une machine qui fonctionne avec un "gaz" à une molécule :

Une molécule est enfermée dans un récipient qui peut être séparé par une paroi amovible et mobile. Lorsque la paroi est mise en place au milieu du récipient on détecte la présence de la molécule dans l'un ou l'autre des compartiments séparés. On a donc acquis un bit d'information. On se sert alors de la paroi comme d'un piston sur lequel la molécule peut exercer un travail. Il faut savoir où est la molécule pour savoir dans quel sens de déplacement du piston un travail peut être récupéré. De cette façon on calcule que dans des conditions optimales un bit d'information permet de récupérer un travail égal à . C'est le travail effectué par une molécule sur un piston lors d'une détente isotherme à la température qui double le volume accessible.

La machine de Szilard semble en contradiction avec la thermodynamique parce qu'il suggère qu'on pourrait faire un mouvement perpétuel de seconde espèce. Si le piston ne peut se déplacer que dans un sens, il n'est pas nécessaire de connaître la position de la molécule pour récupérer du travail. Une fois sur deux le piston reste immobile parce que la molécule est du mauvais côté du piston, et on ne récupére aucun travail, mais une fois sur deux il se déplace et on récupére un travail égal à . En répétant de nombreuses fois l'expérience on pourrait ainsi obtenir une quantité arbitraire de travail sans en dépenser pour connaître la position de la molécule.

Mais un tel procédé requiert un dispositif qui retire le piston et le remet en place. Or il y a deux positions possibles du piston à la fin d'un cycle, soit au milieu s'il n'a pas bougé, soit à une extrémité, s'il a bougé. Le dispositif doit donc acquérir un bit d'information à la fin de chaque cycle. Pour revenir à son état initial, il doit effacer cette information. Le coût d'effacement d'une information est donc là aussi à l'origine de l'impossibilité du mouvement perpétuel de seconde espèce (Leff & Rex 1990).

La machine de Szilard confirme que l'entropie d'accessibilité peut être différente de l'entropie thermodynamique : lorsqu'on introduit une paroi au milieu du gaz à une molécule, on réduit l'entropie d'accessibilité de . En revanche on ne réduit pas l'entropie thermodynamique puisque le gaz ne cède pas de chaleur. Pour la machine de Szilard, l'entropie d'accessibilité peut être réduite en principe autant qu'on le veut. Il suffit de placer plusieurs parois à l'intérieur du récipient.

Pourquoi l'entropie de l'Univers augmente-t-elle ?[modifier | modifier le wikicode]

La loi de croissance de l'entropie suggère que l'entropie de l'Univers ne peut qu'augmenter, qu'il a commencé dans un macroétat de basse entropie, chaud mais très condensé, et que son expansion lui a permis de se refroidir tout en augmentant son entropie. Mais cette affirmation se heurte à deux difficultés :

  • Comme l'Univers est parfaitement isolé son entropie, si on on pouvait la définir, devrait être conservée.
  • Il n'y a pas vraiment de sens à parler du macroétat de l'Univers, parce qu'il n'y a pas de sens à parler de l'espace de ses microétats possibles. Il est dans un seul microétat, qu'on appelle parfois la fonction d'onde de l'Univers.

Mais il y a quand même du sens à dire que l'entropie de l'Univers augmente. On peut attribuer une entropie à ses diverses parties (étoiles, planètes, trous noirs, milieu interstellaire...) et constater que la somme de toutes ses entropies augmente. Mais quand on procède ainsi, on suppose que les parties sont statistiquement indépendantes, on ignore leurs corrélations. Or l'ignorance des corrélations conduit à surévaluer l'entropie totale. Si on connaissait le microétat de l'Univers, on connaîtrait aussi toutes les corrélations entre ses parties et on constaterait que l'entropie totale n'augmente pas. Elle resterait toujours égale à zéro. Mais connaître le microétat de l'Univers est évidemment impossible.

Références[modifier | modifier le wikicode]

Bennett, Charles H., The thermodynamics of computation - a review (Int. J. Theor. Phys. 21, 905-40, 1982, reproduit dans Leff & Rex 1990)

Diu, Bernard, Guthmann, Claudine, Lederer, Danielle, Roulet, Bernard, Éléments de physique statistique (1989)

Feynman, Richard P., Leçons sur l'informatique (1996)

Landauer, Rolf W., Irreversibility and heat generation in the computing process (IBM J. Res. Dev. 5, 183-91, 1961, reproduit dans Leff & Rex 1990)

Leff, Harvey S., Rex, Andrew F., Maxwell's demon, entropy, information, computing (1990)

Maxwell, James Clerk, Theory of heat (1871)

Sethna, James P., Statistical mechanics : entropy, order parameters and complexity (2018)

Szilard, Leo, On the decrease of entropy in a thermodynamic system by the intervention of intelligent beings (Zeitschrift für Physik, 1929, 53, 840-856, traduit dans Leff & Rex 1990)


Chapitre suivant : La théorie quantique des destinées multiples >>>


La théorie quantique des destinées multiples

Un des principaux bénéfices de l'épistémologie est de libérer des préjugés sur la science. Nous ne savons pas d'avance si un savoir est un bon savoir. Il faut le laisser faire ses preuves, il faut le juger sur pièces. A priori n'importe quelle théorie peut prétendre au savoir. La science ne peut pas se développer dans l'intolérance. Si on veut être scientifique, il faut être disposé à accueillir toutes les propositions, même celles qui nous surprennent ou nous déplaisent. On juge à la fin, pas au début.

Prendre l'équation de Schrödinger au sérieux[modifier | modifier le wikicode]

Everett a proposé en 1957 une nouvelle interprétation de la physique quantique, qu'il a appelée la théorie de la fonction d'onde universelle. Il l'a aussi appelée la théorie des états quantiques relatifs. Mais en général elle est connue sous le nom d'interprétation des mondes multiples. Comme cette dénomination peut induire en erreur, elle est ici appelée la théorie quantique des destinées multiples.

Les arguments d'Everett sont souvent ignorés. On croit à tort que sa théorie rajoute des hypothèses sur la nature de l'espace-temps pour lui permettre de se diviser en de nombreuses branches. Rien n'est plus éloigné de sa pensée. La théorie d'Everett ne rajoute aucune hypothèse à la théorie quantique, ni sur l'espace-temps, ni sur quoi que ce soit d'autre. Elle fait le contraire, elle renonce à un principe très douteux, le principe de la réduction de la fonction d'onde.

Si on interprète à tort et à travers une belle théorie on peut la rendre incompréhensible et absurde. C'est ce qui est arrivé à la mécanique quantique et à l'équation de Schrödinger. Si on l'interprète à la façon de Bohr, Heisenberg et presque tout le monde, on en fait une théorie absurde parce que la réduction de la fonction d'onde contredit l'équation de Schrödinger. Cette équation affirme que toute évolution d'un système physique est unitaire alors que la réduction de la fonction d'onde est une évolution qui n'est pas unitaire. Le principe de la réduction de la fonction d'onde nous empêche donc de comprendre l'équation de Schrödinger.

Plus précisément on peut démontrer, à partir de l'équation de Schrödinger, qu'un processus d'observation conduit en général non à un unique résultat mais à une superposition de résultats. Autrement dit, la théorie affirme qu'à l'issue d'une observation la destinée d'un observateur se divise en autant de destinées qu'il y a de résultats possibles. C'est le théorème d'existence des destinées multiples, et c'est une conséquence très directe de l'équation de Schrödinger, dès qu'on l'applique aux processus d'observation.

L'arborescence des destinées multiples est une solution de l'équation de Schrödinger. Everett n'a pas inventé cette arborescence, il l'a trouvée en étudiant attentivement l'équation fondamentale de la physique quantique.

Le théorème d'existence des destinées multiples est empiriquement vérifiable[modifier | modifier le wikicode]

Contrairement à ce qui est souvent cru, on peut en principe vérifier par l'observation le théorème d'existence des destinées multiples. Un observateur ne peut pas observer ses autres destinées, parce qu'elles ne peuvent jamais se rencontrer, elles sont incomposables. Mais un second observateur peut en principe observer que le premier a plusieurs destinées, avec des expériences du type "chat de Schrödinger". De telles expériences ont déjà été faites, et elles confirment pleinement les prédictions quantiques, comme toutes les expériences jusqu'à présent, mais les systèmes étudiés sont trop petits pour être considérés comme de vrais observateurs dont on aurait observé les multiples destinées.

Dans l'expérience imaginée par Schrödinger, l'état paradoxal est produit, mais l'expérience n'est pas conçue pour qu'on puisse vérifier par l'observation qu'il a été effectivement produit, parce qu'on le détruit en ouvrant la boîte. Une expérience légèrement modifiée permet cependant d'observer qu'un état semblable à est réellement produit (Les expériences du type "chat de Schrödinger"). On peut donc en principe vérifier que deux destinées d'un observateur sont simultanément réelles.

Un seul espace-temps pour tous les mondes parallèles[modifier | modifier le wikicode]

Les mondes multiples sont des mondes relatifs aux destinées des observateurs. Chaque destinée d'un observateur a son monde à elle, qu'elle ne peut pas partager avec ses autres destinées, mais qu'elle peut partager avec d'autres observateurs, pourvu qu'elle puisse composer avec leurs destinées. Mais toutes ces destinées, et leurs mondes relatifs, se produisent dans un seul univers, un seul espace-temps. La théorie d'Everett n'est rien d'autre que la théorie quantique ordinaire, qu'on peut appliquer dans n'importe quel espace-temps, R4 ou un autre.

On croit parfois à tort que la théorie d'Everett requiert une nouvelle sorte d'espace-temps, parce que les mondes parallèles, relatifs aux diverses destinées d'un même observateur, ou à des destinées incomposables d'observateurs différents, sont conçus comme des mondes séparés. Tout ce qui se passe dans l'un ne peut pas affecter ce qui se passe dans l'autre. Pourquoi alors dire qu'ils sont dans le même espace-temps ? Deux êtres peuvent être dans le même lieu en même temps sans pouvoir se rencontrer, parce que leurs destinées sont incomposables. Pourquoi alors dire qu'ils sont dans le même lieu au même instant ?

Lorsque deux observateurs ont des destinées incomposables, il est toujours en principe possible qu'un troisième observateur ait une destinée composable avec les deux précédentes. Lorsque deux êtres sont dans un même lieu au même instant sans pouvoir se rencontrer, il est toujours possible qu'un troisième être puisse rencontrer l'un ou l'autre, de façon aléatoire, s'il se présente en ce lieu. Du point de vue du troisième, les deux premiers sont donc potentiellement présents dans le même lieu au même instant, même s'il ne peut pas les rencontrer tous les deux en même temps en ce lieu (La coprésence sans rencontre possible et l'espace-temps enchevêtré, dans Théorie quantique de l'observation).

Le même espace-temps abrite toutes les destinées de tous les observateurs, mais en général ces destinées ne peuvent pas se rencontrer, parce qu'elles sont incomposables. De ce qui se passe en un lieu, nous ne connaissons qu'un infime partie, seulement les êtres qui ont des destinées composables avec la nôtre, nous ne pouvons pas percevoir le reste, toutes les destinées incomposables avec la nôtre, en nombre incalculable, qui se produisent pourtant au même lieu, au même instant.

La théorie d'Everett est la théorie quantique unifiée[modifier | modifier le wikicode]

La théorie d'Everett applique les mêmes lois quantiques à tous les corps, microscopiques et macroscopiques, et à tous les processus, y compris les processus d'observation. Puisque la réunion de deux systèmes quantiques est un système quantique, tous les corps sont quantiques, qu'ils soient microscopiques ou macroscopiques. Les observations sont des processus physiques comme les autres. Elles mettent en jeu les mêmes interactions fondamentales et les mêmes corps que tous les autres processus physiques. Il n'y a donc pas de raison qu'elles obéissent à des lois spéciales, qui justifieraient le principe de la réduction de la fonction d'onde.

La théorie d'Everett est la seule théorie qui prend l'équation de Schrödinger vraiment au sérieux, même ses conséquences les plus étonnantes. A partir de là, elle justifie dans un cadre théorique unifié tous les résultats de la physique quantique, sans introduire d'hypothèses superflues, arbitraires ou contradictoires avec l'équation de Schrödinger. C'est plus que suffisant pour affirmer qu'elle est une théorie qui porte des fruits. Elle a fait ses preuves. Elle a montré très clairement qu'elle est une excellente théorie. De fait elle est la meilleure théorie physique qui existe aujourd'hui.

A l'opposé, le principe de la réduction de la fonction d'onde est parfaitement inutile. Il n'est requis par aucun des résultats, théoriques ou empiriques, de la physique quantique. Il ne sert à rien, sauf à rendre contradictoire la théorie. Il faut vraiment croire à la parabole du figuier stérile pour s'imaginer qu'un jour ce principe méritera sa place dans la science.


Une présentation accessible de la théorie d'Everett: Théorie quantique de l'observation


Chapitre suivant : L'origine et l'évolution de la vie et de l'esprit >>>


L'origine et l'évolution de la vie et de l'esprit

Adolph Hirémy-Hirschl - The Birth of Venus.jpg

La naissance de Vénus, Adolph Hirémy-Hirschl


L'évolution par la sélection naturelle[modifier | modifier le wikicode]

La théorie de l'évolution par la sélection naturelle repose sur trois principes :

  • Les êtres vivants transmettent à leur descendants des caractères héréditaires.
  • De petites différences entre les caractères transmis aux descendants et les caractères hérités des parents apparaissent de façon aléatoire.
  • Les êtres vivants sont en compétition pour l'accès aux ressources dont ils ont besoin pour vivre.

Ces trois principes suffisent pour expliquer l'évolution de toutes les formes de vie (Darwin 1859).

Chaque génération explore de nouvelles possibilités héréditaires un peu différentes des possibilités explorées à la génération précédente. Si un être vivant est doté de caractères héréditaires qui le favorisent dans la compétition avec ses semblables, il aura nécessairement une progéniture plus nombreuse qui sera elle aussi favorisée dans la lutte pour la vie. En revanche les caractères héréditaires défavorables sont peu transmis ou pas du tout, et les lignées qui les transmettent finissent par disparaître. La sélection naturelle met donc une pression sur l'évolution des formes de vie qui va dans le sens d'une augmentation du désir de vivre. Elle retient les caractères héréditaires qui aident le plus à vivre et laisse disparaître les autres.

La théorie de l'évolution par la sélection naturelle peut être appliquée à de nombreux domaines. On peut en principe s'en servir pour résoudre n'importe quel problème. Il suffit d'étudier des générations de possibilités de solutions. Chaque génération est obtenue à partir de la précédente en introduisant aléatoirement de petites variations et en sélectionnant celles qui répondent le mieux, ou le moins mal, au problème. C'est la méthode des algorithmes génétiques. Même l'apprentissage par l'essai, l'erreur et la réussite est très semblable à l'évolution par la sélection naturelle. On explore des possibilités. On élimine celles qui nous conduisent à l'erreur et on retient celles qui nous font réussir. On progresse ainsi en modifiant petit à petit ce qu'on apprend, en faisant évoluer ce qui nous aide à vivre et en renonçant au reste.

Les molécules de l'hérédité[modifier | modifier le wikicode]

Darwin et ses successeurs n'expliquaient pas l'existence de l'hérédité, pourquoi les chiens ne font pas des chats, ils ne pouvaient que la constater. On postulait l'existence de gènes, mystérieusement transmis par les parents à leur progéniture, pour rendre compte des observations, mais on ne savait pas ce qu'ils étaient, ni comment ils pouvaient déterminer les caractères transmis.

Les gènes sont principalement des molécules d'ADN (Avery, MacLeod et McCarty 1944, Watson et Crick 1953). Les parents les transmettent à leurs descendants en les déposant dans leurs œufs. Mais comment des molécules peuvent-elles porter des caractères héréditaires ?

Une molécule d'ADN est comme un plan de construction d'autres molécules, des ARN et des protéines. Les protéines sont à la fois des constituants de tous les organes, et des outils qui permettent de construire toutes les autres molécules que les êtres vivants doivent produire pour survivre, croître et se reproduire. Une molécule d'ADN est en outre autorépliquante, c'est à dire qu'elle peut servir de plan pour construire une réplique exacte d'elle-même. Les molécules d'ADN permettent donc de construire toutes les molécules que les êtres vivants doivent produire. Pour comprendre comment elles déterminent les caractères héréditaires, il faut comprendre comment les protéines déterminent le développement des organes et les comportements.

La génération spontanée de la vie dans l'océan primitif[modifier | modifier le wikicode]

La théorie de la sélection naturelle explique comment la vie peut évoluer à partir de formes de vie primitives. Mais d'où viennent ces formes de vie ?

La réponse la plus vraisemblable est que la vie est apparue spontanément dans l'océan primitif.

Les réseaux autocatalytiques[modifier | modifier le wikicode]

Pour croître et se reproduire, il faut être capable de se nourrir, c'est à dire de puiser dans l'environnement des molécules qui servent de matériaux de construction pour construire toutes les molécules du corps, les ADN, les ARN, les protéines et les autres. Les molécules d'un être vivant sont multipliées en permanence, pour la croissance ou pour remplacer les molécules dégradées.

D'un point de vue biochimique un être vivant est un réseau autocatalytique, c'est à dire un système moléculaire capable de catalyser la production de ses propres molécules. Une molécule catalyse une réaction chimique si elle n'est pas consommée par la réaction et si sa présence est nécessaire pour que la réaction se produise, ou si elle accélère une réaction très lente en son absence. Les ADN sont des catalyseurs pour les réactions de synthèse des ADN et des ARN. Les ARN sont des catalyseurs pour la synthèse des protéines et des ADN. Certaines protéines sont des catalyseurs pour la synthèse des ADN, des ARN, des autres protéines et de toutes les molécules construites par l'organisme. En plus des ADN, des ARN et des protéines, les êtres vivants peuvent se servir de tous les catalyseurs qu'ils trouvent dans leur environnement ou qu'ils arrivent à produire.

Les réseaux autocatalytiques apparaissent spontanément dès que les réseaux de réactions chimiques sont suffisamment complexes et touffus, c'est à dire que de nombreuses molécules sont capables de catalyser de nombreuses réactions (Kauffman 1993, 1995). L’océan primitif était un mélange d’eau salée et de molécules organiques. Une molécule est organique lorsqu'elle est construite sur une structure d'atomes de carbone. La plupart des molécules des êtres vivants sont organiques. L'atome de carbone est de tous les atomes celui qui peut former le plus de liaisons chimiques avec d'autres atomes. C'est pourquoi les molécules organiques sont très nombreuses, très diversifiées et souvent très réactives. On peut tout faire ou presque avec des molécules organiques. Il y en a de toutes les formes et pour tous les usages. Dans l'océan primitif les réseaux de réactions chimiques étaient donc complexes et touffus. De très nombreuses molécules organiques pouvaient réagir les unes avec les autres et catalyser de très nombreuses réactions. Les réseaux autocatalytiques pouvaient donc apparaître spontanément.

Les molécules amphiphiles et les vésicules[modifier | modifier le wikicode]

Pour être vivant il faut avoir une peau ou une membrane, qui sépare l'intérieur de l'extérieur. La physique de l'eau savonneuse suffit pour expliquer l'apparition spontanée de membranes. Une eau savonneuse contient des molécules amphiphiles, c'est à dire des molécules allongées dont une extrémité est hydrophile et l'autre hydrophobe. Une molécule est hydrophile si elle “préfère” être dans l’eau que dans l’huile, c’est à dire si elles se concentrent spontanément davantage dans l’eau que dans l’huile. Elle est hydrophobe, ou lipophile, dans le cas inverse. Lorsque des molécules amphiphiles sont mises en solution dans l’eau, elles forment spontanément de nombreuses structures qui peuvent être très complexes. En particulier, elles peuvent former des bicouches qui se replient en vésicules. Une bicouche est une paroi, plongée dans l'eau, dont les deux faces sont composées d'extrémités hydrophiles, les extrémités hydrophobes s'étant rassemblées à l’intérieur de la paroi. Une vésicule est un petit sac plein d’eau, plongé dans l’eau, et dont la membrane est une bicouche.


Bilayer scheme.svg

Une bicouche. Les cercles sont les extrémités hydrophiles. Les lignes ondulées sont hydrophobes.


Liposome scheme-en.svg

Une vésicule


Les cellules des êtres vivants sont des vésicules très élaborées. Leur membrane est essentiellement une bicouche mais elle est beaucoup plus complexe que les membranes des vésicules dans l’eau savonneuse. L’intérieur de la cellule surtout est très différent de son extérieur, ce qui n’est pas le cas des vésicules que l’on forme en agitant une eau savonneuse.

Les premières cellules vivantes[modifier | modifier le wikicode]

De très nombreuses vésicules pouvaient se former dans l’océan primitif, aussi facilement qu’aujourd’hui l’écume de la mer. Qu’une telle vésicule puisse être le lieu de réactions autocatalytiques est tout à fait plausible. Si sa membrane est telle qu’elle laisse pénétrer les petites molécules nécessaires à la reproduction des grosses, alors on obtient, par le simple jeu des lois physiques et chimiques, un organisme capable de s’alimenter et de grandir. Bien sûr les vésicules ne sont pas toujours dotées d’une telle capacité, mais si elles sont assez nombreuses et assez diversifiées un tel événement n’est pas complètement improbable.

Pour qu’une cellule soit vivante, il ne suffit pas qu’elle soit capable de grandir, il faut encore qu’elle puisse se reproduire. On peut supposer qu'une vésicule suffisamment grosse peut se diviser en vésicules plus petites, ou laisser des protubérances se détacher.

Si une vésicule est capable de croître, en s’alimentant, et de se reproduire, en se divisant ou en formant des protubérances qui se détachent, alors elle est un être vivant primitif. Elle a la propriété essentielle des êtres vivants, la capacité à se reproduire quand elle est placée dans un environnement approprié. On peut alors supposer qu’une telle vésicule est l’ancêtre de tous les êtres vivants qui existent aujourd’hui.

L’origine de l’ADN[modifier | modifier le wikicode]

Les premiers réseaux autocatalytiques n’étaient pas aussi élaborés que ceux d’aujourd’hui, fondés sur la machinerie très complexe de l’ADN, des ribosomes, du code génétique et des protéines. Mais les êtres vivants primitifs étaient capables d’évoluer. Leurs réseaux autocatalytiques pouvaient être modifiés par l’incorporation de nouvelles molécules, absorbées de façon exceptionnelle. De telles modifications sont héritables, parce qu’une fois qu’une molécule est incorporée à un réseau autocatalytique, elle devient capable de se reproduire. Les conditions de l’évolution par la sélection naturelle sont donc réunies : variations aléatoires héritables et compétition au sein d’une population pour l’accès aux ressources. Les cellules primitives les plus performantes étaient celles qui se reproduisaient le mieux et elles tendaient à dominer la population. On peut donc supposer que ces êtres vivants primitifs ont évolué. Leurs techniques autocatalytiques rudimentaires se sont perfectionnées jusqu’à atteindre un point de quasi-perfection, à savoir les techniques de réplication de l’ADN et de fabrication des protéines qui sont possédées depuis des milliards d’années par tous les êtres vivants.

Comment savoir si cette théorie est vraie ?[modifier | modifier le wikicode]

On ne peut pas remonter le temps pour aller voir comment était l’océan primitif et comment il a évolué. Mais on peut trouver des témoignages indirects. Le passé laisse des traces dans le présent. Si on a les bons outils, théoriques et observationnels, on peut déduire le passé à partir du présent. Par exemple, les techniques autocatalytiques d’aujourd’hui (ADN et compagnie) se sont en quelque sorte fossilisées depuis des milliards d’années, puisqu’elles n’ont pas ou peu évolué. Elles nous renseignent donc sur un passé très lointain. En combinant ces informations avec d’autres, on peut espérer remonter encore plus loin dans le temps. Des expériences en laboratoire de chimie prébiotique peuvent apporter des renseignements précieux.

La vie est chez elle dans l'univers[modifier | modifier le wikicode]

Cette théorie de la génération spontanée conduit à une vision unifiée de la matière et de la vie. L’apparition et l’évolution de la vie y sont conçues comme des conséquences nécessaires de la dynamique de l’univers. Dès que des conditions adéquates sont réunies (des molécules organiques en abondance dans de l’eau liquide, ce qui suppose une température adéquate), la matière manifeste sa capacité à engendrer la vie. D’une façon métaphorique, on peut dire avec Kauffman (1995) que les êtres vivants peuvent se sentir chez eux dans l’univers, parce que la matière est comme la terre nourricière qui nous a donné la vie.

La coopération est plus fondamentale que la compétition[modifier | modifier le wikicode]

La vie repose sur la coopération entre toutes les molécules, et plus généralement, entre toutes les parties d'un organisme. Lorsque les parties cessent d'œuvrer à la conservation de leur ensemble, la vie disparaît. Les parties sont vivantes parce qu'elles font partie d'une totalité vivante. Une main cesse d'être une main si elle est séparée du corps. Si on applique le principe d'Aristote, que toutes les parties d'un être vivant vivifient et sont vivifiées par toutes les autres, à la biologie moléculaire, on définit précisément les réseaux autocatalytiques.

Les êtres vivants sont souvent en compétition les uns contre les autres, mais une telle compétition ne pourrait pas exister s'il n'y avait pas d'abord de la coopération à l'intérieur des organismes. La lutte pour la vie est une compétition entre des systèmes qui doivent coopérer intérieurement. Les vainqueurs sont ceux qui coopèrent le mieux. La sélection naturelle retient les meilleures formes de coopération. Elle découvre spontanément ce que la matière est capable d'inventer de mieux quand elle fait des systèmes autoprotecteurs.

Plutôt que la compétition, les êtres vivants ont souvent intérêt à rechercher la coopération entre eux, entre membres d'une même espèce ou entre membres d'espèces différentes. Là encore la sélection naturelle favorise ceux qui coopèrent le mieux.

L'infinie tolérance de la vie[modifier | modifier le wikicode]

On conçoit parfois la sélection naturelle comme une sorte d'élimination de tout ce qui n'est pas optimal, comme s'il fallait absolument être le meilleur pour avoir le droit d'exister. Mais c'est une erreur. La sélection naturelle laisse vivre tout ce qui arrive à vivre, optimal ou pas. L'évolution de la vie n'est pas la quête du meilleur, elle est plutôt une exploration de toutes les possibilités de vie. Elle laisse apparaître tout ce qui peut apparaître, elle n'a pas de préjugés sur ce qui doit être ou ne pas être. Toutes les formes de vie sont a priori bienvenues. La sélection naturelle laisse vivre les faiblesses et les imperfections. Et même elle requiert leur apparition, parce que les nouveautés aléatoires vont dans tous les sens, tantôt favorables, tantôt défavorables, et parce que les faiblesses sont aussi parfois des forces. Qu'un caractère héréditaire soit favorable ou défavorable dépend de très nombreuses circonstances qui peuvent varier. C'est pourquoi il n'est jamais possible de définir un unique optimum.

La Nature est beaucoup plus tolérante que nous. Quand nous affirmons que ce qui existe ne mérite pas d'exister, la Nature affirme toujours le contraire, puisqu'elle le laisse exister. De notre point de vue la Nature ne pèche pas par intolérance mais par excès de tolérance. Elle laisse vivre tout ce qui veut vivre, dès que ça arrive à vivre, même la peste et toutes les épidémies - les épidémies sont une manifestation naturelle de la vie, puisque les microbes sont vivants - et tout ce qui nous fait horreur.

Nous existons parce que la Nature nous laisse exister. Ce n'est pas très flatteur, parce qu'elle laisse exister même la peste. On aimerait bien être au moins un peu mieux que la peste. La peste ne peut pas être mieux que ce qu'elle est, parce qu'elle ne peut pas y penser, mais nous nous pouvons.

L'origine de l'esprit[modifier | modifier le wikicode]

La vie commence avec la coopération entre molécules, les réseaux autocatalytiques, et les organismes unicellulaires qu'ils permettent de construire. Elle continue avec les organismes pluricellulaires, la coopération entre cellules vivantes, et par suite entre tous les organes d'un être vivant. Elle continue encore avec la coopération entre les êtres vivants.

La conscience et la volonté sont également une forme de coopération à l'intérieur du vivant. Un organisme dépourvu de volonté est livré aux circonstances. Si son environnement le pousse vers des désirs incompatibles, ses contradictions intérieures ne peuvent que le faire souffrir et souvent périr. La volonté consciente, c'est à dire une administration centralisée dans le cerveau qui impose un minimum de cohérence intérieure, est l'apparition d'une nouvelle forme de coopération, comme si toutes les parties de l'organisme arrivaient à se mettre d'accord sur des objectifs communs. De même qu'un État intelligent peut augmenter la puissance d'une société humaine, la volonté consciente augmente la puissance de vivre, parce qu'elle rend possible davantage de coopération entre les parties d'un être vivant.

Comme la sélection naturelle favorise la coopération intérieure, la volonté consciente est apparue et a évolué dès que les êtres vivants ont eu les moyens de la faire apparaître, c'est à dire dès que leurs cerveaux ont été assez complexes pour développer une administration centralisée.


Chapitre suivant : Les vertus thérapeutiques de l'autonomie >>>


Les vertus thérapeutiques de l'autonomie

Les troubles psychiques[modifier | modifier le wikicode]

Les troubles psychiques sont les troubles des émotions et du système exécutif qui se manifestent par des comportements anormaux qui font souffrir.

Le système exécutif est le système qui fait exister la volonté, c'est à dire le système qui rend capable de prendre des décisions volontaires et de les faire appliquer. Dans ce livre, il est expliqué avec un modèle d'administration centralisée sans administrateur central.

Le système émotionnel regroupe tous les sous-systèmes qui nous rendent capables d'avoir des émotions.

Un dysfonctionnement sensoriel ou moteur ne se répercute pas forcément sur les systèmes émotionnel et exécutif. Dans ce cas, le trouble est neurologique mais n'est pas psychique, au sens ici défini.

Les systèmes émotionnel et exécutif marchent ensemble. Le bon fonctionnement de l'un est nécessaire au bon fonctionnement de l'autre, parce que le système exécutif sert à la régulation des émotions, et parce que les émotions servent à la prise de décision. C'est pourquoi les troubles psychiques sont toujours en même temps des troubles des émotions et de la volonté.

Pour comprendre les dysfonctionnements il faut comprendre le fonctionnement. D'un point de vue théorique, la psychopathologie est donc fondée sur la compréhension du fonctionnement des systèmes exécutif et émotionnel. Inversement l'étude des dysfonctionnements peut apporter des renseignements précieux pour comprendre le fonctionnement. La psychopathologie est donc un sujet de première importance pour la recherche fondamentale en psychologie.

Le concept d'anormalité peut être interprété au sens biologique ou au sens sociologique:

Au sens biologique un comportement est anormal lorsqu'il est contraire à la satisfaction des besoins fondamentaux. Au sens sociologique, un comportement est anormal lorsqu'il est contraire aux attentes sociales, lorsqu'il s'écarte des normes couramment acceptées. Les comportements anormaux au sens biologique font toujours souffrir et manifestent toujours un trouble psychique. En revanche les comportements anormaux au sens sociologique ne font pas toujours souffrir. Les déviances ne rendent pas forcément malheureux. Elles manifestent des troubles psychiques seulement si elles font souffrir.

La plupart des troubles psychiques se manifestent par des comportements inadaptés à leur environnement social, donc déviants. Il faut souligner que la plupart du temps ces déviances ne sont pas volontaires. L'individu aimerait bien être normal, comme tout le monde, et souffre de ne pas y arriver. Lorsque la déviance est volontaire et que l'individu en souffre, on est en présence d'une personnalité autodestructrice. Lorsqu'une déviance volontaire fait souffrir les autres, il s'agit d'une personnalité antisociale. Ce dernier cas est extrêmement minoritaire dans le champ de la psychopathologie. La plupart des patients sont des personnes qui souffrent et qui n'y peuvent rien, pas des criminels.

On peut mettre en question les critères de souffrance et d'anormalité sociale. Si quelqu'un passe son temps à discuter avec les anges et s'il y trouve son bonheur, sans déranger personne, il n'y a pas de souffrance, mais on est quand même tenté de parler de trouble psychique. L'importance du critère de souffrance n'est pas théorique mais surtout pratique. La psychiatrie n'a pas pour fonction d'imposer les normes sociales, sinon elle se transforme en instrument de répression. Sa vocation est de soigner les souffrances, pas de faire souffrir. Lorsque les comportements déviants ne font pas souffrir, un psychiatre n'a pas à intervenir, il doit les tolérer, comme tout le monde, et peut même parfois s'en réjouir.

Même les comportements qui respectent les normes sociales sont parfois morbides. Il y a des coutumes barbares, des folies collectives, des maladies sociales. Là encore l'importance du critère d'anormalité sociale n'est pas théorique mais surtout pratique. Un psychiatre doit avant tout soigner des individus qui souffrent. Soigner une société malade ne relève pas directement de sa compétence.

En définissant les troubles psychiques comme des troubles des émotions et des fonctions exécutives, on adopte une approche centrée sur l'individu, à laquelle on reproche parfois, avec raison, une erreur de perspective, parce que les troubles individuels s'inscrivent en général dans un environnement social lui-même troublé. Par exemple il est possible que des individus soient capables de vivre d'une façon tout à fait normale tant qu'ils restent séparés, et qu'ils adoptent des comportements inadaptés dès qu'ils se retrouvent ensemble. Dans de tels cas, le trouble est collectif avant d'être individuel. Mais là encore il s'agit de troubles des émotions et de la volonté, limités à un environnement social particulier. Une approche systémique, qui prend en compte le tissu de relations sociales dans lequel les individus sont insérés, n'est pas exclue par la présente définition des troubles psychiques, parce que même les troubles collectifs se manifestent par des dysfonctionnements individuels.

Se guérir soi-même[modifier | modifier le wikicode]

Autant qu'il est possible, les thérapies doivent requérir la participation active du patient. On demande au patient de faire usage de son intelligence et de sa volonté pour soigner sa volonté et son système émotionnel. Cela peut sembler désespéré. Si la volonté est devenue dysfonctionnelle, comment pourrait-elle fonctionner pour se réparer elle-même? De fait, dans les cas graves, lorsque les patients sont livrés à eux-mêmes, ils sont souvent incapables, même avec les meilleures intentions, de soigner leur propres troubles, et s'ils essaient quand même, les conséquences sont parfois désastreuses. L'automédication solitaire n'est pas à recommander, sauf si les troubles sont légers.

Lorsqu'un individu souffre de troubles psychiques, son système exécutif est à la fois un organe endommagé qu'il faut réparer, une cause d'aggravation des troubles et le principal instrument de guérison.

Lorsque le système exécutif est endommagé, il perd, partiellement ou complètement, la capacité à se protéger lui-même. C'est pourquoi les troubles psychiques ont une fâcheuse tendance à s'aggraver. De ce point de vue, ils sont semblables aux déficiences immunitaires. Lorsque le système immunitaire est endommagé, l'individu devient la proie de tous les agents pathogènes présents dans son environnement. De la même façon, les troubles psychiques rendent l'individu très vulnérable face à toutes les agressions psychiques qu'il subit, parce qu'il a perdu sa capacité à se protéger. Et cela peut même être encore pire, lorsque les comportements deviennent autodestructeurs. L'individu devient un danger pour lui-même, voire un tortionnaire, en retournant sa volonté contre lui-même.

Il peut sembler très déraisonnable de demander au patient d'être son propre médecin, comme si on lui demandait de mettre son sort entre les mains d'un malade. Mais si elle est bien comprise, cette demande est une condition nécessaire pour une véritable guérison. La volonté est naturellement autoprotectrice et autoguérisseuse. En général, la vie n'est pas un long fleuve tranquille, ou elle ne le reste pas très longtemps. Il faut de la volonté pour supporter et surmonter les épreuves qu'elle nous fait subir. Les troubles psychiques apparaissent justement lorsque la volonté n'est plus capable d'exercer cette fonction autoguérisseuse. Pour retrouver la santé il faut rétablir sa capacité à supporter et surmonter les épreuves de la vie. Demander au patient d'être son propre médecin n'est pas déraisonnable parce que c'est simplement lui demander de faire usage de ses facultés naturelles.

Il se peut que les troubles soient tellement graves qu'une telle demande soit tout à fait vaine. Mais heureusement ce n'est pas le cas général. Le plus souvent la volonté a conservé une certaine capacité à agir sur elle-même, à se protéger et à se soigner. Elle a souvent besoin d'être conseillée et aidée pour mener à bien sa démarche d'autoguérison.

Même dans les cas où un traitement aux médicaments suffit à la guérison, où le patient semble donc purement passif, sa participation active fait partie de la guérison, même si elle n'a pas été sollicitée. Les médicaments délivrent le patient d'une partie de ses souffrances et l'aident à retrouver une certaine maîtrise de lui-même. Il retrouve la capacité à faire un bon usage de sa volonté et se guérit ainsi lui-même.

La critique comme moyen de guérison[modifier | modifier le wikicode]

Pour exercer normalement sa volonté il faut un minimum de lucidité sur soi-même et sur ses conditions de vie. Il faut également un minimum de savoir éthique pour prendre de bonnes décisions. Ces deux formes de connaissance sont généralement perturbées par les troubles psychiques. L'individu comprend mal ce qu'il est devenu et ce qu'il devrait faire. Une thérapie doit rétablir un minimum de lucidité. Elle ne requiert pas de tout savoir sur soi-même, ou de devenir un expert-psychiatre de ses propres troubles. Elle demande seulement de se servir de ses facultés naturelles de connaissance de soi-même afin de s'adapter aux difficultés de sa vie et aux conséquences d'un passé douloureux. Il s'agit simplement d'en savoir assez sur soi-même pour prendre de bonnes décisions.

La fausse conscience peut empêcher la volonté de jouer son rôle autoprotecteur et autoguérisseur, parce qu'elle empêche de s'adapter à la réalité intérieure niée. La fausse conscience est donc en général une cause d'aggravation des troubles psychiques. Une thérapie demande qu'on se serve de sa volonté pour renoncer aux illusions qui entretiennent les troubles, mais pour cela il faut commencer par les identifier, ce qui n'est pas facile, puisqu'on se tient à ses illusions justement parce qu'on ne veut pas savoir.

Les illusions sont comme de fausses théories, ou de faux modèles de la réalité. Elles sont des croyances inadaptées qui nous empêchent de nous adapter. La méthode pour reconnaître leur fausseté est universelle. Comme pour toute activité scientifique, il faut confronter nos croyances à la réalité afin de réunir des preuves de leur vérité ou de leur fausseté, il faut donc être critique et autocritique. On doit être comme un scientifique qui réunit les meilleures preuves pour vaincre des préjugés, ou pour surmonter d'autres obstacles au progrès du savoir. On apprend à se connaître soi-même, et donc à se maîtriser soi-même, de la même façon qu'on apprend les sciences, en activant son esprit critique. Inviter le patient à se servir de sa raison, à confronter ses croyances à la réalité, à les discuter lors d'un débat critique intérieur, afin de reconnaître les illusions et de les remplacer par des croyances adaptées, est l'un des principaux modes d'intervention utilisés par les thérapies cognitives (Beck 1975). En aidant à reconnaître le bon savoir, le savoir sur le savoir peut donner aux patients davantage de force critique pour se défaire de leurs illusions et guérir ainsi leurs troubles psychiques.

Le travail de prise de conscience, de renoncement aux illusions de la fausse conscience, n'est en général à lui seul pas suffisant pour soigner les souffrances. Le premier effet de la lucidité est même souvent plutôt d'intensifier la souffrance, parce qu'en général on se réfugie dans la fausse conscience pour fuir ce qui nous fait mal. Un travail de conscience peut donc être dangereux. Il ne suffit pas de regarder en face une réalité qui fait souffrir et qu'on a niée jusque là, il faut surtout prendre conscience des moyens qui nous permettent de dépasser cette souffrance et de retrouver un minimum d'équilibre intérieur.

On n'a pas seulement besoin d'une conscience lucide, on a surtout besoin d'expériences réparatrices pour guérir. Lorsqu'on souffre de troubles psychiques, il y a en général des problèmes à la fois du côté du surmoi et du côté du ça, tout particulièrement les systèmes émotionnels. Le surmoi est inadapté à la réalité extérieure et intérieure et nos réactions émotionnelles nous font souffrir. Pour guérir on doit corriger le surmoi pour l'adapter à la réalité et donc faire un travail de lucidité mais on doit aussi apprivoiser le ça, pour supprimer ou réduire les souffrances excessives ou inadaptées qu'il nous inflige.

Quand on est malade on a besoin d'expériences heureuses pour s'apaiser et se guérir, mais justement on a perdu en tombant malade la capacité à se donner des expériences heureuses, partiellement ou totalement. Le travail critique peut aider à se réconcilier avec son expérience et y trouver un peu de bonheur. L'esprit critique invite à voir dans toute expérience, heureuse ou malheureuse, une source d'enrichissement. Même un passé qui fait horriblement souffrir, un présent qui dégoûte ou un avenir qui fait angoisser sont un riche matériau empirique pour exercer la conscience et la renforcer. Nous avons besoin d'expériences pour confirmer nos bonnes croyances, celles qui nous aident à bien vivre, et pour infirmer et corriger nos croyances inadaptées. La force critique peut nous aider à nous réconcilier même avec le malheur, parce que c'est parfois un chemin de lucidité, et donc à mieux vivre l'expérience de la maladie. Accepter sa maladie est une des premières conditions de la guérison.

La paix intérieure[modifier | modifier le wikicode]

Lorsque le moi est divisé, chaque aspect de la personnalité se sent menacé par les autres qui nient ses valeurs et ses croyances. Comme tout ce qui est vivant, une réaction naturelle est de se protéger et de se défendre contre cette agression. Et comme nous croyons souvent, à tort, d'une façon paranoïaque, que l'attaque est la meilleure défense, un aspect de la personnalité qui se sent menacé devient agressif et se retourne contre ses agresseurs.

Un surmoi agressif, plein de haine et de mépris contre tout ce qui ne lui obéit pas, est un facteur d'aggravation des conflits intérieurs. Les parties du moi haïes ou méprisées cherchent à se venger de cette agression du surmoi. Et elles peuvent se venger même si elles ne peuvent pas s'approprier les ressources de la conscience et de la volonté. Le moi ressemble alors à un État répressif où le déploiement de moyens policiers ne fait qu'envenimer la colère sociale.

Un moi divisé se comporte parfois comme une girouette et laisse au gré des circonstances tel ou tel aspect de la personnalité dominer et s'approprier les ressources de la volonté consciente. Le moi ressemble alors à un État où de nombreux gouvernements se succèdent et s'efforcent de détruire ce que les autres essaient de construire.

Vivre et laisser vivre n'est pas qu'un principe de vie sociale, c'est aussi un principe de vie intérieure. Autant que possible il faut rechercher une sorte de coexistence pacifique entre nos diverses aspirations intérieures, que chacune puisse se développer sans nuire aux autres, et on a besoin d'un surmoi qui laisse vivre cette diversité intérieure, pas qu'il la réprime inutilement. « Pardonne-nous nos offenses comme nous pardonnons aussi à ceux qui nous ont offensé » est un principe de thérapie psychique. Il faut se donner un surmoi semblable à une autorité bienveillante qui encourage la paix intérieure.

La pensée est naturellement intolérante. Lorsqu'on se fixe des principes, on nie tout ce qui les contredit. Mais la raison ne se réduit pas à cette pensée d'entendement, rigide et fixée à ses principes. Elle accueille tous les points de vue, toutes les théories, toutes les hypothèses. Si on veut développer sa pensée et contribuer ainsi à la raison, on doit se fixer des principes et s'y tenir dans nos raisonnements pour développer une théorie. Si on ne le faisait pas, il n'y aurait pas de théorie et donc pas de raison. Mais on n'est pas obligé d'étudier une seule théorie, comme la pensée d'entendement pourrait nous inciter à le croire, et on comprend facilement qu'on enrichit son savoir en accueillant une grande diversité de théories, qui souvent se contredisent les unes les autres. Une telle diversité n'est pas forcément une menace pour l'unité intérieure, parce qu'on peut être à son écoute et estimer qu'elle mérite d'être dite et entendue sans forcément toujours l'approuver. On peut même accueillir des pensées et des avis qu'on réprouve sans les mépriser ou les haïr, parce qu'ils méritent quand même d'être exprimés. Cette tolérance intérieure est plutôt de nature à renforcer l'autorité du surmoi, parce qu'elle ne s'épuise pas à lutter contre ses adversaires.

La tolérance a forcément des limites, puisqu'il faut bien se protéger contre ceux qui la menacent. Mais même lorsque certaines formes de répression intérieure sont nécessaires, il vaut mieux rester bienveillant avec soi-même. Une main de fer dans un gant de velours. On peut réprimer des envies ou des désirs sans forcément les mépriser ou les détester, et sans se haïr soi-même. La haine de soi ne fait qu'aggraver les conflits intérieurs. Un moi qui exerce une autorité bienveillante et tolérante sur lui-même ressemble à un État idéal où la police arrive toujours à imposer le respect de la loi par la persuasion de la raison, sans être armée et sans faire usage de la violence.

Les réactions intérieures[modifier | modifier le wikicode]

Les réactions intérieures sont les réactions aux événements intérieurs. Nous réagissons aux conditions extérieures et à nos conditions intérieures. Nos émotions, nos croyances, nos désirs et nos décisions peuvent nous faire réagir et éveiller de nouvelles émotions, de nouvelles croyances, de nouveaux désirs ou nous pousser à prendre une nouvelle décision.

Les réactions intérieures sont beaucoup plus déterminantes que les réactions immédiates aux conditions extérieures, parce que notre comportement dépend de l'enchaînement de toutes nos réactions, immédiates et intérieures. Sans changer nos réactions immédiates nous pouvons changer complètement notre façon de réagir, simplement en modifiant nos réactions intérieures.

Une attaque de panique résulte d'une réaction intérieure inadaptée. On commence par ressentir une angoisse intense, plus intense que les angoisses auxquelles on est habitué, et on réagit en croyant qu'elle annonce une mort imminente, qu'on va suffoquer ou que le cœur va s'arrêter. La réaction intérieure à l'angoisse l'amplifie démesurément et provoque la panique. On est très étonné finalement quand on se rend compte qu'on n'en meurt pas. C'est très douloureux mais ça ne tue pas, il suffit d'attendre que ça passe.

On peut comparer une attaque de panique à une société envahie par des craintes superstitieuses confirmées par l'État, qui annonce une catastrophe imminente au lieu de déclarer que l'angoisse collective est sans fondement.

Avoir une pensée inconvenante ou criminelle et croire qu'on va devenir fou, ou méprisé et haï par tous, ou foudroyé sur place, ou criminel, sont des exemples courants de réactions intérieures inadaptées. Les pensées inconvenantes ou criminelles ne sont en général pas si dangereuses. Elles sont un sujet d'embarras, parce qu'elles révèlent des vérités qui dérangent, mais elles ne sont pas incompatibles avec une vie psychique équilibrée, pourvu qu'elles soient jugées comme il convient.

Les réactions intérieures inadaptées, quand elles sont vraiment trop inadaptées, font les troubles psychiques. Même une phobie simple n'est pas qu'une réaction inadaptée à une situation extérieure anxiogène. Quand on est phobique, on n'a pas seulement peur de la situation anxiogène, on a surtout peur de sa peur, peur de l'angoisse que la situation anxiogène va éveiller et révéler. On fuit la situation anxiogène pour fuir son angoisse. Pour se guérir d'une phobie, il faut commencer par se familiariser avec sa peur, il faut apprendre à avoir moins peur de sa peur, il faut l'accueillir et l'accepter pour l'apprivoiser, et la réduire à un niveau où elle n'empêche plus de vivre normalement.

Toutes les réactions intérieures violentes et tournées contre soi-même sont des formes de la haine de soi. On peut être dégoûté, enragé, affligé ou angoissé par ses propres réactions. Ce sont évidemment des réactions intérieures inadaptées. On voudrait être un autre mais on ne peut pas. Il faut bien s'adapter à celui qu'on est parce qu'on en a pas d'autre qui pourrait le remplacer.

En se donnant un surmoi bienveillant, tolérant et apaisant, on se donne des réactions volontaires adaptées à soi-même et on peut ainsi corriger partiellement la haine de soi. On renonce à nos réactions volontaires haineuses et on les remplace par des réactions bienveillantes qui imposent sans violence une bonne autorité. La plupart de nos réactions intérieures ne sont pas volontaires, la haine de soi n'est pas que dans le surmoi, elle est aussi dans le ça, mais comme la volonté consciente a naturellement une grande puissance intérieure, pourvu qu'elle soit lucide, même nos réactions involontaires haineuses peuvent être apaisées et disciplinées. Un ça qui fait souffrir peut être apprivoisé.

La vérité biographique et autobiographique[modifier | modifier le wikicode]

Un patient a un cerveau divisé lorsque les connexions entre les deux hémisphères ont été coupées, pour soigner son épilepsie. Chaque hémisphère est alors en partie indépendant de l'autre. L'un des hémisphères, souvent à gauche, est le lieu de production de la parole, réelle ou seulement pensée. Chaque hémisphère ne voit qu'une moitié du champ visuel. Lors d'une expérience avec un patient au cerveau divisé, on a montré une griffe de poulet à son hémisphère gauche et une scène de neige à son hémisphère droit (Gazzaniga 1998, p.24-25). L'exercice était de choisir une autre image apparentée à la première. Le patient a choisi un poulet avec sa main droite et une pelle avec sa main gauche (chaque hémisphère commande la main du côté opposé). Quand on a demandé au patient pourquoi il avait choisi la pelle, son hémisphère gauche a répondu qu'elle pouvait servir pour nettoyer le poulailler. Il a forcément inventé cette explication, puisqu'il ne sait pas que l'hémisphère droit a vu la scène de neige.

Cette expérience avec un patient au cerveau divisé montre de façon flagrante la tendance du cerveau à affabuler, mais cette tendance est très générale. Nous inventons toujours beaucoup d'explications pour tout ce que nous observons, à l'extérieur et à l'intérieur, alors que nous sommes très souvent superstitieux ou aveuglés par des illusions. Identifier les causes d'un événement et énoncer des lois qui soient vraies au moins la plupart du temps est un exercice difficile, et nous nous fourvoyons la plupart du temps. Faut-il en conclure que l'autobiographie est toujours une fiction ? que le moi est une illusion qui affabule pour se donner l'illusion qu'elle est plus qu'une illusion ?

La vie d'un individu est toujours infiniment complexe. Aucun compte rendu aussi précis soit-il ne peut rassembler tous les faits qui construisent une destinée. Il est hors de question de tout savoir sur soi-même, ou de tout savoir sur autrui. Pour raconter l'histoire d'une vie il faut sélectionner des événements que l'on croit signifiants. De très nombreuses histoires très différentes entre elles peuvent raconter la même vie, même si elles portent toujours sur des faits avérés.

L'histoire d'une vie n'est pas qu'une succession d'événements. On veut aussi des explications. On veut comprendre l'enchaînement des causes et des effets. Mais comme tous les systèmes complexes, les vies humaines ne se prêtent pas toujours très bien à des explications causales. Les causes d'un effet particulier sont souvent trop nombreuses, trop complexes ou trop difficiles à observer pour être connues. La plupart du temps on n'en sait pas assez pour donner des explications causales satisfaisantes.

L'histoire d'une vie dépend toujours d'un système d'évaluation. Les événements significatifs, les buts poursuivis, les moyens mis en œuvre, les qualités qu'on révèle sont toujours présentés dans un cadre éthique particulier au narrateur. Les mêmes événements peuvent être interprétés comme des réussites, ou des échecs, ou des faits insignifiants, ou des fautes graves, en fonction du système de valeurs qui sert à les interpréter.

Tous les arguments précédents suggèrent qu'on aurait tort de parler de la vérité biographique ou autobiographique, qu'il n'y aurait que des fictions, mais c'est une conclusion insensée.

On se fait souvent des illusions, mais pas toujours. Nos observations peuvent être très justes, très précises et très vraies, dès que les conditions sont réunies pour qu'elles le soient. On se dupe soi-même par inadvertance, par faiblesse de la volonté ou par manque d'esprit critique. Mais si on se sert correctement de nos facultés naturelles de concentration, de fermeté de la volonté et de réflexion, on est souvent très capable d'observer la vérité et de la distinguer des illusions ou des mensonges.

Aucune histoire ne peut raconter la vérité complète sur une destinée. Cela ne prouve pas que toutes les histoires sont fausses, mais seulement qu'elles ne peuvent jamais dire plus qu'une partie de la vérité.

On ne peut jamais raconter l'histoire d'une vie à la façon des physiciens, qui peuvent parfois expliquer un mouvement en identifiant toutes ses causes et en prédisant toutes leurs conséquences, mais on aurait tort d'en conclure qu'il faut renoncer aux explications causales quand on parle de la vie humaine. Toutes nos compétences volontaires, sans aucune exception, reposent sur notre capacité à identifier des causes et des effets, ou des conditions et conséquences. Sans les prédictions causales, nous ne pourrions jamais trouver des moyens pour atteindre nos buts, et nous ne pourrions donc rien faire volontairement. Nous voulons des explications causales parce qu'elles augmentent nos capacités à agir et à maîtriser nos destinées. Les explications causales ne sont pas à rejeter des biographies ou des autobiographies, parce qu'elles en sont un élément essentiel, qui révèle la maîtrise, ou la non-maîtrise, du protagoniste sur sa vie.

La vie et l'esprit ne mettent pas toutes les possibilités éthiques particulières sur un pied d'égalité. Pour bien vivre et bien développer son esprit, on a besoin d'un bon savoir éthique qui nous invite à respecter la vie et à développer l'esprit. La Nature dans son ensemble nous invite à la coopération avec tout ce qui vit. Et pour s'accomplir comme un esprit il faut vivre pour faire vivre l'esprit. C'est pourquoi rien de ce qui est humain ne nous est étranger (Térence). L'histoire d'une vie met toujours en jeu des valeurs qui nous parlent, même si elle fait partie d'une culture très différente de la nôtre. La diversité éthique n'empêche pas de reconnaître des valeurs universelles.

Les vertus thérapeutiques de la narration[modifier | modifier le wikicode]

Nous ne contentons pas de vivre nos vies, nous passons beaucoup de temps à les raconter, à nous-mêmes par la pensée, ou aux autres par la parole et l'écrit. Nous commentons, nous interprétons, nous expliquons, nous évaluons, tout ce que nous vivons.

La narration est souvent inséparable de l'expérience. Ce que nous ressentons et ce que nous faisons dépendent de ce que nous en pensons (Angus & Greenberg 2011).

La narration n'est pas seulement rétrospective. Elle affirme ou elle nie des capacités et des valeurs. La volonté se construit et se projette dans l'avenir en commentant ses décisions (White & Epston 1990). On peut écrire son avenir en se le racontant.

Toutes les pensées que nous nous donnons pour expliquer et justifier ce que nous faisons manifestent l'autonomie de la volonté. Elle affirme ce à quoi elle s'engage et s'évalue elle-même à partir de ses engagements. En se racontant des histoires, on peut se servir de sa volonté pour la renforcer. Mais on peut aussi l'anéantir, en se poussant au désespoir.

Si nous croyons que rien ne mérite d'être fait alors la vie devient insensée. Pour donner du sens à la vie que nous vivons et que nous nous racontons, nous devons croire que ce que nous faisons a du sens, sinon il ne reste plus qu'à attendre la mort en supportant que tout est vain et insensé. La vie perd son sens si nous ne voulons pas lui en donner.

La narration est le plus grand pouvoir donné par l'autonomie de la volonté. En nous racontant nos vies nous décidons de ce que nous en faisons.

Si nous nous racontons de fausses histoires pour nous donner bonne conscience, pour flatter notre vanité ou pour fuir les problèmes très réels que nous devrions affronter, nous ne nous donnons évidemment pas les moyens de nous développer de façon intelligente et adaptée. Regarder la réalité en face et respecter la vérité sont des conditions nécessaires du bon usage de l'autonomie.

Le respect de la vérité n'est pas la soumission à la fatalité, parce que l'avenir n'est pas écrit d'avance (Cf. La théorie quantique des destinées multiples). Ce qui est fait ne peut être défait, mais le passé peut être dépassé. Quand on se raconte sa vie, il faut bien respecter les vérités passées, mais elles ne déterminent pas l'avenir, on est libre de les interpréter comme on veut pour écrire et vivre la suite de l'histoire.

La bonne nouvelle est qu'il y a une bonne nouvelle, que notre parole peut être une bonne parole. Quand notre parole affirme qu'elle peut être une bonne parole, elle est déjà une bonne parole. Mais bien sûr ce n'est que le début de la bonne nouvelle. Elle prouve qu'elle est vraiment une bonne nouvelle quand elle tient sa promesse, qu'elle est une bonne nouvelle, c'est à dire quand elle porte des fruits. Dire que la parole peut être bonne, intelligente, sage et qu'elle peut nous rendre meilleurs en nous faisant partager sa sagesse est une parole bonne et sage. Mais au commencement la preuve n'est pas complète, il faut vivre la suite. Quand on croit que la parole peut être une bonne parole, on se donne immédiatement les moyens de le prouver, parce qu'on recherche la bonne parole, une parole qu'on ne pourrait jamais trouver si on ne la cherchait pas. Mais une vie n'est pas de trop pour prouver qu'on ne se trompe pas quand on croit que la bonne parole vaut la peine d'être cherchée.


Références

Anselme d'Aoste, Proslogion (1078)

Aristote, Ethique à Nicomaque, Organon, Les parties des animaux, De l'âme, Physique, Métaphysique

Baars, Bernard J., A cognitive theory of consciousness (1988)

Beck, Aaron T., La thérapie cognitive et les troubles émotionnels (1975)

Berthoz, Alain, Le sens du mouvement (1997)

Chalmers, David J., The conscious mind (1996)

Changeux, Jean-Pierre, L'homme de vérité (2002)

Cohen, Paul J., Set theory and the continuum hypothesis (1966)

Cottraux, Jeau, La répétition des scénarios de vie (2001)

Churchland, Patricia S. & Sejnowski, Terrence J., The computational brain (1992)

Condorcet, Nicolas de, Essai sur l’application de l’analyse à la probabilité des décisions rendues à la pluralité des voix (1785)

Damasio, Antonio, Time-locked multiregional retroactivation: A systems-level proposal for the neural substrates of recall and recognition (1989, Cognition, 33, 25-62), L'erreur de Descartes (1994), Convergence and divergence in a neural architecture for recognition and memory (avec Kaspar Meyer, 2009, Trends in Neurosciences Vol.32 No.7, 376-382)

Darwin, Charles, L'origine des espèces (1859)

Dawkins, Richard, Climbing Mount Improbable (1997)

Dehaene, Stanislas, Le code de la conscience (2014)

Depaul, Michael R., Intuitions in moral inquiry (2006, dans The Oxford handbook of ethical theory)

Descartes, René, Le Discours de la méthode pour bien conduire sa raison et chercher la vérité dans les sciences (1637)

Dugnolle, Thierry, Théorie quantique de l'observation (2018)

Einstein, Albert, La théorie de la relativité restreinte et générale (1916)

Fitch, Frederic Brenton, Symbolic logic, an introduction (1952)

Fraenkel, Abraham, Abstract set theory (1953)

Freud, Sigmund, Introduction à la psychanalyse (1915), Le moi et le ça (1923)

Gazzaniga, Michael S., The mind's past (1998), Neurosciences cognitives : la biologie de l'esprit (2001, avec Richard B. Ivry)

Gentzen, Gerhard, Recherches sur la déduction logique (1934)

Gödel Kurt, Sur la complétude du calcul logique (1929, Thèse de doctorat)

Goldman, Alvin, Epistemology and Cognition (1986), Knowledge in a Social World (1999), Simulating Minds, the philosophy, psychology, and neuroscience of mindreading (2006)

Goodman, Nelson, Faits, fictions et prédictions (1955)

Gould, James L. & Gould, Carol Grant, The animal mind (1994)

Greenberg, Leslie S., Angus, Lynne E., Working with narratives in emotion-focused therapy: changing stories, healing lives (2011)

Hebb, Donald, The organization of behavior (1949)

Hegel, Georg Wilhelm Friedrich, Propédeutique philosophique , La philosophie de l'esprit (1830)

Hofstadter, Douglas, Fluid concepts and creative analogies (1995, avec the Fluid Analogies Research Group), Je suis une boucle étrange (2007), L'analogie, cœur de la pensée (2013, avec Emmanuel Sander)

James, William, The principles of psychology (1890)

Kandel, Eric R. & Squire, Larry R., La mémoire : de l'esprit aux molécules (1999)

Kant, Emmanuel, Critique de la raison pure (1781, 1787)

Kauffman, Stuart, The origins of order (1993), At home in the universe (1995)

Keisler, H.Jerome, Fundamentals of Model Theory (1977, dans Handbook of mathematical logic, édité par Jon Barwise)

Lachaux, Jean-Philippe, Le cerveau attentif : contrôle, maîtrise et lâcher-prise (2011)

Laing, Ronald D., Le moi divisé (1959)

Ledoux, Joseph E., Le cerveau des émotions (1996), Neurobiologie de la personnalité (2002)

Leibniz, Gottfried Wilhelm, Discours touchant la méthode de la certitude et l’art d’inventer pour finir les disputes et faire en peu de temps de grands progrès (1688-1690), Nouveaux essais sur l'entendement humain (1705)

Locke, John, Essai sur l'entendement humain (1690)

Lorenz, Konrad, Les fondements de l'éthologie (1981)

Maslow, Abraham, Devenir le meilleur de soi-même : besoins fondamentaux, motivation et personnalité (1954)

Minsky, Marvin, La société de l'esprit (1987), The emotion machine (2006)

Newell, Allen & Simon, Herbert A., Human problem solving (1972)

Pascal, Blaise, De l’esprit géométrique et de l’art de persuader (1657)

Platon, Ménon, Le banquet, Théétète, Le sophiste, Parménide

Popper, Karl R., La logique de la découverte scientifique (1934)

Proust, Marcel, Le temps retrouvé (1927)

Rawls, John, Théorie de la justice (1971)

Rizzolatti, Giacomo & Sinigaglia, Corrado, Les neurones miroirs (2006)

Rogers, Carl R., Client-centered therapy (1951, traduit dans Psychothérapie et relations humaines)

Rumelhart, David E., McClelland James L. & the PDP Research Group, Parallel distributed processing, Explorations in the microstructure of cognition, 1 : Foundations, 2 : Psychological and biological models (1986)

Russell, Bertrand, Les principes des mathématiques (1903, partiellement traduit dans Écrits de logique philosophique)

Russell, Stuart & Norvig, Peter, Artificial intelligence, a modern approach (2010)

Saussure, Ferdinand de, Cours de linguistique générale (1916)

Sextus Empiricus, Contre les professeurs, Esquisses pyrrhoniennes

Shallice, Tim, From neuropsychology to mental structure (1988), The organisation of mind (2011, avec Richard P. Cooper)

Smith, John Maynard, Szathmary, Eörs, Les origines de la vie (1999)

Smullyan, Raymond M., Theory of formal systems (1961)

Spinoza, Baruch, Éthique (1677)

Tarski, Alfred, Le concept de vérité dans les langages formalisés(1933, édité dans Logique, sémantique, métamathématique)

Thorne, Kip S., Blandford, Roger D., Modern classical physics (2017)

Tinbergen, Nikolaas, L'étude de l'instinct (1951)

Turing, Alan, On computable numbers (1936), Computing machinery and intelligence (1950, Mind, vol. 59, n°236)

Voltaire, Candide (1759)

Weber, Max, Essais sur la théorie de la science (1904-1917)

White, Michael, Epston, David, Narrative means to therapeutic ends (1990)

Wigner, Eugene P., The unreasonable effectiveness of mathematics in the natural sciences (1960, Comm. Pure Appl. Math., 13).

Wittgenstein, Ludwig, Recherches philosophiques (1953)

Wolpert, Lewis, Tickle, Cheryll & Martinez Arias, Alfonso, Principles of development (2015)

Young, Jeffrey E., Klosko, Janet S., Je réinvente ma vie (1993), La thérapie des schémas (2003, avec Marjorie E. Weishaar)

Zermelo, Ernst, Investigations in the foundations of set theory (1908)


Science de l'âme ou science de la matière ?

La cognition est la production et l'utilisation de représentations internes qui préparent à l'action.


Un préjugé courant veut qu'une science soit matérialiste pour être vraiment une science, ce qui conduit à récuser l'ancienne définition, aristotélicienne, de la psychologie, la science de l'âme.

Il faut rappeler que ce préjugé, ou d'autres semblables, sur ce que doit être la science, sont des obstacles au développement du savoir scientifique. Pour faire un travail scientifique il n'est ni nécessaire ni souhaitable de se lier les mains par avance avec de tels a priori, il suffit de chercher honnêtement des vérités et leurs preuves. Aucun autre principe n'a priorité devant celui-ci.

La science de l'âme[modifier | modifier le wikicode]

Parler des âmes, c'est d'abord parler de nous-mêmes, de ce que nous sommes, de ce que nous vivons quand nous percevons, imaginons, ressentons, pensons, voulons ou pendant toute autre activité intérieure dont nous prenons conscience. Nous ne savons pas très bien ce qu'est l'âme ni pourquoi elle vit avec un corps, mais nous savons qu'elle est là, et nous pouvons travailler honnêtement pour développer un véritable savoir à son sujet. Il n'en faut pas plus pour justifier cette vénérable expression, science de l'âme.

Le mystère de l'alliance du corps et de l'âme[modifier | modifier le wikicode]

L'alliance de l'âme et du corps est tellement mystérieuse que nous ne savons même pas si nous l'exprimons correctement : faut-il dire que nous sommes des âmes et que nous avons un corps ? Ou que nous sommes des corps ? Habités par une âme ? L'âme est-elle seulement une façon d'être du corps ?

Mais il n'est pas nécessaire de résoudre ces mystères pour progresser dans le savoir.

Une chose est sûre du point de vue de la science empirique, c'est que pour connaître les âmes, nous pouvons et devons observer leurs corps. Étudier des âmes, en tant que scientifique observateur ou expérimentateur, c'est toujours étudier des corps.

La science de la matière est-elle en principe suffisante pour expliquer nos existences d'êtres conscients ? Nous ne savons pas. On peut croire que la conscience émerge à partir de la vie cérébrale, mais nous ne savons pas l'expliquer (Chalmers 1996). Les influx nerveux sont produits par des courants électriques dans les neurones et à travers leurs membranes. Ce sont des courants ioniques très ordinaires. Rien ne suggère qu'ils doivent être les messagers de l'esprit. Et si on tient à une cosmologie strictement matérialiste - seulement des atomes et du vide - il semble que l'Univers devrait être sans âmes. Les atomes n'ont pas besoin des âmes pour être des atomes.

Nous ne savons pas comment la vie du corps fait apparaître celle de l'âme, nous savons seulement qu'une âme a besoin de son corps pour être ce qu'elle est. Toutes les facultés de l'âme dépendent de son corps. Pour voir il faut des yeux, et un cerveau qui interprète les informations visuelles. Pour agir il faut des pieds et des mains, ou d'autres effecteurs, et un cerveau qui les commande. Pour se souvenir, il faut conserver des enregistrements quelque part dans la tête. Les émotions sont des affections du corps autant que de l'âme. La pensée ne pourrait pas exister sans la parole, et donc sans les langues qui la font entendre. Tout se passe comme si les corps donnaient aux âmes les moyens de faire ce qu'elles font. Nous connaissons ce qu'elles sont en comprenant ce qu'elles font avec leur corps. Plus nous en savons sur le corps, tout particulièrement le cerveau, plus nous pouvons comprendre ce qu'elles sont.

La connaissance de soi comme une âme[modifier | modifier le wikicode]

Il n'est pas nécessaire de connaître le fonctionnement de son cerveau, ni même de savoir que nous en avons un, pour se connaître soi-même comme une âme, parce que l'âme est toujours capable de réfléchir : quand on voit, on ne connaît pas seulement l'objet vu, on se connaît aussi soi-même en train de le voir. Quand on le voit, on sait qu'on le voit. Il en va de même pour toutes les activités conscientes. Quand on se souvient, on sait qu'on se souvient. Quand on veut, on sait qu'on veut. On ne peut pas vivre consciemment sans savoir qu'on vit consciemment. Par la réflexion l'âme est informée directement de sa propre activité. Elle ne peut pas être une âme sans se connaître ainsi. Sa nature est d'être en permanence un témoin d'elle-même.

Parce qu'il est naturel et spontané, on croit parfois que le savoir de soi-même acquis par la réflexion n'a pas sa place dans la science. Il serait seulement préscientifique, comme si la science avait besoin de moyens beaucoup plus sophistiqués pour être vraiment la science. Mais c'est se tromper sur la nature de la science. Comment pourrait-on développer un véritable savoir si on renonçait à la réflexion ? On ne pourrait pas faire un seul pas en avant. Même les scientifiques qui affirment que le savoir réflexif n'est pas scientifique n'ont pas pour autant renoncé à la réflexion, sinon ils ne pourraient même plus penser.

La science fait feu de tout bois. Toutes les sources du savoir sont a priori bienvenues. Toutes les pensées, les observations, les principes, les définitions, les hypothèses, les arguments, les raisonnements, les objections, sont accueillis et encouragés, pourvu qu'il s'agisse de chercher honnêtement des vérités et des preuves. L'honnêteté scientifique exige seulement qu'on se soumette volontairement à la critique, pas que l'on renonce à nos facultés naturelles.

La cognition[modifier | modifier le wikicode]

Toutes les facultés de l'âme repose sur sa capacité à produire et utiliser des représentations. Les images visuelles sont des représentations des objets vus. Quand on imagine, on se représente ce qu'on imagine. Quand on veut, on se représente ce qu'on veut. Même quand on ressent, on se représente les êtres qui ont provoqué nos émotions. L'étude des représentations semble donc être un bon point de départ pour étudier les facultés de l'âme. Mais la définition du concept nous laisse sur notre faim, parce que n'importe quoi peut être considéré comme une représentation. Pour être une représentation il suffit de porter des informations, quelle que soit leur nature et la façon dont elles sont portées, sur un autre être. Comme tous les êtres sont toujours porteurs de telles informations, ils peuvent toujours être considérés comme des représentations. Savoir interpréter les signaux qu'ils portent suffit pour qu'ils servent comme représentations. C'est justement ce point qui est essentiel. Les âmes se servent des représentations qu'elles produisent pour agir sur leur environnement et sur elles-mêmes. Mais la capacité à utiliser des représentations n'est pas réservée aux âmes. Les êtres vivants, même les plus simples, et les robots, se servent également de représentations internes pour agir.

La cognition est la production et l'utilisation de représentations internes qui préparent à l'action. Les sciences cognitives sont toutes les disciplines concernées par l'étude de la cognition : psychologie, neurosciences, éthologie, intelligence artificielle, robotique, épistémologie, linguistique ...

L'usage des représentations ne suffit pas pour expliquer l'existence de la conscience - les robots utilisent des représentations sans avoir conscience de ce qu'elles représentent - mais il est quand même fondamental pour connaître les âmes, parce qu'elles ne pourraient pas être ce qu'elles sont si elles ne se servaient pas des représentations qu'elles produisent. Pour exister elles ont justement besoin d'un corps qui les rend capables de produire des représentations qui les préparent à l'action. Une âme se donne des représentations, elle est ce qui se représente, ce qui perçoit et imagine. Chercher l'âme, ou la conscience, dans le cerveau, c'est chercher les représentations qu'elle se donne (Changeux 2002, Shallice & Cooper 2011, Dehaene 2014). Étudier la capacité des corps à produire et utiliser des représentations est donc une bonne approche pour comprendre les facultés de l'âme.

La liaison entre les capteurs et les effecteurs[modifier | modifier le wikicode]

Pour utiliser des représentations, il faut être capable d'agir, il faut être un agent, c'est à dire un corps animé : un être vivant ou un robot. Un agent est toujours un système qui interagit avec son environnement par l'intermédiaire de capteurs et d'effecteurs (Turing 1936, Russell & Norvig 2010).

Les capteurs (les organes sensoriels) sont reliés par un système nerveux (le cerveau, la moelle épinière...) aux effecteurs (les muscles, les glandes excrétrices...) afin de produire un comportement intelligent (Churchland & Sejnowski 1992, Gazzaniga & Ivry 2001).

La perception sensorielle consiste à produire des représentations internes à partir des signaux fournis par les capteurs. Elle prépare à l'action en rendant l'agent capable de s'adapter à son environnement présent. Mais les sens ne sont pas les seules sources des représentations internes. Toutes les formes de perception et d'imagination sont des façons de produire des représentations internes qui préparent à l'action.

Un prochain chapitre présentera un modèle d'administration centralisée sans administrateur central qui explique comment le cerveau nous rend capable d'avoir une volonté autonome, de faire attention, de former des croyances et de contrôler volontairement la perception, l'imagination et la pensée. Il s'agit bien d'une théorie qui explique le fonctionnement de nos cerveaux quand nous sommes conscients, mais elle ne suffit pas pour expliquer l'apparition de la conscience à partir de l'activité cérébrale. L'attention consiste à sélectionner des représentations pour prendre des décisions, mais la sélection à elle seule n'explique pas pourquoi les représentations ainsi sélectionnées deviennent particulièrement conscientes. Un robot aussi peut sélectionner des représentations pour prendre des décisions, sans que cela implique la moindre conscience.


Chapitre suivant >>>


La perception et l'imagination

La perception est l'imagination du présent[modifier | modifier le wikicode]

L'imagination est la production de représentations internes.

La perception sensorielle est une forme de l'imagination, stimulée et guidée par les sens. Les représentations internes sont produites à partir des signaux fournis par les organes sensoriels.

Les représentations de l'environnement présent ne sont pas forcément d'origine sensorielle. Si par exemple je suis dans un endroit familier, je peux me représenter la disposition des lieux même dans l'obscurité. Je sais que divers objets sont présents et où ils sont alors que je ne les perçois pas directement.

De façon générale nos représentations du présent sont issues à la fois d'informations sensorielles et d'informations mémorisées. Par exemple lorsque nous saisissons un objet familier, le geste est préparé de façon à s'adapter au poids de l'objet. Si nous anticipons mal le poids le geste n'est pas adapté. Cela montre que nous avons une représentation interne du poids avant que nous tenions l'objet dans la main. Le poids est donc représenté avant que les capteurs de tension musculaire ne fournissent cette information. On peut dire que le poids a été imaginé, mais on peut aussi dire qu'il a été perçu indirectement à partir de l'image visuelle, grâce à un savoir mémorisé sur le poids ordinaire d'un tel objet.

La perception et l'imagination sont souvent pensées en opposition. Ce qui est perçu est présent, ce qui est imaginé ne l'est pas. Mais cette opposition interdit de parler de l'imagination du présent et de définir la perception comme une forme de l'imagination.

Au sens strict retenu dans ce livre, la perception est seulement l'imagination du présent. Mais on peut aussi définir la perception en un sens plus général et parler de la perception du passé (la remémoration, et plus généralement toute forme d'imagination du passé), du futur (l'anticipation), de l'imaginaire (rêver à des êtres qui n'existent pas) et même des êtres abstraits (le savoir abstrait, mathématique par exemple). Ainsi entendues la perception et l'imagination sont synonymes.

Les associations et les inférences muettes[modifier | modifier le wikicode]

La plupart des représentations internes influencent les actions non directement en commandant les muscles mais indirectement, en participant à la production d'autres représentations. Les représentations internes, sauf peut-être celles qui servent directement à commander les effecteurs, ont toujours pour fonction de produire, modifier ou supprimer d'autres représentations internes, ou au moins de participer à la dynamique de production des représentations internes.

Comme le cerveau est une machine massivement parallèle, une représentation peut exciter ou inhiber de nombreuses autres représentations. C'est pourquoi les représentations sont en général produites en associations. Des représentations qui s'excitent mutuellement sont éveillées simultanément.

Une inférence consiste à passer d'une condition à une conséquence. La conséquence est une représentation produite, inférée, à partir des représentations qui déterminent la condition. Si ces représentations sont verbales, une inférence est une étape d'un raisonnement, mais il n'est pas nécessaire que les représentations soient verbales. La perception procède par inférence muette dès qu'elle relie des conséquences et des conditions.

Une inférence est une sorte particulière d'association. Il faut que le lien d'excitation de la conséquence par la condition soit suffisamment fort pour que la conséquence soit toujours éveillée lorsque la condition l'est.

Les inférences peuvent être enchaînées parce que les conséquences peuvent être elles-mêmes des conditions qui ont des conséquences, et ainsi de suite. Les enchaînements d'inférences muettes ressemblent beaucoup à un raisonnement. La suite des représentations des conditions et de leurs conséquences est semblable à celle de leurs descriptions verbales enchaînées dans un raisonnement.

La perception sensorielle est à la sensation ce que la raison est à l'intuition. Les intuitions viennent spontanément mais il faut raisonner à partir d'elles pour développer le savoir rationnel auquel elles conduisent parfois. De même les sensations sont produites spontanément par les sens mais il faut procéder par inférence, produire de nouvelles représentations internes, pour développer une perception bien informée de l'être perçu. La perception sensorielle est comme un raisonnement sur les sensations.

Les associations et les inférences muettes font qu'il n'y a pas de frontière nette entre la perception sensorielle et l'imagination du présent. Lorsqu'une représentation a été produite par inférence, comme conséquence d'une condition déjà perçue, on peut dire qu'elle est imaginée mais on peut aussi dire qu'elle est perçue indirectement à partir de la perception de la condition.

Imaginer pour simuler les autres âmes[modifier | modifier le wikicode]

L'imagination du passé, du futur et de mondes purement imaginaires est une simulation de la perception et de l'action. Une partie des ressources de la perception est mobilisée pour représenter un environnement qui n'est pas présent, seulement imaginé. On peut ainsi imaginer ce qu'on percevrait, ce qu'on ressentirait et ce qu'on ferait si on était ailleurs, à un autre moment, ou à la place d'un autre (Goldman 2006, Rizzolatti & Sinigaglia 2006).

Simuler la perception consiste à simuler l'activation de nos systèmes de détection. On peut simuler la perception sensorielle et reconstituer partiellement des images ou des impressions d'origine sensorielle, mais l'imagination n'est pas forcément associée à des images sensorielles. Pour imaginer un être dangereux il n'est pas nécessaire de s'en faire une image visuelle, ou d'imaginer sa voix, ou toute autre forme de perception sensorielle simulée, il suffit de simuler l'activation d'un détecteur de danger. On peut s'imaginer à proximité d'un être dangereux même si on ne perçoit rien de lui, sauf qu'il est dangereux.

On connaît l'âme d'abord par l'expérience de soi-même. En se souvenant de tout ce qu'on a vécu, on se reconnaît soi-même comme une âme. Mais on étend sa connaissance, par l'imagination, en se mettant à la place des autres âmes, de toutes les âmes que l'on peut imaginer.

Connaître autrui comme une âme, comme un être qui imagine, qui ressent et qui veut, en se mettant à sa place par l'imagination, permet d'anticiper les conséquences immédiates et les effets à long-terme de nos actes présents sur son comportement.

La perception est conceptuelle[modifier | modifier le wikicode]

Les concepts sont des propriétés ou des relations. Une propriété, ou une qualité, est attribuée à un objet. Une relation est entre plusieurs objets. Lorsqu'une relation est entre deux objets, on peut considérer qu'elle est une propriété du couple. Une relation entre trois objets est une propriété du triplet, et ainsi de suite pour les relations entre davantage d'objets.

La perception attribue automatiquement des concepts aux objets perçus. La perception visuelle attribue des qualités visuelles (couleur, luminosité, texture, forme...) aux objets vus. Il en va de même pour les autres formes de perception sensorielle.

On distingue parfois les représentations iconiques, telles que les images visuelles, et les représentations conceptuelles, qui peuvent être formulées avec des mots. Mais cette distinction n'est pas fondamentale. Une image visuelle attribue des qualités visuelles à tous ses points, elle est donc déjà conceptuelle. Inversement une description verbale telle que bleu-blanc-rouge peut être considérée comme une image du drapeau français, parce que les mots sont alignés comme les parties qu'ils représentent.

Percevoir, c'est déjà concevoir. Percevoir, imaginer et concevoir sont essentiellement la même chose. Il s'agit toujours de produire des représentations internes qui préparent à l'action.

Lorsqu'un être est perçu, il est toujours perçu avec des qualités ou des relations. Un être sans concepts, une sorte de chose en soi, à laquelle on n'attribue aucun concept, ne peut pas être perçu. Les êtres ne viennent jamais complètement nus. Ils sont toujours habillés avec les concepts que la perception leur a attribués (Kant 1787).

Pour qu'un objet soit perçu, il faut au minimum un détecteur qui signale la présence de l'objet. Le signal émis par le détecteur est une représentation interne de l'objet perçu. Il détermine également un concept attribué à l'objet : la qualité d'être détectable par ce détecteur, ou même plus précisément, la qualité de pouvoir déclencher le signal de détection émis par le détecteur. Une détection attribue automatiquement à l'objet détecté la qualité d'être un objet qui peut être ainsi détecté. Le même signal de détection peut servir de représentation de l'objet détecté et en même temps de représentation du concept attribué à cet objet, parce que l'objet est identifié par son concept. Les êtres sont représentés par les concepts qui leur sont attribués. Par exemple « l'arbre dans la cour » est une expression qui se sert du concept d'être un arbre dans la cour pour représenter un arbre.

Un concept est déterminé par l'ensemble des systèmes de détection qui signalent la présence d'un objet en lui attribuant ce concept. Cette définition ne vaut pas seulement pour la perception sensorielle et les concepts empiriques. Elle peut être généralisée parce que toute unité de traitement de l'information peut être considérée comme un système de détection. Une unité de traitement de l'information produit des signaux en sortie à partir de signaux reçus en entrée. Un signal en sortie peut être considéré comme un signal de détection des signaux en entrée qui l'on produit.

Lorsqu'un concept est défini par une série de conditions, qui ensemble sont nécessaires et suffisantes pour le déterminer, un système de détection de la présence du concept est défini du même coup, parce qu'on détecte le concept défini en détectant les conditions qui le définissent.

Lorsqu'un concept est défini par les ressemblances avec un ou plusieurs exemples, détecter le concept consiste à détecter des ressemblances et des différences.

Même un être unique peut être identifié par un concept, dès que nous sommes capables de le percevoir ou de l'imaginer en tant qu'être unique, parce que le percevoir ou l'imaginer requiert un système de détection, et parce qu'un tel système définit un concept. Par exemple je peux avoir le concept d'une personne qui m'est familière parce que je peux la percevoir et la distinguer parmi toutes les autres personnes.

On conçoit souvent les concepts comme des produits du langage. Les concepts sont signifiés par les expressions qui servent à les nommer et ils ne sont pas connus avant d'avoir un nom. Selon l'acception retenue dans ce livre les concepts précèdent le langage. Dès qu'un système de perception est capable de détecter des objets, il leur attribue automatiquement des concepts. Les concepts sont très généralement utilisés par les animaux, qu'ils se servent ou non d'un langage (Gould & Gould 1994). Par exemple tous les animaux capables d'avoir peur attestent par leur comportement qu'ils sont capables de détecter le danger. Le concept de danger est donc une de leurs représentations internes.

Les concepts sont-ils des êtres concrets ?[modifier | modifier le wikicode]

« la Forme se retrouve une et identique en même temps en plusieurs endroits. C'est comme si tu étendais un voile sur plusieurs êtres humains et que tu disais « Le voile reste un en sa totalité, lorsqu'il est étendu sur plusieurs choses. » (Platon, Parménide, 131b, traduit par Luc Brisson)

Les êtres sont concrets lorsqu'ils existent dans l'espace et dans le temps. Les objets perçus directement avec nos sens, ou indirectement par l'intermédiaire d'autres êtres matériels (des systèmes d'observation et de mesure) sont tous concrets. Y a-t-il d'autres modes d'existence ? Y a-t-il des êtres qui ne sont pas concrets ?

Les concepts que nous attribuons aux êtres concrets sont-ils des objets ? Faut-il les considérer comme des êtres ? Et si oui, comme des êtres concrets ? Existent-ils dans l'espace et dans le temps ?

Les êtres, ou les objets, sont tout ce qui peut être perçu, représenté ou pensé. Comme les concepts peuvent être représentés et pensés, ils sont des êtres comme les autres. Mais peut-on percevoir leur présence dans l'espace et dans le temps ?

On peut soutenir que les concepts sont présents à chaque fois que les objets dont ils sont vrais sont présents. L'existence du concept de cheval est simplement celle de tous les chevaux. Les concepts sont manifestés et révélés par l'existence des êtres dont ils sont vrais et ils existent en même temps. Ainsi conçu un concept existe concrètement dès qu'il est vrai d'un être concret.

Plus couramment les concepts sont conçus comme des êtres abstraits. Seuls les êtres qui peuvent être identifiés à un substrat matériel, un corps, sont considérés comme des êtres concrets. Or un concept n'est pas un corps, il peut être vrai de très nombreux êtres concrets, qui ont tous un corps, mais il est différent de chacun d'eux. Un corps ne peut pas prétendre être à lui tout seul un concept qui est vrai de lui, même si c'est un concept qui n'est vrai que de lui, parce que le concept peut être présent dans la tête alors que que le corps est absent, seulement imaginé. Le concept peut demeurer, Socrate, par exemple, alors que le corps qu'il représente a disparu depuis longtemps.

On peut aussi soutenir que les concepts sont présents à chaque fois qu'ils sont conçus, c'est à dire à chaque fois qu'ils sont détectés, ou que cette détection est simulée. L'existence concrète du concept peut être identifiée à celle du signal qui le détecte. Ainsi conçus les concepts existent concrètement dans l'espace et dans le temps, mais pas à la façon des corps, puisqu'ils existent de façon transitoire et dispersée, seulement quand un corps les détecte ou les imagine.

Les schémas[modifier | modifier le wikicode]

Une modélisation simpliste et partiellement fausse de la perception suppose qu'elle est unidirectionnelle. Les informations sont d'abord produites par les détecteurs sensoriels puis synthétisées, par étapes successives, jusqu'aux représentations de haut-niveau, qui déterminent les principaux objets perçus et les principaux concepts qui leur sont attribués. On suppose que les représentations complexes émergent à partir des perceptions élémentaires, comme dans une peinture pointilliste. Une telle dynamique de production des représentations est dite ascendante, ou bottom-up, parce que les signaux sensoriels sont considérés comme des représentations de bas-niveau, tandis que les concepts attribués aux objets complexes sont de haut-niveau. Mais cette modélisation est insuffisante parce qu'elle n'explique pas les effets de préparation à la perception.

Ce qui est perçu n'est pas seulement déterminé par les sens mais aussi par les attentes et les désirs, par les perceptions antérieures, les souvenirs, les préjugés, la culture et le savoir. Les effets d'attente peuvent être si forts qu'il arrive que nous croyons avoir vu ce que nous n'avons pas pu voir, parce que cela n'a pas existé. Nos perceptions ont donc des sources intérieures, elles ne sont pas seulement élaborées à partir des sens. La dynamique des représentations n'est pas seulement ascendante, mais également descendante, top-down. Les système de détection qui reçoivent les informations sensorielles reçoivent aussi des informations de plus haut niveau. Il faut modéliser une sorte de dialogue permanent entre les divers étages de la perception. L'information peut circuler dans toutes les directions, du bas vers le haut, du haut vers le bas, et horizontalement (Hofstadter & FARG 1995). N'importe quelle représentation peut avoir une influence sur la production des autres, quel que soit leur niveau de complexité.

Un schéma, ou un cadre conceptuel, est un système de préconceptions, c'est à dire ce qu'on tient pour vrai avant de l'avoir vérifié. Un schéma détermine les êtres que l'on s'attend à percevoir avec les concepts qu'on croit devoir leur attribuer et les règles d'inférence que l'on croit pouvoir leur appliquer.

Les sensations sont les sources des processus ascendants de la perception, les schémas sont les sources des processus descendants. Ils font partie du fonctionnement normal de la perception. Ils sont nécessaires pour s'adapter rapidement à son environnement, parce que pour agir on n'a souvent pas le temps de tout vérifier.

La connaissance des bons schémas fait toute la différence entre l'expert et le néophyte. Un expert n'a souvent besoin que d'un coup d'œil pour analyser correctement une situation et tirer les conclusions qui s'imposent, parce qu'il connaît déjà les schémas qui permettent de la comprendre et il n'a qu'à vérifier leur adaptation. Un néophyte est submergé par le flot de nouvelles informations, ne sait pas quoi regarder, ne distingue pas l'essentiel du négligeable et se pose rarement les bonnes questions, parce qu'il ne connaît pas les schémas qui lui permettraient d'organiser sa perception de la situation.

Pour comprendre comment les schémas sont utilisés pour contrôler la perception et l'imagination, on a besoin d'un modèle qui explique la volonté, l'attention et la formation des croyances. Il sera présenté dans un prochain chapitre.

L'imagination créatrice[modifier | modifier le wikicode]

Par l'imagination nous pouvons combiner des représentations dans des configurations nouvelles que nous n'avons jamais perçues. Les parties ont été perçues, mais leur assemblage est inventé, il est purement imaginaire, il représente un être fictif, une sorte de chimère. En assemblant des fragments d'images sensorielles, comme un patchwork, nous pouvons créer une image d'un être qui n'existe pas. De même en assemblant des concepts nous pouvons créer des représentations d'êtres qui n'ont jamais existé et qui n'existeront peut-être jamais. Par l'abstraction nous séparons les concepts des réalités qu'ils représentent. Par l'imagination nous les assemblons dans des configurations nouvelles et créons ainsi des fictions. L'imagination et l'abstraction sont créatrices. Par séparation et composition nous pouvons inventer toutes les possibilités conceptuelles que nous voulons. Nous découvrons ainsi la richesse des concepts et la liberté créatrice qu'ils nous donnent.

Toutes ces fictions de l'imagination sont en principe parfaitement connaissables, parce qu'elles ne sont rien de plus que des êtres imaginés. Nous connaissons nos fictions simplement en nous connaissant nous-mêmes, en tant qu'êtres qui imaginent.

On peut dire des représentations des êtres fictifs qu'elles sont toujours fausses ou toujours vraies. Elles sont toujours fausses parce que pour être vraie une représentation doit représenter ce qui existe vraiment. Elles sont toujours vraies parce qu'elles font exister les êtres fictifs en tant qu'objets de l'imagination ou de la pensée et qu'en affirmant leur vérité on dit seulement que les objets sont ainsi représentés ou pensés. Les êtres imaginaires existent en tant qu'objets de l'imagination, tout simplement parce qu'il est vrai que nous les imaginons. Les représentations des êtres fictifs sont automatiquement vraies parce qu'elles définissent les êtres dont elles sont vraies.

L'importance des représentations du présent et du futur pour la préparation de l'action est évidente, celle des représentations du passé l'est un peu moins. La remémoration nous prépare à l'action indirectement, ne serait-ce qu'en nous aidant à percevoir le présent et le futur, par inférence à partir de la connaissance du passé. Mais l'imagination des fictions, comment peut-elle préparer à l'action ? Il semble qu'elle nous en éloigne. Pour bien agir il faut avoir les pieds sur terre, il faut s'adapter à ce qui existe réellement. A quoi bon imaginer des êtres qui n'existent pas ?

Les buts que nous nous fixons commencent par n'être que des fictions. Ils n'existeront réellement que si nous les atteignons. De cette façon les fictions nous préparent à l'action en tant qu'anticipations de tout ce que nous pourrions faire. Nous découvrons nos capacités par l'imagination. Mais nous imaginons également des êtres qui n'existeront jamais, des fictions qui ne seront jamais des buts de l'action, des êtres purement imaginaires et qui le resteront.

Le travail du romancier est semblable à celui du mathématicien. Il pose des conditions, une situation initiale et des contraintes, puis il expose leurs conséquences, souvent inéluctables, de la même façon qu'un mathématicien démontre des théorèmes à partir d'axiomes et d'hypothèses. Quand nous imaginons des fictions, nous pouvons utiliser pleinement nos capacités à inférer. Il ne s'agit pas seulement d'inventer des assemblages de représentations, il s'agit surtout d'imaginer tout ce qui en résulte, tout ce que notre dynamique intérieure de production de représentations par inférence peut fournir à partir de ces inventions. De cette façon l'imagination des fictions est une exploration de soi-même. Nous découvrons nos capacités de connaissance par inférence.

Toute connaissance d'un être peut aider à connaître ceux qui lui sont semblables, parce qu'une partie de ce qui est vrai de lui est également vrai des autres. Comme les fictions sont toujours plus ou moins semblables à des êtres réels, elles peuvent servir à les connaître. En imaginant des fictions, nous pouvons exercer et développer nos facultés de représentation et d'inférence sur des êtres typiques, fictifs mais suffisamment semblables à certaines réalités pour servir à la connaissance du réel.

La réflexion[modifier | modifier le wikicode]

Pour se préparer à l'action, connaître son environnement ne suffit pas, il faut aussi se connaître soi-même, ne serait-ce que pour connaître sa position et ses capacités.

La perception de son propre corps peut être considérée comme une sorte de perception de soi-même. Par exemple les informations fournies par les capteurs de tension musculaire permettent de construire un modèle interne du corps, de la position des membres et des efforts auxquels ils sont soumis.

Mais la connaissance de soi-même est plus que la perception de son corps, parce que l'âme est en permanence un témoin d'elle-même.

Si je vois que le ciel est bleu, je suis pas seulement informé sur l'état du ciel, je suis également informé sur moi-même, à savoir que je vois le ciel, je me connais moi-même en tant qu'être qui perçoit le ciel.

La réflexion est la connaissance de soi-même en tant qu'âme, c'est à dire en tant qu'être qui perçoit, imagine, ressent et veut.

La réflexion requiert-elle des organes sensoriels ? Y a-t-il une interface sensorielle entre le moi perçu et le moi qui perçoit ? Lorsque je sais que je vois le ciel, est-ce un œil introspectif qui me montre que je vois le ciel ?

Un organe sensoriel est toujours une interface entre un intérieur, le système nerveux, et un extérieur, l'environnement au delà de la peau ou le milieu intérieur en deçà. Les signaux extérieurs sont reçus par l'interface sensorielle et traduits en signaux intérieurs, utilisables par le système nerveux.

La réflexion ne requiert pas d'organe sensoriel parce qu'il n'y a pas de signaux extérieurs à traduire en signaux intérieurs, pas de séparation entre un moi qui perçoit et un moi perçu. Tout se passe à l'intérieur. Toutes les informations sur l'agent, en tant qu'il perçoit, qu'il imagine, qu'il ressent ou qu'il veut, sont déjà présentes à l'intérieur de l'agent. Pour développer ses facultés de réflexion il lui suffit d'exploiter ces sources intérieures d'information. Un organe sensoriel de réflexion n'est pas nécessaire parce que les informations recherchées sont déjà présentes à l'intérieur.

Pour se connaître soi-même il faut se percevoir soi-même, donc se représenter soi-même. Mais où trouve-t-on ce moi que l'on doit percevoir ? Et comment fait-il pour se représenter lui-même ?

La Joconde n'est pas seulement une représentation de Mona Lisa, elle est aussi une représentation de Léonard de Vinci, parce qu'elle porte beaucoup d'informations sur lui. Mes représentations n'apporte pas que des informations sur les êtres représentés, elles peuvent aussi en dire beaucoup sur ma façon de les représenter, et donc sur moi. Elles sont donc aussi des représentations de moi. Mes représentations du monde ne font pas que représenter le monde, elles représentent aussi le moi. On se connaît soi-même en connaissant sa relation à l'être qu'on se représente. Quand on se souvient, on sait qu'il s'agit d'une représentation du passé et on se connaît ainsi soi-même en tant qu'être qui se souvient.

La réflexion permet de développer un savoir muet sur le savoir, parce qu'on connaît le savoir en se connaissant soi-même comme un être qui sait.

La réflexion est fondamentale pour développer l'intelligence. Par exemple, un agent peut souvent imaginer comment agir avant d'agir. Dès qu'il anticipe correctement les résultats des actions qu'il pourrait entreprendre il se rend capable de les atteindre. En se connaissant lui-même comme un être qui imagine, donc en réfléchissant à ses capacités, il découvre comment les développer. Réfléchir à nos capacités nous rend capable.

La nature de la matière et la vérité de la perception[modifier | modifier le wikicode]

Lorsque nous percevons un objet avec nos sens nous croyons le connaître ainsi. Par exemple, si nous voyons que le mur est jaune, nous croyons naturellement qu'il est vraiment jaune. Mais n'est-ce pas une erreur ? Tout ce que nous savons c'est que nos yeux nous donnent une sensation de jaune. Le jaune semble être sur le mur mais il est surtout sur nos yeux. Il se pourrait même que le mur n'existe pas, que nous ayons seulement l'illusion d'un mur jaune. Faut-il en conclure que nous ne connaissons jamais le monde extérieur, que nous pouvons seulement connaître nos sensations et nous-mêmes, que la perception est toujours introspective ?

La nature de la matière est d'interagir avec la matière. Les propriétés d'un morceau de matière (particule élémentaire, atome, molécule, matériau solide, liquide ou gazeux...) sont toujours déterminées par ses façons d'interagir avec les autres morceaux de matière. La matière fait toujours ça, interagir avec la matière, et rien d'autre. Il n'y a rien de plus à connaître sur la matière que ses interactions. Quand on sait comment des êtres matériels interagissent, on sait tout ce qu'il y a à savoir sur eux.

On est sensible à un être quand il agit sur nos sens. Nos organes sensoriels sont spécialisés pour subir l'action des objets extérieurs. Ils ne suffisent pas pour connaître tous les êtres matériels et toutes leurs interactions, mais ils apportent tout de même beaucoup d'informations très utiles. Les instruments d'observation et de mesure, et tous les systèmes de détection que nous pouvons construire, sont comme des prothèses sensorielles. Ils étendent le champ de la perception. Ils nous font connaître des êtres matériels auxquels les sens ne sont pas directement sensibles. Ils nous révèlent d'autres formes d'action et de sensibilité.

La matière peut toujours être détectée parce que sa nature est d'interagir. Dès qu'elle agit sur un autre morceau de matière, celui-ci est un détecteur. Nos sens, complétés par tous les systèmes de détection concevables, nous permettent donc en principe de connaître tous les êtres matériels et toutes leurs propriétés. Rien ne peut rester caché. Tout peut être perçu, parce que la nature de la matière est d'être perceptible (Dugnolle 2017).

Le mur est vraiment jaune simplement parce qu'il est capable d'exciter la sensation de jaune sur nos yeux, ou sur tout autre détecteur sensible à la lumière jaune. Plus généralement toutes les qualités et toutes les relations qui déterminent l'existence d'un être matériel sont détectables par d'autres êtres matériels. Nous n'avons donc pas à craindre que la perception nous prive malicieusement de ce qu'elle semble nous donner, des représentations vraies des êtres perçus.

Mais cet argument en faveur de la vérité des perceptions semble prouver beaucoup trop, puisqu'il suggère que toutes les perceptions devraient être vraies. Si la qualité détectée est toujours la qualité d'être détectable ainsi, il s'en suit que toute détection est vraie, puisque ce qui est détecté est nécessairement détectable. Comment les fausses perceptions peuvent-elles alors exister ?

La possibilité de la fausseté vient de l'existence d'une norme de vérité. Si un instrument de mesure n'a pas été correctement étalonné, il fournit un résultat faux. Le résultat est faux seulement par référence à l'étalon de mesure. Il en va de même pour la perception. Elles ne peuvent être fausses que s'il y a une norme qui détermine ce qui doit être perçu. En l'absence de norme, elles sont toujours vraies, parce qu'elles révèlent toujours l'effet de l'objet sur nos sens. Même une perception fausse révèle une vérité sur l'objet, parce qu'il est vrai qu'il peut être ainsi perçu.

Chapitre suivant >>>


L'instinct, l'apprentissage et la mémoire

Qu'est-ce que l'apprentissage ?[modifier | modifier le wikicode]

Un agent a un savoir-faire lorsqu'il est capable de s'adapter à son environnement pour atteindre ses fins. Un savoir-faire est un comportement intelligent, ou une capacité à se comporter intelligemment.

Un savoir-faire est instinctif lorsqu'il est commun à tous les individus d'une même espèce et qu'il fait partie de leurs traits phylogénétiques, c'est à dire qu'il est transmis par une hérédité biologique commune (Lorenz 1981, Tinbergen 1951). Un tel savoir-faire apparaît naturellement au cours du développement normal des individus de l'espèce. C'est un savoir inné, même s'il se manifeste seulement longtemps après la naissance.

Pour qu'un savoir soit appris il faut que son acquisition passe par la mémorisation des expériences. Pour que les animaux soient capables d'apprendre il faut que leurs systèmes nerveux sont capables de conserver des traces de ce qu'ils ont vécu. Ce critère ne suffit pas pour distinguer l'appris de l'instinctif, parce qu'à peu près tous les comportements instinctifs apparaissent à la suite d'une période de maturation cérébrale, pendant laquelle l'expérience détermine la constitution des circuits neuronaux. La régulation des battements du cœur, par exemple, est instinctive, mais l'expérience des premiers battements est cruciale pour le développement ultérieur des réseaux de neurones qui les réguleront. De façon générale le développement du système nerveux est épigénétique, c'est à dire qu'il n'est pas déterminé seulement par les gènes mais aussi et surtout par l'expérience. En particulier, les synapses peuvent être modifiées par les signaux qu'elles transmettent. De cette façon une expérience de stimulation d'un réseau peut être déterminante pour son développement ultérieur. De même qu'en forgeant on devient forgeron, on devient capable de vivre en vivant.

Pour comprendre la différence entre l'inné et l'acquis, il faut considérer les différences de comportement. Celles-ci ont parfois une explication génétique, parce qu'il y a de petites différences génétiques entre les individus d'une même espèce. Mais le plus souvent les différences de comportement sont causées seulement, ou surtout, par des différences d'expérience. Nous disons alors qu'elles sont acquises ou apprises. Un comportement est appris lorsque ses particularités dépendent des particularités de l'expérience antérieure et non d'un héritage génétique. Pour nous les comportements appris sont les plus importants, parce que nos facultés naturelles et nos talents particuliers ne sont rien si nous n'apprenons pas à les développer.

L'instinct d'apprendre[modifier | modifier le wikicode]

Les facultés animales d'apprentissage sont elles-mêmes d'origine instinctive. Le savoir-apprendre est un savoir-faire et pour qu'il y ait apprentissage il faut qu'il y ait au préalable un savoir-apprendre instinctif. Nous pouvons apprendre à apprendre et donc acquérir du savoir-apprendre, mais nous ne pourrions pas apprendre si nous n'avions pas naturellement la capacité d'apprendre. Cet instinct d'apprendre repose sur la capacité des systèmes nerveux à profiter de leur expérience pour orienter leur développement.

La plasticité neuronale[modifier | modifier le wikicode]

Pour qu'il y ait mémorisation il faut un matériau plastique, c'est à dire capable de conserver des traces de son expérience (plastique s'oppose ici à élastique : un matériau élastique ne conserve pas de traces des déformations qu'il subit). Il semble que la plasticité des neurones est surtout celles de leurs synapses. L'expérience de transmission des signaux peut renforcer ou affaiblir une synapse (Kandel 1999). Elle peut également conduire à la formation d'autres synapses voisines qui connectent les mêmes neurones. De cette façon l'expérience des neurones modifie leur connectivité. De nouveaux réseaux peuvent être formés et de nouvelles fonctionnalités peuvent apparaître. Dans le même temps de nombreux neurones disparaissent, vraisemblablement parce qu'ils n'ont pas fait les preuves de leur utilité, parce que leurs synapses n'ont pas été renforcées par l'expérience.

Donald Hebb a proposé une règle simple qui explique de nombreux apprentissages neuronaux : deux neurones connectés renforcent leur connexion lorsqu'ils sont excités ensemble. C'est une sorte de renforcement par la réussite : lorsqu'un neurone A transmet un signal d'excitation à un autre neurone B, il n'est pas sûr de réussir. L'excitation de A à elle-seule n'est pas forcément suffisante pour déclencher l'excitation de B. Souvent il faut plusieurs signaux d'excitation en provenance d'autres neurones que A pour que B soit excité. La règle de Hebb énonce qu'une synapse d'un neurone excitateur est récompensée par la réussite. Elle est renforcée lorsque le neurone visé est vraiment excité.

Le développement des instincts[modifier | modifier le wikicode]

Pour qu'il y ait un savoir-faire il faut qu'il y ait un réseau de neurones fonctionnel, c'est à dire capable de se servir des signaux de la perception pour donner les signaux d'action appropriés. Le savoir-faire instinctif n'est pas appris, mais il est tout de même acquis, au sens où il apparaît au cours du développement naturel de l'individu. Comment les gènes peuvent-ils contrôler le développement d'un réseau de neurones fonctionnel ?

Le mystère du contrôle génétique du développement de l'organisme et de son système nerveux est partiellement élucidé : les gènes contrôlent le métabolisme (la synthèse et la dégradation des molécules de l'organisme) par l'intermédiaire de la synthèse des ARN et des protéines. La différenciation cellulaire dépend de l'activation de gènes particuliers qui synthétisent des protéines spécifiques au type cellulaire. Les gènes contrôlent la différenciation cellulaire en contrôlant la synthèse des ARN ou des protéines qui activent ou inhibent des gènes. Les propriétés des cellules et leurs interactions dépendent de leur type cellulaire. Les gènes peuvent ainsi contrôler la prolifération, la différenciation et la migration de toutes les cellules de l'organisme lors de son développement (Wolpert, Tickle & Martinez 2015). Pour les cellules nerveuses, ils peuvent aussi déterminer la migration des terminaisons de leurs axones et construire ainsi des réseaux de neurones. Mais ils ne contrôlent ainsi que le plan d'ensemble du système. La structure fine des connexions entre neurones est épigénétique, elle dépend de l'expérience. Là encore les gènes peuvent exercer une influence sur le développement, parce que la plasticité des synapses, la façon dont elles réagissent aux divers signaux qu'elles reçoivent, peut varier en fonction du type cellulaire.

La mémoire procédurale[modifier | modifier le wikicode]

La mémoire procédurale est la mémoire d'un savoir-faire appris. L'apprentissage d'un savoir-faire consiste à construire un réseau de neurones fonctionnel. Tant que le réseau est conservé, et qu'il reste fonctionnel, le savoir-faire est conservé. La mémoire procédurale est donc la conservation des réseaux de neurones fonctionnels construits par un apprentissage.

Un modèle neuronal pour la mémoire épisodique : les zones de convergence-divergence[modifier | modifier le wikicode]

La mémoire épisodique est la mémoire des souvenirs. Quand on se souvient on simule par l'imagination une expérience qu'on a déjà vécue. Comment un réseau de neurones peut-il accomplir une telle performance, enregistrer une expérience, la conserver et la reproduire par l'imagination ?

Une zone de convergence-divergence (ZCD) est un réseau de neurones, qui reçoit des projections convergentes en provenance des sites dont l'activité doit être mémorisée, et qui renvoie des projections divergentes vers ces mêmes sites (Damasio 1989, 2009). Lorsqu'une expérience est mémorisée, les signaux qui convergent sur la ZCD y excitent des neurones qui renforcent alors leurs connexions réciproques, en suivant la règle de Hebb, et forment ainsi un réseau auto-excitateur. Il suffit alors d'exciter à nouveau le réseau ainsi formé pour reproduire la combinaison de signaux initialement reçus. Dans un réseau auto-excitateur l'excitation d'une partie se propage à toutes les autres. De même un fragment de souvenir suffit pour réveiller l'intégralité d'une expérience mémorisée (Proust 1927). Une ZCD peut être ainsi un lieu d'enregistrement et de reproduction des souvenirs.

En plus des voies convergentes-divergentes, une ZCD peut être connectée au reste du cerveau de toutes les façons imaginables, par des signaux en entrée qui l'activent ou l'inhibent, et des signaux en sortie avec lesquels elle fait son effet sur le reste du système. En particulier les ZCD peuvent s'organiser en une arborescence. Une ZCD peut recruter en entrée des voies convergentes issues de nombreuses autres ZCD. Elle peut ainsi faire une synthèse des capacités de détection et de production de toutes les ZCD ainsi recrutées.

Pour faire un modèle du système des ZCD, on distingue dans le système nerveux une partie périphérique et une partie centrale. La périphérie réunit les régions dédiées à la perception, à l'émotion et à l'action. L'arborescence des ZCD est organisée d'une façon hiérarchique, de la périphérie vers le centre. Les ZCD les plus périphériques ont des voies convergente issues directement de la périphérie. On se rapproche du centre en remontant les arborescences de ZCD. On peut songer à des racines qui plongent dans la terre, la périphérie, et qui se rapprochent de la base du tronc, le centre. Mais dans le cerveau, il y a de très nombreux centres. Les ZCD les plus centrales ont des voies convergentes issues d'autres ZCD, et ne sont pas recrutées par des ZCD plus centrales. Le souvenir d'un épisode de notre vie pourrait être conservé par une telle ZCD centrale. Lorsque nous revivons les perceptions, les émotions et les actions d'une expérience passée, l'excitation de cette ZCD centrale activerait toutes les ZCD subordonnées, jusqu'aux aires périphériques, et simulerait ainsi l'expérience préalablement vécue.

Apprendre à percevoir[modifier | modifier le wikicode]

La perception est évidemment nécessaire pour agir sur le présent. Mais son effet ne s'arrête pas aux actions sur l'environnement perçu, parce que nous apprenons en permanence à partir de ce que nous percevons ou imaginons. Chaque expérience, réelle ou imaginaire, peut modifier nos façons de percevoir et d'imaginer.

Les réseaux de neurones dédiés à la perception de bas niveau, proche des organes sensoriels, sont vraisemblablement peu modifiables par l'expérience, dès qu'ils ont fini leur période de maturation initiale. Une fois qu'ils sont fonctionnels, ils ne doivent plus être modifiés, ou seulement un peu, parce qu'ils sont devenus nécessaires à l'accomplissement des fonctions de niveau supérieur. Si on modifie un réseau de bas niveau, on risque de perturber tous les réseaux de niveau supérieur qui se servent de lui.

Les agitations intérieures ressemblent parfois un peu aux mouvements d'un fluide, comme s'il y avait des forces de pression qui nous poussent à pervevoir, ou à imaginer. Pour expliquer comment nos expériences nous transforment on peut alors songer à la façon dont une rivière creuse son lit, au modelage des dunes par le vent, et plus généralement aux façons dont l'air, l'eau, ou tout autre fluide, peuvent modifier les solides au contact desquels ils s'écoulent. Les influx nerveux sont comme des courants fluides, les réseaux de neurones sont comme des canalisations dans lesquels ils s'écoulent et qu'ils peuvent creuser, élargir ou obstruer. Bien sûr ce n'est qu'une analogie. Les influx nerveux sont des courants électriques dans les neurones et à travers leurs membranes. Ils "creusent leur lit" dans les réseaux principalement en agissant sur leurs synapses.

Ce modèle de mémorisation fluide, où les influx nerveux peuvent modifier en permanence les voies dans lesquelles ils s'écoulent, ne peut pas suffire pour expliquer comment nous sommes transformés par nos expériences, parce qu'il donne une trop grande importance à l'oubli. Chaque nouvelle expérience pourrait effacer les traces laissées par les anciennes. Les souvenirs seraient comme des traces sur le sable d'une plage balayée par les vagues.

Notre mémoire fonctionne souvent d'une façon accumulative. Les souvenirs, les compétences et toutes les informations mémorisées sont acquis et conservés indépendamment les uns des autres. En général les nouveaux items mémorisés n'effacent pas les plus anciens. Comment les cerveaux développent de telles facultés de mémorisation est assez mystérieux. Les ZCD, qui requièrent au minimum la constitution d'un nouveau réseau, avec des neurones jusque là inutilisés, pour chaque nouvel item mémorisé, sont probablement une partie de l'explication, mais seulement une partie.

Nous apprenons à percevoir et à imaginer en apprenant à faire des inférences muettes à partir des informations fournies par les sens. Quand on mémorise une inférence muette, on retient une combinaison entre une condition et une conséquence. Pour cela il suffit en principe de conserver une liaison excitatrice entre le réseau qui représente la condition et celui qui représente la conséquence. Comme nos facultés d'inférence se développent d'une façon cumulative, il faut supposer que nos cerveaux savent construire de telles liaisons sans modifier les anciennes, qu'ils ont une mémoire qui ressemble parfois à celle des ordinateurs, où les liaisons entre les conditions, c'est à dire les adresses en mémoire, et les conséquences, les contenus conservés à ces adresses, sont apprises d'une façon cumulative.

Une expérience vécue réunit toujours de très nombreux éléments, d'une façon qui peut sembler parfois très désordonnée. Pour que l'inférence d'une condition à une conséquence soit légitime il ne suffit pas qu'elles aient été réunies lors d'une expérience, parce que leur association pourrait être fortuite. Comment reconnaissons-nous les inférences légitimes, celles qui augmentent vraiment notre savoir ? Par exemple de nombreux animaux savent identifier la cause de leur malaise s'ils ont ingéré un mauvaise nourriture. Qu'ils évitent d'en manger à nouveau montre qu'ils ont identifié correctement la source de leur souffrance. Mais comment font-ils ? De nombreuses autres perceptions ont précédé leur malaise. Pourquoi sélectionnent-ils comme cause précisément la nourriture et non les autres perceptions qui faisaient elles aussi partie de la même expérience ?

La perception ne s'arrête pas à la sensation. Elle construit des modèles de la réalité qui vont au delà du savoir fourni directement par les sens et qui guident l'identification des relations de condition à conséquence. Par exemple, nous reconnaissons les objets solides et leur attribuons spontanément des qualités de permanence. Nous savons qu'ils ne disparaissent pas et que leur forme reste inchangée, tant qu'il n'y a pas de cause capable de les faire disparaître ou de les déformer. Cette connaissance de la solidité est une source inépuisable d'inférences muettes, avec lesquelles nous connaissons le futur, le présent qui n'est pas perçu par les sens, et le passé qu'on n'a pas vécu. De façon générale nous savons naturellement percevoir des qualités de permanence, des relations de causalité, ou d'autres qualités et relations qui conduisent à des inférences légitimes. Nous savons naturellement identifier des causes et des effets, nous savons reconnaître ce qui agit et ce qui subit, nous percevons des traces et des signes annonciateurs... De telles facultés de perception alliées à la mémoire épisodique permettent de développer l'imagination déductive.

Nous savons instinctivement percevoir la causalité, ou d'autres qualités et relations qui conduisent à des inférences légitimes, seulement dans des cas simples, comme la solidité, l'action par contact ou la nourriture comme cause de malaise. De façon générale, l'identification correcte des inférences légitimes est un problème très difficile que notre savoir instinctif n'est pas capable de résoudre à lui seul. De fait nous sommes naturellement portés à percevoir des relations causales là où il n'y en a pas. Toutes les formes de superstition et de divagation montrent que nos facultés naturelles de perception de la causalité sont d'une fiabilité très limitée.

Le chapitre suivant montrera que nous pouvons choisir volontairement les inférences que nous appliquons pour interpréter nos perceptions. Nous pouvons nous servir de notre volonté pour apprendre à percevoir.


Chapitre suivant >>>


Les émotions, la volonté et l'attention

Les modules du cerveau et les comportements routiniers[modifier | modifier le wikicode]

Un module cérébral est un réseau de neurones spécialisé dans certaines tâches de traitement de l'information. Il a des voies d'entrée, où il reçoit des informations et des ordres, et des voies de sortie, où il émet lui-même des informations et des ordres. Il peut être très localisé (un petit noyau de neurones, une micro-colonne corticale...) ou assez étendu (un vaste réseau réparti sur plusieurs régions cérébrales). Il a des compétences qui lui sont propres et un mode de fonctionnement partiellement autonome.

L'activité cérébrale dans son ensemble résulte de l'activité coordonnée de tous les modules. Ils échangent des informations et des ordres et produisent ainsi toutes les représentations internes qui préparent l'action et tous les signaux qui la déclenchent et la contrôlent.

Un module cérébral peut être conçu comme un pilote automatique. Les pilotes les plus subordonnés sont les plus périphériques, les réseaux de neurones qui commandent les muscles et le reste du corps. Ces modules subordonnés sont commandés par d'autres modules, et ainsi de suite. Un module cérébral a toujours une compétence assez limitée. Il n'a accès qu'à une petite partie des informations disponibles dans le cerveau, et le répertoire des tâches qu'il peut accomplir est également limité. Mais les modules de niveau supérieur, c'est à dire ceux qui commandent au plus haut niveau les autres modules, sont capables en principe de mobiliser toutes les ressources du corps et de son cerveau. Un tel module est une sorte de chef dans le cerveau, un pilote automatique qui pilote les autres pilotes automatiques.

Un module peut représenter ses propres fins, donner des informations et des ordres aux autres modules, ou en recevoir, et participer ainsi au bon fonctionnement de l'organisme. L'activité spontanée des modules suffit pour expliquer les comportements routiniers qui résultent des instincts ou de l'apprentissage. Les ressources nécessaires sont recrutées automatiquement et accomplissent leurs tâches comme elles en ont l'habitude. Il peut y avoir un chef qui dirige provisoirement la marche de l'ensemble, ou plusieurs, ou aucun, parce que les modules peuvent travailler séparément et coordonner spontanément leurs activités.

Les émotions[modifier | modifier le wikicode]

Le concept d'émotion est difficile à définir et son usage est souvent très imprécis. Faut-il distinguer les humeurs et les émotions, les humeurs parce qu'elles sont durables, les émotions parce qu'elles sont brèves ? La tranquillité est-elle une émotion ou une indépendance vis à vis des émotions ? La jalousie est-elle une émotion ou un état plus complexe qui mêle émotions et volonté ?

On peut définir les émotions à partir de quelques émotions de base (la tristesse, la peur, la colère, le dégoût, la honte, la joie, l'apaisement, la fierté, la surprise...) et inclure toutes les variations et les combinaisons, ou à partir de quelques caractères généraux :

  • Une émotion est déclenchée par la détection de conditions spécifiques, la peur par la détection du danger, la tristesse par la détection du malheur, la colère par la détection de l'inacceptable...
  • Cette détection est suivie très rapidement de réactions réflexes et de modifications physiologiques qui permettent à l'organisme de s'adapter à la nouveauté de sa situation.
  • Les émotions déterminent des motivations, c'est à dire des désirs ou des aversions. Elles nous indiquent les buts qui méritent d'être poursuivis, et ce que nous devons fuir ou éviter (Damasio 1994). Elles sont donc très importantes pour la volonté, parce qu'elles nous servent à évaluer nos projets, et pour l'apprentissage, parce qu'elles signalent ce qui mérite d'être mémorisé.

Parce qu'elle est déclenchée par des conditions spécifiques et parce qu'elle provoque des réactions spécifiques, une émotion particulière, telle que la peur, peut être caractérisée par l'activité d'un module cérébral, ou d'un système de modules qui coordonnent leurs activités. Les voies d'entrée portent les signaux qui éveillent, modifient ou suppriment l'émotion. Les voies de sortie portent les signaux qui provoquent les réactions émotionnelles typiques (LeDoux 1996). Comme une émotion peut mobiliser une grande partie des ressources de l'organisme, un tel système émotionnel peut être considéré comme une sorte de chef dans le cerveau. Une émotion, surtout si elle est forte, peut exercer une sorte d'empire sur toute l'activité corporelle, intérieure et extérieure.

Émotion et cognition sont parfois pensées en opposition, mais c'est une erreur. Les émotions produisent et utilisent des représentations internes qui préparent à l'action, elles font donc partie de la cognition. Elles sont de précieuses informatrices sur les réalités extérieure et intérieure.

Toutes les émotions de base sont originellement bonnes, parce qu'elles nous aident à vivre. Les circuits cérébraux à l'origine des émotions sont comme tous les organes. S'ils ne nous aidaient pas à survivre et à nous reproduire, ils n'auraient pas été retenus par la sélection naturelle.

La prise de décision et l'autonomie de la volonté[modifier | modifier le wikicode]

Lorsque nous voulons, nous nous représentons consciemment des buts et des façons de les atteindre avant d'avoir agi. Nos comportements et nos actions volontaires sont connus, au moins dans leurs intentions initiales, avant d'être exécutés. C'est pourquoi nous les reconnaissons plus volontiers comme les nôtres que des réactions réflexes ou d'autres comportements involontaires.

La volonté requiert la capacité de se décider sur les buts que l'on poursuit et les règles auxquelles on obéit. Un comportement est volontaire lorsqu'il poursuit des buts que nous avons décidés. Une règle à laquelle on obéit peut être considérée comme une sorte particulière de but. Le but est d'obéir à la règle. Il est atteint tant qu'on obéit.

Pour qu'il y ait véritablement une volonté, la capacité à se représenter les buts que l'on poursuit ne suffit pas, il faut surtout avoir la capacité de se représenter des buts que l'on ne poursuivra pas. Si la décision consiste simplement à suivre toutes les envies qui se présentent, il ne s'agit pas d'une véritable volonté, parce qu'il manque le moment d'indécision où les diverses options sont représentées et évaluées avant d'être choisies ou rejetées. Et la volonté se manifeste souvent davantage par la capacité à renoncer à des buts que par la capacité à les atteindre.

Comme les systèmes émotionnels évaluent les buts sur lesquels nous nous décidons, on peut songer à un modèle de la volonté qui la réduit à un rôle de servante des émotions. La prise de décision volontaire pourrait consister simplement à soumettre un projet aux systèmes émotionnels puis à compter leurs évaluations. Si les avis favorables l'emportent nettement sur les autres alors la décision est prise. La volonté ainsi conçue serait hétéronome, elle ne ferait qu'obéir à une loi extérieure, celle des émotions.

La volonté est autonome lorsqu'elle se donne sa propre loi. Elle est autonome dans ses évaluations lorsqu'elle prend ses décisions à partir de règles ou de critères d'évaluation qu'elle a elle-même décidés.

Les buts sur lesquels nous nous décidons peuvent être suggérés par les systèmes de la perception et de l'émotion indépendamment de tout contrôle volontaire. Dans de tels cas la volonté a seulement à donner son accord pour des projets qu'elle n'a pas élaborés. Tout ce qu'on lui demande est de donner sa signature. Mais nous pouvons aussi décider d'élaborer des projets sur lesquels nous nous déciderons ultérieurement. La volonté est autonome dans son exécution lorsqu'elle décide d'élaborer les projets qu'elle soumettra à ses évaluations.

Un système autonome dans ses évaluations et son exécution est capable de poser et résoudre des problèmes.

La résolution de problèmes[modifier | modifier le wikicode]

Poser un problème consiste à se donner une fin, un but, un objectif. On a résolu le problème quand on a atteint la fin qu'on s'est fixée ou quand on sait comment l'atteindre. La fin recherchée et éventuellement la situation initiale sont les conditions du problème.

Une fin est déterminée avec un système de détection qui permet de reconnaître si la fin est atteinte ou non. Une fin est donc toujours un concept.

Une décision à prendre est un problème. Le but est intérieur. Il s'agit simplement de prendre la décision, adoption ou rejet du projet. Un tel problème de décision est déterminé par le projet examiné et par des critères d'évaluation. La fin recherchée est que ces critères soient satisfaits. Dès que les critères d'évaluation sont bien déterminés, un problème de décision est en principe facile à résoudre. Il suffit de détecter si les critères sont satisfaits. Dans ce cas particulier, il n'y a que deux possibilités à examiner, adoption ou rejet, mais si le nombre de possibilités à examiner est très grand, ou infini, savoir détecter si la fin recherchée est atteinte ou non ne suffit pas pour résoudre le problème, parce qu'on ne peut pas examiner toutes les possibilités.

La solution d'un problème consiste en général à réunir des moyens pour atteindre la fin recherchée. Les possibilités de composer les moyens les uns avec les autres font que l'espace des possibilités de solution est en général a priori illimité. On peut toujours inventer de nouvelles compositions.

Les moyens sont des fins intermédiaires, puisque pour atteindre une fin, il faut d'abord se donner pour but de réunir les moyens.

Un problème est pratique lorsque l'objectif est de transformer la réalité observable. Un problème est cognitif lorsque l'objectif est de produire des représentations. La solution d'un problème pratique est obtenue quand on agit, tandis que la solution d'un problème cognitif est obtenue quand on imagine. Le savoir-résoudre des problèmes cognitifs est une compétence fondamentale, tout simplement parce qu'il faut souvent imaginer ce qu'on va faire avant de le faire.

Poser et résoudre des problèmes cognitifs est une façon d'agir sur soi-même. On ne se donne pas pour but de transformer la réalité extérieure mais seulement de trouver des représentations intérieures.

Quand on doit imaginer ou dire ce qu'on va faire avant d'agir, on remplace un problème pratique par un problème cognitif : trouver une représentation de l'action ou du programme d'actions qui résout le problème pratique initial. Au lieu d'agir on cherche seulement à imaginer l'action. On remplace l'objectif pratique par un objectif cognitif. On peut alors explorer par l'imagination l'espace des possibilités de solution. On peut ainsi résoudre de nombreux problèmes sans quitter son fauteuil. Bien sûr, on a besoin de savoir anticiper afin de déterminer par l'imagination si une séquence d'actions est faisable et si elle permet d'atteindre le but. Lorsque le savoir acquis au préalable est suffisant, l'imagination seule, sans l'action, permet de trouver des solutions. Grâce à l'imagination le savoir déjà acquis est un tremplin pour acquérir davantage de savoir.

L'innovation[modifier | modifier le wikicode]

Les modules cérébraux sont en général spécialisés dans la résolution de problèmes particuliers. Ils peuvent résoudre les problèmes auxquels ils sont naturellement consacrés, des problèmes qu'ils se posent ou qui leur sont posés.

Lorsque leurs comportements sont routiniers, les agents n'ont pas besoin de chercher longtemps des solutions. Ils les trouvent spontanément parce que leurs modules cérébraux savent comment les produire, par instinct ou par habitude. Les agents se contentent de résoudre les problèmes qu'ils savent déjà résoudre. Mais face à une situation nouvelle, les réactions habituelles ne sont pas toujours adaptées. Il se peut que l'agent dispose des ressources intérieures nécessaires pour réagir comme il convient, mais qu'il ne sache pas les mobiliser, parce qu'il lui faudrait pour cela inventer un nouveau mode de coordination entre ses modules cérébraux. Aucun d'entre eux n'a les moyens de recruter les autres, alors qu'il suffirait qu'ils travaillent ensemble pour atteindre les fins recherchées. L'agent aurait besoin d'un compositeur-chef d'orchestre intérieur, capable de trouver des solutions vraiment nouvelles. Le pouvoir de composer est créateur de valeur parce que la valeur de ressources coordonnées peut être supérieure à la somme des valeurs des ressources séparées.

Le hasard suffit pour innover. Un programme d'actions choisies au hasard est en général très innovateur, très différent de ce qui est prescrit par l'instinct ou l'habitude. Mais évidemment le hasard seul est rarement suffisant pour trouver de véritables solutions. Il faut en général du savoir, des compétences, pour concevoir des possibilités prometteuses, et trouver parmi elles celles qui méritent d'être retenues. La connaissance est très généralement un préalable nécessaire à l'innovation.

Pour expliquer nos facultés d'innovation, on est tenté de postuler l'existence de modules innovateurs. Mais cela ressemble à une croyance aux prodiges surnaturels. Comment des réseaux de neurones, même très sophistiqués, pourrait-il inventer tout ce que nous inventons ? Où donc pourrait-il trouver leurs idées ? Il n'y a que des neurones qui s'excitent ou s'inhibent les uns les autres. Il semble qu'il n'y ait rien qui puisse jouer le rôle d'une source pour des idées nouvelles. Comment un réseau de neurones pourrait-il acquérir des connaissances, les conserver, et s'en servir pour trouver des solutions nouvelles à des problèmes nouveaux ?

Des réseaux de neurones assez simples peuvent être dotés de telles facultés. Ils mémorisent des connaissances en modifiant les connexions entre neurones. On peut leur soumettre des problèmes en activant leurs voies d'entrée. Ils produisent des solutions sur leurs voies de sortie. Et ils sont très capables d'innover (David E. Rumelhart, James L. McClelland & PDP Research Group 1986). La conception de réseaux de neurones est une méthode très puissante pour résoudre de très nombreux problèmes.

Une administration centralisée sans administrateur central[modifier | modifier le wikicode]

Pour que les buts et les règles que nous avons décidés volontairement puissent mobiliser nos ressources intérieures, il faut qu'ils soient conservés en mémoire de travail. Certains modules doivent être être spécialisés dans l'enregistrement de nos décisions et la distribution des ordres qui en résultent. La décision mémorisée est utilisée pour envoyer des ordres à tous les modules concernés par l'exécution de cette décision, tant que le but n'est pas atteint, ou qu'on n'a pas renoncé. Les modules qui mémorisent nos décisions volontaires sont des donneurs d'ordres. On peut donc les appeler des modules exécutifs. Les autres modules cérébraux sont subordonnés à ces modules exécutifs.

Les modules exécutifs ne sont pas des innovateurs. Ils se contentent d'enregistrer des décisions prises ailleurs et de distribuer automatiquement les ordres qui les appliquent. Ce ne sont pas des homoncules, ou des petits génies dans la tête, mais seulement des circuits neuronaux capables d'enregistrer les décisions reçues sur leur voies d'entrée, et de donner ensuite les ordres qui les appliquent sur leurs voies de sortie. Il s'agit seulement de traitement de l'information, pas de mettre des esprits dans la machine.

Les décisions volontaires sont prises à partir de l'activité des ressources de la perception et de l'imagination, de l'émotion et de l'action. Certains modules font des propositions, d'autres donnent des évaluations, et finalement ces évaluations sont synthétisées afin qu'une décision soit prise. Tous ces modules obéissent à un ordre intérieur commun, qu'ils contribuent tous à définir. Nos projets volontaires sont proposés, élaborés et évalués par l'ensemble de nos ressources intérieures, et une fois adoptés, ils s'imposent à ces mêmes ressources intérieures, qui doivent obéir aux ordres qui leur sont donnés. Mais il n'y a pas de chef. Les modules exécutifs ne font qu'enregistrer des décisions prises par la collectivité. Eux aussi ne font donc qu'obéir à l'ordre commun. C'est une administration centralisée sans administrateur central.

Les dispositifs d'évaluation à l'origine des décisions obéissent aux modules exécutifs et donc aux décisions prises antérieurement, ce qui rend la volonté autonome dans ses évaluations. Les ressources de la perception et de l'imagination à l'origine des propositions évaluées obéissent elles aussi aux modules exécutifs, ce qui rend la volonté autonome dans son exécution. Ce modèle du fonctionnement cérébral, une administration centralisée sans administrateur central, permet donc d'expliquer l'autonomie de la volonté.

Ce modèle invite à rechercher des analogies entre le fonctionnement du cerveau et les sociétés humaines. Tout ce que nous apprenons sur une société humaine, comment elle s'organise, comment elle est unie et aussi parfois désunie, peut nous apprendre beaucoup sur les cerveaux, comment ils marchent et comment aussi parfois ils ne marchent pas, ou pas très bien. Inversement tout ce que nous comprenons sur notre fonctionnement intérieur, ou sur nos dysfonctionnements, peut nous aider à comprendre les sociétés dans lesquelles nous vivons.

En expliquant l'autonomie de la volonté, le modèle d'administration centralisée sans administrateur central explique pourquoi le moi est comme une boucle étrange (Hofstadter 2007). Je peux décider des critères d'évaluation de mes décisions, parce que la volonté est autonome dans ses évaluations. Je peux aussi décider des objets sur lesquels porteront mes prochaines décisions, parce que la volonté est autonome dans son exécution.

L'attention et la conscience[modifier | modifier le wikicode]

Nos modules exécutifs, responsables de l'application de nos décisions volontaires, sont nécessairement en nombre limité. Leurs ressources en mémoire sont également limitées. C'est pourquoi l'ordre intérieur de buts et de règles qui dirigent notre comportement est d'une complexité limitée. Nous ne pouvons pas faire volontairement trop de choses à la fois.

Les modules exécutifs sont précédés de dispositifs d'évaluation qui modifient et renouvellent en permanence les buts que nous nous fixons. Ces capacités d'évaluation sont également limitées. Nous ne pouvons pas prendre une multitude de décisions en même temps. Chaque proposition doit être examinée à son tour.

L'attention est la sélection des représentations utilisées lors de l'évaluation en vue d'une décision volontaire.

Nous prenons des décisions volontaires plusieurs fois par seconde, à chaque fois que nous réagissons à ce qui attire notre attention. Même ne pas réagir parce qu'une nouvelle information est sans intérêt est une sorte de décision volontaire. Nous approuvons volontairement que l'information est sans intérêt, ce qui est déjà une décision, et en outre nous décidons de ne pas réagir. Toutes les informations dont nous prenons conscience sont toujours utilisées pour prendre des décisions, ne serait-ce que la décision de les ignorer. C'est pourquoi une théorie de l'attention est en même temps une théorie de la conscience.

On fait attention à ce qu'on perçoit, à ce qu'on imagine, à ce qu'on ressent et à ce qu'on fait de très nombreuses façons, parce que les informations sélectionnées peuvent être utilisées de très nombreuses façons. Une information prioritaire dans le processus d'évaluation qui conduit à la décision fait l'objet d'un degré d'attention plus élevé que si elle joue un rôle secondaire. Pour développer la théorie de l'attention et de la conscience, il faut étudier comment les dispositifs d'évaluation qui précèdent la décision volontaire sélectionnent et utilisent leurs sources d'informations.

L'imagination et le contrôle volontaire de l'attention permettent à la volonté de fonctionner en circuit fermé, parce qu'elle peut décider elle-même des informations à partir desquelles elle prend de nouvelles décisions. On peut ainsi être concentré sur ce qu'on imagine et se sentir comme coupé du monde. Mais un tel isolement n'est jamais complet. Un événement inattendu suffit pour nous sortir de notre méditation et capturer notre attention. Les informations sur l'événement inattendu, évaluées en vue d'une décision volontaire, ont été sélectionnées par un processus involontaire (Lachaux 2011). La volonté est autonome et peut décider elle-même de ce qui retient son attention, mais pas au point de se soustraire complètement aux influences extérieures.

Les croyances[modifier | modifier le wikicode]

Nos décisions ne portent pas seulement sur des projets mais aussi sur des croyances. Lorsque les perceptions laissent une place pour le doute, nous pouvons décider de croire ou non ce que nous percevons. Nous pouvons aussi douter de ce que nous imaginons et choisir de ne pas le croire.

Une croyance est une représentation que l'on tient pour vraie après en avoir pris conscience.

Pour devenir une croyance, une représentation doit retenir l'attention. Après avoir été évaluée et approuvée, elle est prise en charge par le système exécutif qui la conserve en mémoire de travail, informe les subordonnés concernés et l'utilise ainsi pour contrôler la perception, l'imagination et leur évaluation.

Tant qu'elle est conservée en mémoire de travail, une croyance est active et peut faire de l'effet, par l'intermédiaire du système exécutif, sur l'ensemble du fonctionnement cérébral. On retrouve ainsi un élément de la théorie cognitive de la conscience de Baars (1988). Tant qu'une représentation ne retient pas l'attention consciente, elle reste attachée à son lieu de production et ne peut pas faire d'effet sur l'ensemble du système. Son effet est nécessairement limité. Mais si on en prend conscience, elle peut être utilisée pour influencer toutes les parties du cerveau contrôlées par le système exécutif. Quand elle est en mémoire de travail elle est comme écrite sur un tableau noir qui peut être lu par les modules cérébraux, elle devient une connaissance utilisable par tous les agents intérieurs subordonnés au système exécutif.

Après être restées actives un moment en mémoire de travail, les croyances sont en général enregistrées et consolidées en mémoire à long terme, où elles demeurent comme des croyances dormantes, ou latentes. Elles sont réveillées si nous nous les remémorons.

Même dormantes les croyances peuvent avoir beaucoup d'effet sur notre activité intérieure, parce que nos remémorations dépendent de toutes nos croyances dormantes. Même si elle n'est pas réactivée, une croyance dormante peut contribuer à l'activation d'une autre croyance, ou au contraire, empêcher cette remémoration.

Une croyance dormante peut être réactivée à notre insu si elle ne retient pas notre attention ou si une autre croyance nous empêche de la lui accorder.

Les associations et les inférences muettes suffisent pour qu'une croyance réactivée nous fasse de l'effet, même si nous lui refusons notre attention. Elle peut activer d'autres croyances et éveiller des émotions sans être prise en charge par le système exécutif, simplement par associations, mais alors elle n'a pas accès aux ressources de la volonté et son effet reste subreptice.

Lorsque nous faisons attention à une croyance, nous pouvons mobiliser toutes les ressources de la volonté pour la modifier, la compléter ou la critiquer, et l'intégrer au système de toutes nos autres croyances. En particulier nous pouvons nous en servir pour former et retenir des inférences, où elle apparaît comme condition, ou comme conséquence. Nous pouvons ainsi nous servir de la conscience pour développer nos facultés d'interprétation, donc pour apprendre à percevoir.

Le simulateur universel[modifier | modifier le wikicode]

Un esprit est capable d'imaginer les autres esprits, c'est à dire qu'il se met à leur place, qu'il simule par l'imagination ce qu'ils perçoivent, ce qu'ils ressentent, ce qu'ils croient et ce qu'ils veulent. Un esprit est un simulateur universel parce qu'il peut simuler tous les autres esprits, au moins s'ils sont dotés des mêmes facultés - pour un être humain il est plus facile de se mettre à la place d'un être humain que d'une chauve-souris.

L'universalité de l'imagination est rendue possible par l'autonomie de la volonté. Pour se mettre à la place d'autrui il suffit d'imaginer qu'on veut ce qu'il veut. On se donne volontairement sa volonté comme si elle était la nôtre.

Le savoir éthique muet[modifier | modifier le wikicode]

Le savoir éthique consiste à évaluer les actions, les comportements et leurs fins.

Pour être intelligent, il ne suffit pas de savoir atteindre des buts, il faut surtout savoir qu'ils méritent d'être poursuivis, ou au moins qu'ils ne sont pas à craindre. L'éthique est donc le savoir le plus important.

Comme les émotions servent à évaluer les actions, elles produisent un savoir éthique. Comme la volonté est autonome dans ses évaluations, elle peut dépasser le savoir éthique purement émotionnel. Le savoir éthique muet est le savoir-évaluer qui résulte des émotions et de la volonté.

Un savoir éthique peut être défini comme le savoir d'un idéal, parce qu'un système d'évaluation détermine un idéal. Est idéal, ou proche de l'idéal, ce qui est évalué positivement. Est contraire à l'idéal ce qui est évalué négativement.

Pour qu'un idéal existe et soit connu, il suffit de le penser comme un idéal, comme un critère d'évaluation de nos actions. Il existe en tant qu'idéal, tout simplement parce qu'il est vrai que nous l'avons adopté.

Pour qu'un savoir éthique soit vrai il suffit que ce qu'il évalue positivement nous satisfasse vraiment et que ce qu'il évalue négativement nous déplaise vraiment. Ainsi conçue la vérité éthique est relative, parce que ce qui satisfait les uns ne satisfait pas forcément les autres. Mais la suite de ce livre montrera que la raison permet de développer un savoir éthique universel.

Le ça, le moi et le surmoi[modifier | modifier le wikicode]

On est un moi quand on est conscient et volontaire, quand on a conscience de ce qu'on perçoit, de ce qu'on imagine, de ce qu'on ressent et de ce qu'on veut. Le modèle d'administration centralisée sans administrateur central explique comment le cerveau fait exister le moi, parce qu'il explique la volonté et l'attention.

Le surmoi est l'idéal du moi, ce qu'il croit devoir être ou ce qu'il voudrait être. Il est construit par le moi qui se donne des critères d'évaluation de lui-même. Il résulte donc de l'autonomie de la volonté. Comme nous devons nous adapter à la société dans laquelle nous vivons, nous construisons notre surmoi en intériorisant les valeurs que la société nous invite à adopter.

La volonté se donne des critères d'évaluation d'elle-même, en décidant des critères d'évaluation de ses décisions. Une telle boucle fait qu'on peut dire à la fois que le moi fait le surmoi et que le surmoi fait le moi.

Le ça est la machine intérieure, tout ce qui en nous est mécanique, ou automatique, et involontaire. L'activité du ça inclut toute l'agitation intérieure, sauf l'activité volontaire. Le ça est pour sa plus grande part inconscient, parce que nous ne pouvons pas avoir conscience de tout ce qui se passe dans le cerveau. Mais il n'est pas complètement inconscient. On peut le comparer à un océan dont on peut observer les vagues mais pas les profondeurs. Si nous portons notre attention sur notre intérieur, sur ce que nous ressentons, percevons, imaginons et désirons, nous pouvons parfois prendre conscience des automatismes qui nous agitent intérieurement (Freud 1923).

Tout ce qui est vivant manifeste toujours le désir de vivre, même lorsqu'il est mécanique, ou automatique. C'est pourquoi on peut aussi comparer le ça à une sorte d'animal intérieur, plutôt qu'à une machine. Mais il ne faut pas le doter d'une volonté unifiée. Seul le moi a les moyens de se donner une telle volonté, en construisant son surmoi.

Si on compare l'organisation psychique à une société humaine, le moi est l'État, l'idéal du moi est l'idéal de l'État tel qu'il est affirmé dans la Constitution et dans toutes les déclarations officielles, le ça est la société civile. Les modules exécutifs sont tous les agents de l'État qui lui permettent d'imposer ses décisions. Les modules concepteurs et évaluateurs sont tous les citoyens, fonctionnaires ou non, qui participent à la conception et à l'évaluation des décisions prises au nom de l'État. Une information dont nous prenons conscience parce qu'elle retient notre attention est une information prise en compte lors de l'évaluation qui conduit aux décisions étatiques. Les informations inconscientes sont celles qui restent ignorées par l'État lors de ses évaluations. Les croyances sont ce que l'État déclare officiellement être vrai.

Comme toute analogie, celle-ci a ses limites. En particulier elle n'est pas très flatteuse pour la société civile, parce que le ça n'est pas toujours très honorable, et qu'on peut espérer que le moi le soit davantage. Mais si on se sert de cette analogie pour dévaloriser la société civile et promouvoir l'État, on n'en fait évidemment pas un bon usage. Pour expliquer les bases cérébrales de l'organisation psychique, elle est une excellente analogie, parce qu'elle nous aide à comprendre l'organisation d'un système très complexe. Mais comme toute théorie, elle peut être interprétée et à tort et à travers.