« Précis d'épistémologie/Principes logiques » : différence entre les versions

Un livre de Wikilivres.
Contenu supprimé Contenu ajouté
Ligne 256 : Ligne 256 :
La loi du tiers-exclu : '''p ou non p'''
La loi du tiers-exclu : '''p ou non p'''


'''p''' est nécessairement vrai ou faux. Il n'y a pas de troisième possibilité.
Un énoncé '''p''' dont la signification est complètement déterminée est nécessairement vrai ou faux. Il n'y a pas de troisième possibilité.


Pour présenter une preuve, il faut toujours préciser les hypothèses dont dépend une conséquence. La règle du décalage vers la droite permet de présenter commodément des preuves formelles : quand on introduit une nouvelle hypothèse on la décale vers la droite. Une conséquence ne dépend que des hypothèse qui la précèdent au dessus d'elle ou sur sa gauche mais pas des hypothèses sur sa droite.
Pour présenter une preuve, il faut toujours préciser les hypothèses dont dépend une conséquence. La règle du décalage vers la droite permet de présenter commodément des preuves formelles : quand on introduit une nouvelle hypothèse on la décale vers la droite. Une conséquence ne dépend que des hypothèse qui la précèdent au dessus d'elle ou sur sa gauche mais pas des hypothèses sur sa droite.

Version du 7 août 2021 à 15:01

Une théorie peut être identifiée à l'ensemble de tous ses principes (axiomes et définitions) ou à l'ensemble de tous ses théorèmes, parce que ses théorèmes sont les conséquences logiques de ses principes.

Les principes logiques déterminent avec précision la relation de conséquence logique. Ils donnent ainsi les moyens de faire toutes les théories. La logique peut même être considérée comme une théorie de toutes les théories. Elle est l'outil le plus fondamental pour tous les théoriciens. Mais elle ne suffit pas pour faire de bonnes théories, parce qu'elle enseigne seulement comment raisonner correctement, et on peut raisonner correctement avec de mauvais principes. La logique montre comment faire toutes les théories, mais à elle seule elle n'apprend pas à reconnaître les bonnes théories.

Un raisonnement est logique lorsque toutes ses affirmations, sauf les prémisses, sont des conséquences logiques évidentes des affirmations qui les précèdent. De cette façon un raisonnement logique prouve que sa conclusion est une conséquence logique de ses prémisses. Les principes logiques sont des règles fondamentales qui déterminent toutes les relations de conséquence logique évidentes, et à partir de là toutes les relations de conséquence logique.

Conséquence et possibilité logiques

La relation de conséquence logique peut être définie à partir de la possibilité logique :

C est une conséquence logique de prémisses P si et seulement s'il n'y a aucun monde logiquement possible tel que C soit fausse et les P soient vraies.

Une conséquence logique ne peut pas être fausse si les prémisses sont vraies. La relation de conséquence logique conduit nécessairement du vrai au vrai.

Pour définir un monde logiquement possible on se donne des propriétés et des relations fondamentales et un ensemble d’individus auxquels on peut attribuer ces propriétés et ces relations. Un énoncé est atomique lorsqu’il affirme une propriété fondamentale d’un individu ou une relation fondamentale entre plusieurs individus. Un énoncé atomique ne peut pas être décomposé en énoncés plus petits. N'importe quel ensemble d'énoncés atomiques détermine un monde logiquement possible pour lequel ils sont tous vrais et les seuls énoncés atomiques vrais (Keisler 1977). Un ensemble d'énoncés atomiques n'est jamais contradictoire parce que les énoncés atomiques ne contiennent pas de négation.

La définition de la relation de conséquence logique à partir du concept de monde logiquement possible permet de justifier rationnellement tous les principes logiques. La définition d'un monde logiquement possible par un ensemble d'énoncés atomiques est donc le fondement de toute la logique.

La vérité des énoncés composés

Les énoncés à propos d'un monde logiquement possible sont composés à partir d'énoncés atomiques avec des connecteurs logiques. Les principaux connecteurs logiques sont la négation non, la disjonction ou, la conjonction et, le conditionnel si alors, le quantificateur universel pour tout x, ou tout x est tel que, et le quantificateur existentiel il existe un x tel que.

Quand un énoncé est composé à partir d'énoncés atomiques avec des connecteurs logiques, sa vérité ne dépend que du monde logiquement possible considéré, parce que la vérité d'un énoncé composé ne dépend alors que de la vérité des énoncés à partir desquels il est composé.

La vérité des énoncés composés avec la négation, la disjonction, la conjonction et le conditionnel est déterminée avec des tables de vérité :

Négation
p non p
Vrai Faux
Faux Vrai


Disjonction
p q p ou q
Vrai Vrai Vrai
Vrai Faux Vrai
Faux Vrai Vrai
Faux Faux Faux
Conjonction
p q p et q
Vrai Vrai Vrai
Vrai Faux Faux
Faux Vrai Faux
Faux Faux Faux
Conditionnel
p q Si p alors q
Vrai Vrai Vrai
Vrai Faux Faux
Faux Vrai Vrai
Faux Faux Vrai

L'expression si alors est entendue couramment avec la signification implicite d'une conséquence nécessaire. Si p alors q veut dire que pour une raison ou pour une autre, q est une conséquence nécessaire de p. La table de vérité du conditionnel lui donne une signification beaucoup plus large : jamais p sans q. Par exemple Si la Terre est immobile alors 2+2=5 est un énoncé vrai, d'après cette table de vérité. Cela veut dire jamais la Terre est immobile sans que 2+2=5. Comme la Terre n'est jamais immobile cet énoncé est toujours vrai.

La vérité des énoncés composés avec les quantificateurs universel et existentiel est déterminée par les deux règles suivantes :

Pour tout x, p(x) est vrai lorsque tous les énoncés p(i) obtenus à partir de p(x) en substituant un nom d'individu i à toutes les occurrences de x dans p(x) sont vrais, et faux sinon.

Il existe un x tel que p(x) est vrai lorsqu'au moins un énoncé p(i) obtenu à partir de p(x) en substituant un nom d'individu i à toutes les occurrences de x dans p(x) est vrai, et faux sinon.

Pour que ces deux règles puissent être appliquées, le domaine des individus avec lesquels on forme des énoncés atomiques doit être déterminé. C'est un problème pour les théories des ensembles, parce qu'on ne peut pas déterminer le domaine de tous les ensembles.

Dans les énoncés Pour tout x, E(x) ou Il existe x tel que E(x) la variable x est liée par le quantificateur Pour tout x ou Il existe un x tel que. Une variable est libre dans un énoncé quand elle n'y est pas liée.

La logique du premier ordre autorise seulement des quantificateurs qui portent sur un domaine d'individus. On peut aussi quantifier sur le domaine de tous les concepts (propriétés et relations) et définir ainsi la logique du deuxième ordre. Mais il suffit de considérer les concepts comme des individus pour reformuler la logique du deuxième ordre dans le cadre de la logique du premier ordre. C'est pourquoi la logique du premier ordre est la plus fondamentale et la seule considérée dans ce chapitre.

La négation, la conjonction, la disjonction, le conditionnel et les quantificateurs existentiel et universel sont les connecteurs logiques les plus fondamentaux. Mais quelques autres ont aussi de l'importance : le biconditionnel si et seulement si, la disjonction exclusive, ou l'alternative, ou bien ou bien, le connecteur de Sheffer ni ni ...

Biconditionnel
p q p si et seulement si q
Vrai Vrai Vrai
Vrai Faux Faux
Faux Vrai Faux
Faux Faux Vrai

Le biconditionnel est d'un usage très courant. En particulier, les définitions sont formulées avec un biconditionnel : l'expression définie est vraie si et seulement si l'expression définissante l'est aussi.

Disjonction exclusive
p q Ou bien p ou bien q
Vrai Vrai Faux
Vrai Faux Vrai
Faux Vrai Vrai
Faux Faux Faux

Pour la distinguer de la disjonction exclusive, la disjonction ordinaire est dite inclusive : p ou q ou les deux.

Non ou (NOR)
p q Ni p ni q
Vrai Vrai Faux
Vrai Faux Faux
Faux Vrai Faux
Faux Faux Vrai

Les règles fondamentales de déduction

Toutes les relations de conséquence logique peuvent être produites avec un petit nombre de règles fondamentales de déduction à partir de conséquences logiques triviales, évidemment tautologiques, qui sont données par la règle de répétition :

Toute prémisse incluse dans une liste P de prémisses est une conséquence logique des prémisses P.

Pour chaque connecteur logique on a deux règles fondamentales de déduction, une règle d'élimination et une règle d'introduction (Gentzen 1934, Fitch 1952). La logique ressemble à un jeu de construction. On compose et on décompose les énoncés en introduisant et en éliminant des connecteurs logiques.

On complète ces règles avec la règle de transitivité des conséquences logiques :

Si C est une conséquence logique des prémisses Q et si toutes les prémisses Q sont des conséquences logiques des prémisses P alors C est une conséquence logique des prémisses P.

Les règles fondamentales de déduction sont intuitivement évidentes, dès qu'on a compris les concepts de conséquence et de possibilité logiques et la détermination de la vérité des énoncés composés à partir de celle des énoncés atomiques. On peut prouver rigoureusement la vérité de ces intuitions, avec la définition de la relation de conséquence logique à partir du concept de monde logiquement possible.

La règle de répétition, la règle de transitivité et les règles fondamentales de déduction peuvent être considérées comme les principes des principes logiques, parce qu'elles suffisent pour justifier tous les autres principes logiques.

On montrera plus loin que trois (ou même deux) connecteurs logiques suffisent pour définir tous les autres. Six (ou même quatre) règles fondamentales de déduction suffisent donc pour produire toutes les relations de conséquence logique, avec la règle de répétition et la règle de transitivité. On peut choisir par exemple la négation, la conjonction et le quantificateur universel comme connecteurs logiques fondamentaux. Toutes les règles de déduction pour les autres connecteurs logiques peuvent alors être dérivées à partir des six règles de ces trois connecteurs.

Les énoncés d'une théorie sont construits avec ses concepts fondamentaux (propriétés ou relations), les noms d'individus et les connecteurs logiques. Un nom d'individu est une constante ou une variable et il peut être construit avec des fonctions. x+y par exemple est un nom d'individu construit avec la fonction d'addition et les variables x et y. Une constante est un nom d'individu qui lui appartient en propre. Une variable est un nom un peu paradoxal. Elle est un nom d'individu sans nommer aucun individu en particulier. Elle sert à nommer n'importe quel individu sans préciser lequel, dans un certain domaine.

Les règles logiques affirment qu'un énoncé est une conséquence logique d'autres énoncés. Quand elles contiennent des variables libres (d'individu, de propriété, de relation, de fonction, d'énoncé ou de liste finie d'énoncés) elles sont vraies si et seulement si elles sont vraies dans tous les cas où les variables libres sont remplacées par des constantes.

La règle de particularisation

Si i est un individu alors E(i) est une conséquence logique de Pour tout x, E(x).

x peut être n'importe quelle variable d'individu. i peut être n'importe quel nom d'individu : une constante, une variable ou une expression composée. E(i) est l'énoncé obtenu à partir de E(x) en substituant i à toutes les occurrences de x dans E(x).

Cette règle est la plus importante de toute la logique, parce que la puissance des raisonnements vient des lois avec lesquelles on raisonne. A chaque fois qu'on applique une loi à un individu, on apprend ce qu'elle nous enseigne et on révèle la puissance de raisonner qu'elle nous donne.

La règle de généralisation

Si E(x) est une conséquence logique des prémisses P et si x est une variable d'individu qui n'est pas mentionnée dans ces prémisses alors Pour tout x, E(x) est une conséquence logique des mêmes prémisses.

Dans cette règle comme dans les suivantes, P est une liste finie d'énoncés.

Un exemple d'usage de cette règle est le Je philosophique, ou cartésien. On peut dire Je sans faire aucune hypothèse particulière sur l'individu ainsi nommé. Dès lors tout ce qu'on dit sur soi peut être appliqué à tous les individus. Si par exemple on a prouvé Je ne peux pas douter que je doute quand je doute sans faire d'hypothèse particulière sur soi-même, on peut déduire Personne ne peut douter qu'il doute quand il doute.

La règle de détachement

B est une conséquence logique des deux prémisses A et Si A alors B.

La règle d'incorporation d'une hypothèse

Si B est une conséquence logique des prémisses P et A, alors Si A alors B est une conséquence logique des prémisses P.

Le principe du raisonnement par l'absurde

Si B et non B sont des conséquences logiques des prémisses P et A, alors non A est une conséquence logique des prémisses P.

La règle de suppression de la double négation

A est une conséquence logique de non non A.

La règle d'analyse

A et B sont toutes les deux des conséquences logiques de l'unique prémisse A et B.

La règle de synthèse

A et B est une conséquence logique des deux prémisses A et B.

La règle d'affaiblissement d'une thèse

A ou B et B ou A sont toutes les deux des conséquences logiques de A.

La règle d'élimination d'une disjonction

C est une conséquence logique des trois prémisses A ou B, Si A alors C et Si B alors C.

La règle de la preuve directe d'existence

Si i est un individu, alors Il existe un x tel que E(x) est une conséquence logique de E(i).

i peut être n'importe quel nom d'individu : une constante, une variable ou une expression composée. E(x) est l'énoncé obtenu en substituant x à certaines, pas forcément toutes les occurrences de i dans E(i). x doit être une variable d'individu qui n'est pas mentionnée dans E(i).

La règle d'élimination du quantificateur existentiel

Si Si E(x) alors C et Il existe un x tel que E(x) sont des conséquences logiques des prémisses P et si x est une variable d'individu qui n'est mentionnée ni dans C ni dans les prémisses P alors C est une conséquence logique des mêmes prémisses.

Une remarque à propos de la logique des fonctions : les fonctions d'une théorie peuvent toujours être représentées par des relations. Par exemple une fonction f à un argument peut être représentée par la relation binaire R : Rxy si et seulement si f(x)=y. Une fonction f à deux arguments peut être représentée par la relation ternaire R : Rxyz si et seulement si f(x,y)=z. Il en va de même bien sûr pour les fonctions qui ont davantage d'arguments. Les fonctions sont également appelées des opérateurs. En remplaçant les fonctions par les relations qu'elles définissent, on peut toujours associer à une structure définie avec des fonctions une structure équivalente définie seulement avec des relations. C'est pourquoi il n'est pas nécessaire de mentionner les fonctions dans la définition des mondes logiquement possibles. On peut se passer des fonctions et raisonner seulement avec une logique des relations. Mais il est souvent plus commode de raisonner avec des fonctions. Les règles précédentes sont formulées de telle façon qu'elles sont valables à la fois pour une logique pure des relations et pour une logique des fonctions. La seule différence est dans la formation des noms d'individus. Si on n'a pas de fonctions, les noms d'individus sont des variables ou des constantes fondamentales. On peut même se passer des constantes fondamentales en les représentant par des propriétés : la constante c est représentée par la propriété P : Px si et seulement si x=c qui est vraie seulement de c. Si on procède de cette façon, les individus sont toujours nommés avec des variables.

Les raisonnements sans hypothèse et les lois logiques

Les règles fondamentales de déduction peuvent être appliquées même si on n'a posé aucune hypothèse au départ. La règle d'incorporation d'une hypothèse et la règle du raisonnement par l'absurde permettent de passer d'un raisonnement sous hypothèse à un raisonnement sans hypothèse.

Les conclusions des raisonnements sans hypothèse sont des vérités logiques universelles, toujours vraies quelle que soit l'interprétation des concepts qu'elles mentionnent, sauf l'interprétation des connecteurs logiques. On les appelle des lois logiques, ou des tautologies.

Quelques exemples de lois logiques :


La tautologie pure : si p alors p

Comme p est une conséquence logique de p d'après la règle de répétition, si p alors p est une loi logique d'après la règle d'incorporation d'une hypothèse.


Le principe de non-contradiction : non (p et non p)

p et non p sont toutes les deux des conséquences logiques de p et non p d'après la règle d'analyse, non (p et non p) est donc une loi logique d'après le principe du raisonnement par l'absurde.


La loi du tiers-exclu : p ou non p

Un énoncé p dont la signification est complètement déterminée est nécessairement vrai ou faux. Il n'y a pas de troisième possibilité.

Pour présenter une preuve, il faut toujours préciser les hypothèses dont dépend une conséquence. La règle du décalage vers la droite permet de présenter commodément des preuves formelles : quand on introduit une nouvelle hypothèse on la décale vers la droite. Une conséquence ne dépend que des hypothèse qui la précèdent au dessus d'elle ou sur sa gauche mais pas des hypothèses sur sa droite.

Supposons que la loi du tiers exclu puisse être fausse :

  • (1) Hypothèse : non (p ou non p)
    • (2) Hypothèse : p
    • (3) p ou non p d'après (2) et la règle d'affaiblissement d'une thèse.
    • (4) non (p ou non p) d'après (1) et la règle de répétition.
  • (5) non p d'après (2), (3), (4) et le principe du raisonnement par l'absurde.
  • (6) p ou non p d'après (5) et la règle d'affaiblissement d'une thèse.
  • (7) non (p ou non p) d'après (1) et la règle de répétition.

(8) non non (p ou non p) d'après (1), (6), (7) et le principe du raisonnement par l'absurde.

p ou non p d'après (8) et la règle de suppression de la double négation.


L'alternative fondamentale : ou bien p ou bien non p

Elle est la conjonction du principe de non-contradiction et de la loi du tiers exclu. Tout énoncé qui a une signification complètement déterminée est vrai ou faux mais pas les deux. Lorsqu'un énoncé est à la fois vrai et faux, ou ni vrai ni faux, sa signification n'est pas complètement déterminée : il est vrai en un sens, faux en un autre, ou bien il n'est ni vrai ni faux parce que rien ne permet d'en décider.


Une loi découverte par les stoïciens : si (si non p alors p) alors p

Par exemple : si tout est faux alors tout n'est pas faux (puisqu'il serait vrai que tout est faux), donc tout n'est pas faux.

  • (1) Hypothèse : si non p alors p
    • (2) Hypothèse : non p
    • (3) p d'après (1) et (2) et la règle de détachement.
    • (4) non p d'après (2) et la règle de répétition.
  • (5) non non p d'après (2), (3), (4) et le principe du raisonnement par l'absurde.
  • (6) p d'après (5) et la règle de suppression de la double négation.

si (si non p alors p) alors p d'après (1), (6) et la règle d'incorporation d'une hypothèse.


Toutes les règles de déduction, fondamentales ou dérivées, peuvent être traduites en lois logiques, parce que si C est une conséquence logique des prémisses P alors si la conjonction des P alors C est une loi logique. Par exemple, si (A et si A alors B) alors B est une loi logique qui traduit la règle de détachement.

La dérivation des conséquences logiques

Les règles fondamentales de déduction suffisent pour dériver toutes les relations de conséquence logique et toutes les lois logiques. C'est le théorème de complétude de la logique du premier ordre, prouvé par Kurt Gödel, dans sa thèse de doctorat (Gödel 1929, qui raisonne sur un système formel différent mais équivalent). Les règles fondamentales de déduction sont donc une solution complète à l'ancien problème, posé mais non résolu par Aristote, de trouver une liste de tous les principes logiques.

Montrons par exemple que Si A alors C est une conséquence logique de Si A alors B et Si B alors C.

(1) Hypothèses : Si A alors B, Si B alors C

  • (2) Hypothèse : A
  • (3) B d'après (1), (2) et la règle de détachement.
  • (4) C d'après (1), (3) et la règle de détachement.

Si A alors C d'après (2), (4) et la règle d'incorporation d'une hypothèse.

Autre exemple, la règle de contraposition : Si non q alors non p est une conséquence logique de Si p alors q.

(1) Hypothèse : Si p alors q

  • (2) Hypothèse : non q
    • (3) Hypothèse : p
    • (4) q d'après (1), (3) et la règle de détachement.
    • (5) non q d'après (2) et la règle de répétition.
  • (6) non p d'après (3), (4), (5) et le principe du raisonnement par l'absurde.

Si non q alors non p d'après (2), (6) et la règle d'incorporation d'une hypothèse.

L'interdéfinissabilité des connecteurs logiques

Les connecteurs logiques peuvent être définis les uns à partir des autres. Par exemple le quantificateur existentiel peut être défini à partir du quantificateur universel et de la négation :

Il existe un x tel que p veut dire qu'il est faux que tout x est tel que non p, autrement formulé, non(pour tout x non p).

On peut aussi adopter la définition inverse :

Pour tout x, p veut dire qu'il est faux qu'il existe un x tel que non p, c'est à dire, non(il existe un x tel que non p).

De même on peut définir la disjonction à partir de la conjonction, ou l'inverse :

p ou q veut dire non(non p et non q)

p et q veut dire non(non p ou non q)

Le conditionnel peut être défini à partir de la conjonction ou de la disjonction :

Si p alors q veut dire non(p et non q)

Si p alors q veut dire aussi q ou non p

Le biconditionnel si et seulement si peut être défini à partir du conditionnel et de la conjonction :

p si et seulement si q veut dire (si p alors q) et (si q alors p)

Il peut aussi être défini à partir des autres connecteurs :

p si et seulement si q veut dire (p et q) ou (non p et non q)

ou encore :

p si et seulement si q veut dire non( (p et non q) ou (non p et q) )

On pourrait aussi introduire le connecteur logique ni ni et définir tous les autres connecteurs à partir de lui :

non p veut dire ni p ni p

p et q veut dire ni non p ni non q

p ou q veut dire non(ni p ni q)

Si p alors q veut dire non(ni non p ni q)

p si et seulement si q veut dire ni (p et non q) ni (non p et q)

Pourquoi les raisonnements nous permettent-ils d'acquérir du savoir ?

Lorsqu'un raisonnement est logique, la conclusion ne peut pas apporter plus d'informations que celles qui sont déjà données par les prémisses. Sinon le raisonnement n'est pas logique, parce que la conclusion pourrait être fausse quand les prémisses sont vraies. Les conclusions logiques ne sont jamais que des reformulations de ce qui est déjà dit dans les prémisses. De fait de nombreux raisonnements ne nous apprennent rien, parce que la conclusion ne fait que répéter les prémisses, sous une forme légèrement différente. On dit alors qu'ils sont tautologiques. Ce sont des variations sur le thème "c'est comme ça parce que c'est comme ça".

Au sens précis défini par les logiciens, les tautologies sont les lois logiques, les lois toujours vraies quelle que soit l'interprétation donnée aux termes employés (les connecteurs logiques exceptés). Lorsqu'un raisonnement est logique, l'énoncé 'si les prémisses alors la conclusion' est toujours une tautologie, au sens des logiciens.

Les conclusions ne font que répéter ce qui est déjà dit dans les prémisses. Les raisonnements doivent être tautologiques pour être logiques. Mais alors à quoi bon raisonner ? Il semble que les raisonnements n'ont rien à nous apprendre.

La puissance d'un raisonnement vient de la généralité de ses prémisses. Si on réduit la logique au calcul des propositions (il suffit de conserver tous les principes logiques sauf ceux qui portent sur les quantificateurs universel et existentiel), une logique dans laquelle les énoncés ne sont jamais généraux, parce qu'on n'a pas le quantificateur universel, alors oui, le caractère tautologique de nos raisonnements est généralement assez évident. Quand il ne l'est pas, c'est parce que nos intuitions logiques sont limitées. Le calcul des propositions nous sert surtout à reformuler nos affirmations. Cela peut être très utile, parce que la compréhension dépend de la formulation, mais cela n'explique pas pourquoi les raisonnements nous font connaître ce que nous ne savons pas déjà.

Un énoncé est une loi lorsqu'il peut être appliqué à de nombreux cas particuliers. Il peut toujours être mis sous la forme :

Pour tout x dans D, E(x)

Autrement dit :

Pour tout x, si x est dans D alors E(x)

D est le domaine d'application de la loi. E(x) est un énoncé sur x.

Tous les énoncés de la forme E(i), où i nomme un élément de D et E(i) est l'affirmation obtenue à partir de E(x) en substituant partout i à x, sont des conséquences logiques évidentes de la loi. E(i) est un cas particulier de la loi.

Quand nous apprenons une loi, nous connaissons au départ seulement un ou quelques cas particuliers. Nous ne pouvons pas songer à tous les cas particuliers, parce qu'ils sont trop nombreux. A chaque fois que nous appliquons une loi déjà connue à un cas particulier auquel nous n'avons pas songé auparavant, nous apprenons quelque chose.

Une loi est comme un condensé d'informations. En un seul énoncé elle détermine une foule d'informations sur tous les cas particuliers auxquels elle peut être appliquée. Lorsque nous raisonnons avec des lois ce que nous découvrons n'est pas déjà dit dans les prémisses, il est seulement impliqué de façon implicite. Les raisonnements nous font découvrir tout ce que les lois peuvent nous enseigner.

La justification de la logique

Nous reconnaissons un raisonnement logique en vérifiant qu'il respecte les principes logiques. Mais comment reconnaissons-nous les principes logiques ? Comment savons-nous qu'ils sont de bons principes ? Comment les justifions-nous ? Sommes-nous vraiment sûrs qu'ils conduisent toujours à des conclusions vraies à partir de prémisses vraies ?

Avec les principes de la définition de la vérité des énoncés composés, on peut prouver que nos principes logiques sont vrais, au sens où ils font toujours passer du vrai au vrai. Par exemple, il suffit de raisonner sur la table de vérité du conditionnel pour prouver la vérité de la règle de détachement.

Un sceptique pourrait objecter que ces justifications des principes logiques sont sans valeur parce qu'elles sont circulaires. Quand nous raisonnons sur les principes logiques pour les justifier, nous nous servons des mêmes principes que ceux que nous devons justifier. Si nos principes étaient faux, ils permettraient de prouver des faussetés et donc ils pourraient permettre de prouver leur propre vérité. Que les principes logiques permettent de prouver leur vérité ne prouve donc pas qu'ils sont vrais, puisque des principes faux pourraient faire la même chose.

Cette objection n'est pas concluante. Il suffit d'examiner les preuves suspectes de circularité pour se convaincre de leur validité, tout simplement parce qu'elles sont excellentes et irréfutables. Aucun doute n'est permis parce que tout y est clairement défini et prouvé. Un sceptique peut faire remarquer avec raison que de telles preuves ne peuvent convaincre que ceux qui sont déjà convertis. Mais dans ce cas il n'est pas difficile de faire partie des convertis, parce que les principes logiques ne font que formuler ce que nous savons déjà quand nous raisonnons correctement.

La circularité des principes logiques est particulièrement apparente pour la règle de particularisation :

Pour tout énoncé E(x) et tout individu i, E(i) est une conséquence logique de pour tout x, E(x). (1)

Par exemple, Si Socrate est un homme alors Socrate est mortel est une conséquence logique de Pour tout x, si x est un homme alors x est mortel. (2)

Pour passer de (1) à (2), on a appliqué la règle de particularisation deux fois à elle-même. L'énoncé E(x) est particularisé en Si x est un homme alors x est mortel, l'individu i est particularisé en Socrate.

Le paradoxe de Lewis Caroll

Grâce à la règle de détachement, on peut déduire B à partir de A et si A alors B. Une règle plus complète devrait donc être qu'on peut déduire B à partir de A, si A alors B et la règle de détachement. Mais cette règle n'est pas encore complète. Une règle plus complète, mais encore incomplète, est qu'on peut déduire B à partir de A, si A alors B, la règle de détachement et la règle qui nous dit qu'on peut déduire B à partir de A, si A alors B et la règle de détachement. Mais il faudrait encore une autre règle qui nous dit qu'on peut appliquer la règle précédente, et ainsi de suite à l'infini (Carroll 1895).

Si la règle de détachement était elle-même une hypothèse qu'on doit mentionner dans nos preuves, et à partir de laquelle on déduit nos conclusions, alors nos raisonnements ne pourraient jamais commencer, parce qu'il faudrait une seconde règle qui justifie les déductions à partir de la règle de détachement, puis une troisième qui justifie les déductions à partir de la seconde, et ainsi de suite à l'infini. Mais les lois logiques ne sont pas des hypothèses. On a toujours le droit de les adopter comme prémisses, sans autre justification sinon qu'elles sont des lois logiques, parce qu'elles ne peuvent pas être fausses, parce qu'elles ne peuvent pas nous conduire à l'erreur.

La logique de l'identité

Le problème de la liaison et la diversité des noms d'un même être

On résout le problème de la liaison des concepts (deux concepts sont-ils vrais du même individu ou d'individus différents ?) en identifiant les individus auxquels on attribue des concepts. Mais la diversité des noms d'un même être pose problème : quand deux concepts sont attribués l'un à x, l'autre à y, sont-ils liés parce qu'ils sont attribués au même individu ou non ? Si x=y ils sont liés, si x est différent de y ils ne sont pas liés.

x=y veut dire que x et y sont des noms du même être. On a besoin de la relation d'identité lorsqu'on ne peut pas conclure de la diversité des noms à la diversité des êtres parce qu'un même être peut être nommé de plusieurs façons.

Connaître la diversité des noms d'un même être peut nous enseigner beaucoup sur lui lorsque les noms sont des expressions composées. Aristote est le meilleur élève de Platon veut dire Aristote = Le meilleur de élève de Platon. "Le meilleur élève de Platon" est un des nombreux noms d'Aristote.

"Le meilleur élève de" est le nom d'un fonction qui associe à un professeur son meilleur élève. De façon générale, on nomme tous les êtres en se donnant des noms simples et des noms composés avec des fonctions.

Les règles fondamentales de la logique de l'identité

Sachant que x=y veut dire que x et y sont des noms du même être, les principes de réflexivité de l'identité x=x, de symétrie, si x=y alors y=x, et de transitivité, si x=y et y=z alors x=z sont vrais par définition, comme le principe d'indiscernabilité des identiques :

Si x=y, tout ce qui est vrai de x est également vrai de y.

Si E(x) et x=y alors E(y)

pour tout énoncé E(x) à propos de x.

Le principe d'indiscernabilité des identiques permet de prouver le principe de transitivité. En remplaçant E(z) par w=z on obtient :

Si w=x et x=y alors w=y

On peut aussi s'en servir pour déduire le principe de symétrie à partir du principe de réflexivité, en remplaçant E(z) par z=x :

Si x=x et x=y alors y=x

Or x=x

Donc :

Si x=y alors y=x

x=x peut être entendu de deux façons : un être est toujours identique à lui-même, ou un nom x doit toujours nommer le même être.

L'identité des individus dans les mondes naturellement possibles

Quand on raisonne sur les possibilités qui nous sont accessibles, on raisonne sur les arrangements naturellement possibles des êtres actuels, y compris nous-mêmes. On raisonne donc sur des mondes possibles différents qui contiennent les mêmes êtres. Les mêmes individus existent virtuellement dans plusieurs mondes possibles.

Quand on raisonne sur les possibilités absolues, il n'y a pas beaucoup de sens à identifier un même individu dans des mondes différents. Par exemple, si on raisonne sur deux univers matériels possibles différents, il n'y a pas de sens à dire qu'un point ou une particule de l'un est identique à un point ou une particule de l'autre. Et même si j'imagine que j'aurais pu avoir d'autres destinées, les autres versions de moi ne sont jamais vraiment moi. Je ne suis pas responsable de leurs actes virtuels.

Un être naturel existe dans un seul monde naturellement possible. Pour nous, ce monde est le monde actuel. Mais la nature d'un être naturel est déterminée par ses propriétés naturelles, et la nature des propriétés naturelles est déterminée par leur place dans tous les mondes naturellement possibles. C'est pourquoi la nature d'un être naturel est déterminée par sa place dans tous les mondes naturellement possibles même si un être naturel existe dans un seul monde naturellement possible.

Un raisonnement sur un même individu dans plusieurs mondes naturellement possibles peut toujours être remplacé par un raisonnement sur des individus différents qui ont les mêmes propriétés naturelles (Lewis 1986, mais sa théorie des mondes possibles est différente).

L'identité des propriétés et des relations

Une propriété ou une relation naturelle est déterminée par sa place dans tous les mondes naturellement possibles, donc par sa place dans un système d'axiomes qui définit les lois de la Nature.

Plus généralement une propriété ou une relation théorique est déterminée par sa place dans un système d'axiomes qui définit une théorie.

Deux propriétés naturelles qui sont vraies des mêmes êtres dans tous les mondes naturellement possibles y occupent la même place. Elles sont donc essentiellement la même propriété. Il en va de même pour les relations naturelles. On a donc justifié le principe d'extensionnalité des propriétés et des relations naturelles :

Deux propriétés ou relations naturelles sont identiques si et seulement si elles sont vraies des mêmes êtres dans tous les mondes naturellement possibles.

On obtient de même le principe d'extensionnalité pour les propriétés et les relations théoriques :

Deux propriétés ou relations théoriques sont identiques si et seulement si elles sont vraies des mêmes êtres dans tous les modèles de la théorie, c'est à dire dans tous les mondes logiquement possibles tels que ses axiomes sont vrais.

Les isomorphismes et l'identité des structures

Lorsqu'on parle de ressemblance entre deux individus, on entend qu'une partie des propriétés qui sont attribuées à l'un peut être attribuée à l'autre. Lorsqu'on parle de ressemblance entre deux systèmes, l'expression 'ce qui est vrai de l'un est également vrai de l'autre' peut recevoir une signification plus subtile. On entend qu'il existe une projection f qui permet de remplacer les individus x du premier système par des individus f(x) du second système, de telle façon que des énoncés vrais sur le premier système soient remplacés par des énoncés vrais sur le second système. Une telle projection est appelée en mathématiques un morphisme, ou un isomorphisme si elle est bijective, pour dire que les deux systèmes ont la même forme, ou la même structure.

L'usage courant du concept de structure est ambigu. La structure désigne tantôt l'objet, le système, tantôt sa propriété. Les structures ont une structure. Du point de vue logique, une structure en tant qu'objet est un monde logiquement possible ou une partie d'un tel monde. Une structure en tant que propriété peut être définie à partir de la relation d'équivalence x a la même structure que y. Cette relation d'équivalence peut être définie avec le concept d'isomorphisme :

Deux structures (ou deux systèmes) ont la même structure si et seulement si elles sont isomorphes.

Un isomorphisme entre deux structures E et F est une fonction bijective f qui remplace les individus de E par des individus de F de telle façon que toutes les propriétés et les relations fondamentales soient conservées. Formellement :

Si P est une propriété fondamentale, pour tout x dans E, x a la propriété P si et seulement si f(x) a la propriété P.

Si R est une relation binaire fondamentale, pour tout x et tout y dans E, xRy si et seulement si f(x)Rf(y)

Il en va de même pour les relations fondamentales entre davantage de termes.

(Une relation entre les éléments de E et les éléments de F définit une application de E dans F lorsque chaque élément de E est relié à un unique élément de F. Une application de E dans F est bijective lorsque chaque élément de F est relié à un unique élément de E. Autrement dit, une fonction bijective est une application dont l'inverse est aussi une application.)

Un isomorphisme f entre deux structures permet de transformer tous les énoncés vrais à propos de l'une en énoncés vrais à propos de l'autre. Il suffit de remplacer partout x par f(x). Lorsque deux structures sont isomorphes, elles sont des modèles des mêmes théories. Tout système d'axiomes vrai de l'une est nécessairement vrai de l'autre.

Un être naturel complexe est une structure naturelle, définie avec des propriétés et des relations naturelles. Deux êtres naturels complexes isomorphes sont essentiellement semblables, naturellement indiscernables. Ils ont les mêmes propriétés naturelles. Tout ce qui est naturellement possible avec l'un est naturellement possible avec l'autre. La nature d'un être naturel complexe est sa structure. Deux êtres naturels complexes isomorphes ont la même nature.

Le concept d'isomorphisme est souvent défini d'une façon plus générale. On permet à la fonction bijective f de remplacer non seulement les individus mais également les propriétés et les relations, toujours de telle façon que les énoncés vrais sur un système soient remplacés par des énoncés vrais sur un autre système. Lorsque la ressemblance entre des systèmes est définie de cette façon, on dit couramment que les systèmes semblables sont analogues et que la projection f est une analogie. Un isomorphisme peut être défini comme une analogie bijective.

On peut aussi définir le concept de structure d'une façon plus générale :

Deux structures ont la même structure si et seulement si elles sont des modèles de la même théorie.

Avec cette seconde définition, une structure en tant que propriété est déterminée par les axiomes d'une théorie. Plus précisément, des systèmes d'axiomes différents définissent la même structure lorsqu'ils ont les mêmes modèles, lorsque tout modèle de l'un est un modèle de l'autre.

Une théorie est catégorique lorsque tous ses modèles sont isomorphes. Les structures fondamentales des mathématiques, l'ensemble des nombres naturels et celui des nombres réels en particulier, sont déterminées avec des théories catégoriques. Une théorie catégorique interdit toute contingence. Il y a essentiellement un seul monde logiquement possible qui obéit à ses principes. Les lois de la Nature ne déterminent pas une théorie catégorique de la Nature. Elles laissent de la place pour la contingence.

Lorsqu'une théorie n'est pas catégorique, des structures ou des systèmes différents, non-isomorphes, peuvent avoir la même structure, telle qu'elle est définie par la théorie. Par exemple, on peut dire de tous les espaces vectoriels qu'ils ont une structure d'espace vectoriel.

Les symétries sont des automorphismes

Un automorphisme d'une structure E est un isomorphisme interne, un isomorphisme de E dans E.

Toute structure a un automorphisme trivial, la fonction-identité définie par id(x)=x.

Une structure est symétrique lorsqu'elle a au moins un automorphisme non-trivial.

Un automorphisme non-trivial est une symétrie d'une structure.

Les automorphismes d'une structure forment un groupe, au sens algébrique, parce que l'inverse d'un automorphisme est un automorphisme et parce que la composée de deux automorphismes est également un automorphisme.

Le groupe de tous les automorphismes d'une structure est aussi appelé le groupe de ses symétries. Par exemple, le groupe des symétries d'un cercle, ou d'un disque, est le groupe des rotations autour de leur centre et des réflexions par rapport à un diamètre.

Lorsqu'il existe un automorphisme g tel que y=g(x), x et y sont essentiellement indiscernables à l'intérieur de la structure, au sens où toute vérité sur l'un peut être transformée en une vérité équivalente sur l'autre.

La classe d'équivalence, ou l'orbite, d'un élément x d'une structure symétrique est l'ensemble des y tels que y=g(x) où g est un automorphisme de la structure.

Une classe d'équivalence est un ensemble d'éléments essentiellement indiscernables à l'intérieur de la structure. Par exemple, tous les points d'un cercle sont dans la même classe d'équivalence parce que rien ne permet de les distinguer sur le cercle. Tous les points d'un disque à la même distance du centre sont aussi dans une même classe d'équivalence, mais des cercles concentriques différents y sont des classes d'équivalence différentes, parce que les points sont distingués par leur distance au centre.

Une structure est symétrique lorsqu'elle contient des éléments distincts mais essentiellement indiscernables, parce que leurs propriétés et leurs relations à l'intérieur de la structure déterminent des places distinctes mais équivalentes.

Une structure naturelle est parfaitement symétrique lorsqu'elle contient des éléments naturellement indiscernables tels que leurs relations à l'intérieur de la structure leur attribuent des places équivalentes.

Une structure naturelle est imparfaitement symétrique lorsqu'elle contient des éléments naturellement très semblables tels que leurs relations à l'intérieur de la structure leur attribuent des places équivalentes ou presque équivalentes.

Lorsqu'une structure contient de nombreux constituants, plus elle est symétrique, plus elle est facile à connaître, parce qu'on connaît toutes les parties symétriques dès qu'on en connaît une.

Les deux ailes des papillons (ici une vanesse du chardon) sont symétriques par réflexion : l'une est comme l'image dans un miroir de l'autre.
Cette fleur est symétrique par rotation : si on la tourne d'un cinquième de tour, on retrouve la forme initiale.
Saturne et ses anneaux. Les planètes et les étoiles sont à peu près symétriques pour toutes les rotations autour de leur axe.
Flocon de neige
Une rotation d'un sixième de tour permute les atomes de la molécule de benzène sans modifier la structure.
Les empilements de sphères dures sont des modèles de la structure de certains cristaux. Ils sont symétriques par translation.
Image au microscope de la surface de SrTiO3. Les atomes les plus clairs sont Sr et les plus sombres sont Ti.
Volvox est une algue verte d'eau douce microscopique à symétrie sphérique. Les jeunes colonies peuvent être vues à l'intérieur des plus grandes.
Coupe sagittale d'une coquille de nautile. Une spirale logarithmique est symétrique par similitude.
La fonction d'onde d'une particule initialement très localisée.
Écoulement parfait autour d'un cylindre. En plus de la symétrie bilatérale, il y a une symétrie entre l'amont et l'aval par inversion du sens du temps. La permanence est une symétrie pour les translations dans le temps.
Une onde sphérique périodique est symétrique pour les rotations autour de son centre et pour les translations dans le temps d'un multiple de sa période.
Une trajectoire d'un système imprévisible (Chua). Chaos et symétrie ne sont pas exclusifs.
Détection simulée de particules dans une expérience d'interférence. Une structure symétrique peut résulter d'un phénomène aléatoire.
Une structure fractale est symétrique par changement d'échelle.
Le rayonnement du fond cosmologique. Ce sont les faibles écarts de température par rapport à un Univers homogène. L'Univers était donc presque symétrique pour toutes les translations et les rotations.

Le savoir mathématique

Tout le savoir mathématique peut être considéré comme un savoir sur les mondes logiquement possibles.

Une théorie est cohérente, ou non-contradictoire, ou consistante, lorsque les contradictions p et non p ne sont pas des conséquences logiques de ses axiomes. Sinon elle est incohérente, contradictoire, inconsistante, absurde.

Une théorie vraie d'un monde logiquement possible est nécessairement cohérente, puisque les contradictions sont fausses dans tous les mondes logiquement possibles.

Une théorie cohérente est vraie d'au moins un monde logiquement possible. C'est le théorème de complétude de Gödel. Si on trouvait une théorie nécessairement fausse, c'est à dire fausse dans tous les mondes logiquement possibles, sans qu'on puisse prouver que ses axiomes conduisent à une contradiction, cela montrerait que notre logique est incomplète, qu'elle ne suffirait pas pour prouver toutes les vérités logiques nécessaires. Mais Gödel a prouvé dans sa thèse de doctorat que notre logique est complète (Gödel 1929).

Nous développons le savoir mathématique en réfléchissant à nos propres paroles. Les mondes logiquement possibles sont définis par la parole, avec des ensembles d'énoncés atomiques. Connaître ces mondes revient à connaître les paroles qui les définissent. Les mondes mathématiques ne sont rien de plus que ce que nous définissons. Rien n'est caché, parce qu'ils sont notre œuvre. Nous pouvons tout savoir sur eux parce que nous déterminons ce qu'ils sont.

La vérité mathématique est-elle inventée ou découverte ?

Les deux, parce qu'inventer, c'est toujours découvrir une possibilité.

Quand nous inventons, nous modifions l'actuel mais nous ne modifions pas l'espace de tous les possibles. Ce qui est possible est possible quoique nous fassions. Nous agissons souvent pour rendre accessible ce qui auparavant était moins accessible, mais il ne s'agit jamais de rendre possible l'impossible, nous modifions seulement les possibilités relatives à notre situation actuelle. Quand nous rendons impossible le possible, il s'agit là encore de possibilités relatives. L'espace des possibilités absolues, qu'elles soient logiques ou naturelles, ne dépend pas de nous.

Quand nous développons le savoir mathématique nous découvrons une possibilité de parole.

Nous acquérons un savoir mathématique sur les structures finies en raisonnant sur nos propres paroles, parce que ces structures sont définies avec des ensembles finis d'énoncés atomiques.

Le savoir sur les structures mathématiques infinies est plus difficile à comprendre. Elles sont définies avec des ensembles infinis d'énoncés atomiques. Nous connaissons ces ensembles infinis à partir de leur définition finie. Deux procédés sont fondamentaux pour définir les ensembles infinis :

  • Les constructions par récurrence

On se donne des éléments initiaux et des règles qui permettent d'engendrer de nouveaux éléments à partir des éléments initiaux ou d'éléments déjà engendrés. Par exemple, on peut partir de l'unique élément initial 1 et se donner pour règle d'engendrer (x+y) à partir de x et y. L'ensemble infini est alors défini en disant que c'est l'unique ensemble qui contient tous les éléments initiaux et tous les éléments engendrés par un nombre fini d'applications des règles: (1+1), ((1+1)+1), ((1+1)+(1+1)) ...

  • La définition de l'ensemble de tous les sous-ensembles

Dès qu'un ensemble x est défini, l'axiome de l'ensemble des parties nous autorise à définir l'unique ensemble qui contient tous les ensembles inclus dans x. Si x est un ensemble infini, l'ensemble des parties de x est un ensemble infini encore plus grand.