Dernières pensées/Chapitre 4

Ernest Flammarion (p. 101-140).

CHAPITRE IV

LA LOGIQUE DE L’INFINI

§ 1er. — CE QUE DOIT ÊTRE UNE CLASSIFICATION

Les règles ordinaires de la logique peuvent-elles être appliquées sans changement, dès que l’on considère des collections prenant un nombre infini d’objets ? C’est là une question qu’on ne s’était pas posée d’abord, mais qu’on a été amené à examiner quand les mathématiciens qui se sont fait une spécialité de l’étude de l’infini se sont tout à coup heurtés à de certaines contradictions au moins apparentes. Ces contradictions proviennent-elles de ce que les règles de la logique ont été mal appliquées, ou de ce qu’elles cessent d’être valables en dehors de leur domaine propre, qui est celui des collections formées seulement d’un nombre fini d’objets ? Je crois qu’il ne sera pas inutile de dire ici quelques mots à ce sujet, et ide donner aux lecteurs une idée des débats auxquels ce problème a donné lieu.

La logique formelle n'est autre chose que l'étude des propriétés communes à toute classification ; elle nous apprend que deux soldats qui font partie du même régiment appartiennent par cela même à la même brigade, et par conséquent à la même division, et c'est à cela que se réduit toute la théorie du syllogisme. Quelle est alors la condition pour que les règles de cette logique soient valables ? C'est que la classification adoptée soit immuable. Nous apprenons que deux soldats font partie du même régiment, et nous voulons en conclure qu'ils font partie de la même brigade ; nous en avons le droit pourvu que pendant le temps que nous mettons à faire notre raisonnement, l'un des deux hommes n'ait pas été transféré d'un régiment dans un autre.

Les antinomies qui ont été signalées proviennent toutes de l'oubli de cette condition si simple : on s'est appuyé sur une classification qui n'était pas immuable et qui ne pouvait pas l'être ; on a bien pris la précaution de la proclamer immuable ; mais cette précaution était insuffisante ; il fallait la rendre effectivement immuable et il y a des cas où cela n'est pas possible.

Qu'on me permette de reprendre un exemple cité par M. Russell. C'était contre moi d'ailleurs qu'il l'invoquait. Il voulait prouver que les difficultés ne provenaient pas de 'introduction de l'infini actuel, puisqu'elles peuvent se présenter même quand on ne considère que des nombres finis. Je reviendrai plus loin sur ce point, mais ce n'est pas de cela qu'il s'agit pour le moment et je choisis cet exemple parce qu'il est amusant et qu'il met bien en évidence le fait que je viens de signaler.

Quel est le plus petit nombre entier qui ne peut pas être défini par une phrase de moins de cent mots français ? Et d'abord ce nombre existe-t-il ?

Oui, car avec cent mots français, on ne peut construire qu'un nombre fini de phrases, puisque le nombre des mots du dictionnaire français est limité. Parmi ces phrases, il y en aura qui n'auront aucun sens ou qui ne définiront aucun nombre entier. Mais chacune d'elles pourra définir au plus un seul nombre entier. Le nombre des entiers susceptibles d'être définis de la sorte est donc limité ; par conséquent, il y a certainement des entiers qui ne peuvent l'être ; et parmi ces entiers, il y en a certainement un qui est plus petit que tous les autres.

Non ; car si cet entier existait, son existence impliquerait contradiction, puisqu'il se trouverait défini par une phrase de moins de cent mots français, à savoir par la phrase même qui affirme qu'il ne peut pas l'être.

Ce raisonnement repose sur une classification des nombres entiers en deux catégories, ceux qui peuvent être définis par une phrase de moins de cent mots français et ceux qui ne peuvent pas l'être. En posant la question, nous proclamons implicitement que cette classification est immuable et que nous ne commençons à raisonner qu'après l'avoir établie définitivement. Mais cela n'est pas possible. La classification ne pourra être définitive que lorsque nous aurons passé en revue toutes les phrases de moins de cent mots, que nous aurons rejeté celles qui n'ont pas de sens, et que nous aurons fixé définitivement le sens de celles qui en ont un. Mais parmi ces phrases, il y en a qui ne peuvent avoir de sens qu'après que la classification est arrêtée, ce sont celles où il est question de cette classification elle-même. En résumé la classification des nombres ne peut être arrêtée qu'après que le triage des phrases est achevé, et ce triage ne peut être achevé qu'après que la classification est arrêtée, de sorte que ni la classification, ni le triage ne pourront jamais être terminés.

Ces difficultés se rencontreront beaucoup plus souvent encore quand il s'agira de collections infinies. Supposons que l'on veuille classer les éléments de l'une de ces collections et que le principe de la classification repose sur quelque relation de l'élément à classer avec la collection tout entière. Une semblable classification pourra-t-elle jamais être conçue comme arrêtée ? Il n'y a pas d'infini actuel, et quand nous parlons d'une collection infinie, nous voulons dire une collection à laquelle on peut sans cesse ajouter de nouveaux éléments (semblable à une liste de souscription qui ne serait jamais close dans l'attente de nouveaux souscripteurs). Or la classification ne pourrait justement être arrêtée que quand cette liste serait close ; toutes les fois qu'on ajoute à la collection de nouveaux éléments, on modifie cette collection ; on peut donc modifier la relation de cette collection avec les éléments déjà classés ; et comme c'est d'après cette relation que ces éléments ont été rangés dans tel ou tel tiroir, il peut arriver qu'une fois cette relation modifiée, ces éléments ne soient plus dans le bon tiroir et qu'on soit obligé de les déplacer. Tant qu'on a de nouveaux éléments à introduire, on doit craindre d'avoir à recommencer tout son travail ; or il n'arrivera jamais qu'on n'ait plus de nouveaux éléments à introduire ; la classification ne sera donc jamais arrêtée.

De là une distinction entre deux espèces de classifications, applicables aux éléments des collections infinies ; les classifications prédicatives, qui ne peuvent être bouleversées par l'introduction de nouveaux éléments ; les classifications non prédicatives que l'introduction des éléments nouveaux oblige à remanier sans cesse.

Supposons par exemple que l'on classe les nombres entiers en deux familles suivant leur grandeur. On peut reconnaître si un nombre est plus grand ou plus petit que 10 sans avoir à envisager les relations de ce nombre avec l'ensemble des autres nombres entiers. Quand on aura défini, je suppose, les 100 premiers nombres, on saura quels sont ceux d'entre eux qui sont plus petits et ceux qui sont plus grands que 10 ; quand on introduira ensuite le nombre 101, ou un quelconque des nombres suivants, ceux des 100 premiers entiers qui étaient plus petits que 10 resteront plus petits que 10, ceux qui étaient plus grands resteront plus grands; la classification est prédicative.

Imaginons au contraire qu'on veuille classer les points de l'espace et que l'on distingue ceux qui peuvent être définis en un nombre fini de mots et ceux qui ne le peuvent pas. Parmi les phrases possibles, il y en aura qui feront allusion à la collection tout entière, c'est-à-dire à l'espace, ou à des parties de l'espace. Quand nous introduirons de nouveaux points dans l'espace, ces phrases changeront de sens, elles ne définiront plus le même point ; ou bien elles perdront toute espèce de sens ; ou encore elles acquerront un sens alors qu'elles n'en avaient pas auparavant. Et alors des points qui n'étaient pas définissables deviendront susceptibles d'être définis ; d'autres qui l'étaient cesseront de l'être. Ils devront passer d'une catégorie dans une autre. La classification ne sera pas prédicative.

Il y a de bons esprits qui considèrent que les seuls objets dont il est permis de raisonner sont ceux qui peuvent être définis en un nombre fini de mots, et j'aurais d'autant plus mauvaise grâce à ne pas les regarder comme de bons esprits, que je vais bientôt moi-même défendre leur opinion. On peut donc trouver que l'exemple précédent est mal choisi, mais il est aisé de le modifier.

Pour classer les nombres entiers, ou les points de l'espace, je considérerai la phrase qui définit chaque nombre entier, ou chaque point. Comme il peut arriver qu'un même nombre ou un même point puisse être défini par plusieurs phrases, je rangerai ces phrases dans l'ordre alphabétique et je choisirai la première d'entre elles. Cela posé, cette phrase finira par une voyelle ou par une consonne, et on pourrait faire la classification d'après ce critère. Mais cette classification ne serait pas prédicative ; par l'introduction de nouveaux entiers, ou de nouveaux points, des phrases qui n'avaient aucun sens pourront en acquérir un. Et alors au tableau des phrases qui définissent un entier ou un point déjà introduit, il deviendra nécessaire d'ajouter de nouvelles phrases, qui étaient jusqu'ici dénuées de sens, qui viennent d'en acquérir un, et qui définissent précisément ce même point. Il pourra se faire que ces phrases nouvelles prennent la tête dans l'ordre alphabétique, et qu'elles finissent par une voyelle, tandis que les phrases anciennes finissaient par une consonne. Et alors notre entier ou notre point qui avait été provisoirement rangé dans une catégorie, devra être transféré dans l'autre.

Si au contraire nous classons les points de l'espace d'après la grandeur de leurs coordonnées, si nous convenons de classer ensemble tous ceux dont l'abscisse est plus petite que 10, l'introduction de nouveaux points ne changera rien à la classification ; les points déjà introduits qui répondaient à la condition ne cesseront pas d'y répondre après cette introduction. La classification sera prédicative.

Ce que nous venons de dire des classifications s'applique immédiatement aux définitions. Toute définition est en effet une classification. Elle sépare les objets qui satisfont à la définition, et ceux qui n'y satisfont pas et elle les range dans deux classes distinctes. Si elle procède, comme dit l'École, per proximum genus et differentiam specificam, elle repose évidemment sur la subdivision du genre en espèces. Une définition comme toute classification peut donc être ou ne pas être prédicative.

Mais ici une difficulté se présente. Reprenons l'exemple précédent. Les nombres entiers appartiennent à la classe ou à la classe , suivant qu'ils sont plus petits ou plus grands que 10,5. J'ai défini certains nombres entiers je les ai repartis entre ces deux classes et . Je définis et j'introduis de nouveaux nombres entiers. J'ai dit que la répartition n'était pas modifiée et que par conséquent la classification était prédicative. Mais pour que la place du nombre dans la classification ne soit pas modifiée, il ne suffit pas que les cadres de la classification n'aient pas changé, il faut encore que le nombre soit resté le même, c'est-à-dire que sa définition soit prédicative. De sorte qu'à un certain point de vue, on ne devrait pas dire qu'une classification est prédicative d'une façon absolue, mais qu'elle est prédicative par rapport à un mode de définition.


§ 2. — LE NOMBRE CARDINAL

On ne doit pas oublier les considérations précédentes quand on définit le nombre cardinal. Si nous considérons deux collections, an peut chercher à établir une loi de correspondance entre les objets de ces deux collections, de façon qu'à tout objet de la 1re corresponde un objet de la 2e et un seul, et inversement. Si cela est possible, on dit que des deux collections ont le même nombre cardinal.

Mais, ici encore, il convient que cette loi de correspondance soit prédicative. Si l'on a affaire à deux collections infinies, on ne pourra jamais concevoir ces deux collections comme épuisées. Si nous supposons que nous ayons pris dans la première un certain nombre d'objets, la loi de correspondance nous permettra de définir les objets correspondants de la 2e. Si nous introduisons ensuite de nouveaux objets, il pourra arriver que cette introduction change le sens de la loi de correspondance, de telle façon que l'objet de la 2e collection, qui avant cette introduction correspondait à un objet de la 1re, n'y correspondra plus après cette introduction. Dans ce cas la loi de correspondance ne sera pas prédicative.

Et c'est ce que nous allons expliquer par deux exemples opposés. Je considère l'ensemble des nombres entiers et l'ensemble des nombres pairs. À chaque entier je puis faire correspondre le nombre pair . Quand j'introduirai de nouveaux entiers, ce sera toujours le même nombre qui correspondra à . La loi de correspondance est prédicative, et il en est de même de toutes celles qu'envisage Cantor pour démontrer par exemple que le nombre cardinal des nombres rationnels est égal à celui des nombres entiers, ou celui des points de l'espace à celui des points d'une droite.

Supposons au contraire que l'on compare l’ensemble des nombres entiers à celui des points de l'espace susceptibles d'être définis par un nombre fini de mots et que j'établisse entre eux la correspondance suivante. Je ferai le tableau de toutes les phrases possibles, je les ordonnerai d'après le nombre de leurs mots, en rangeant dans l'ordre alphabétique celles qui ont le même nombre de mots. J'effacerai toutes celles qui n'ont aucun sens ou qui ne définissent aucun point, ou qui définissent un point déjà défini par l'une des phrases précédentes. Je ferai correspondre à chaque point la phrase qui le définit, et le numéro qu'occupe cette phrase dans le tableau ainsi émondé.

Lorsque j'introduirai de nouveaux points, il pourra arriver que des phrases qui étaient dépourvues de sens en acquièrent un ; on devra les rétablir dans le tableau d'où on les avait d'abord effacées ; et le numéro de toutes les autres phrases se trouvera modifié. Nos correspondances seront entièrement bouleversées ; notre loi de correspondance n'est pas prédicative.

Si l'on ne faisait pas attention à cette condition dans la comparaison des nombres cardinaux, on serait conduit à de singuliers paradoxes. Il convient donc de modifier la définition des nombres cardinaux en spécifiant que la loi de correspondance sur laquelle cette définition se fonde doit être prédicative.

Toute loi de correspondance repose sur une double classification. On doit classer les objets des deux collections que l'on veut comparer ; et les deux classifications doivent être parallèles ; si par exemple les objets de la 1re se répartissent en classes, qui se subdivisent en ordres, ceux-ci en familles, etc., il devra en être de même des objets de la 2e. À chaque classe de la 1re classification devra correspondre une classe de la 2e et une seule, à chaque ordre un ordre et ainsi de suite, jusqu'à ce qu'on arrive aux individus eux-mêmes.

Et l'on voit alors quelle doit être la condition pour qu'une loi de correspondance soit prédicative. Il faut que les deux classifications sur lesquelles cette loi repose soient elles-mêmes prédicatives.


§ 3. — LE MÉMOIRE DE M. RUSSEL

M. Russell a publié dans l’American Journal of Mathematics, vol. XXX, sous le titre Mathematical logics as based on the Theory of Types, un mémoire où il s'appuie sur des, considérations tout à fait analogues à celles qui précèdent. Après avoir rappelé quelques-uns des paradoxes les plus célèbres chez les logiciens, il en cherche l'origine et il la trouve avec raison dans une sorte de cercle vicieux. On a été conduit à des antinomies parce qu'on a envisagé des collections, contenant des objets dans la définition desquels entre la notion de la collection elle-même. On s'est servi de définitions non prédicatives ; on a confondu, dit M. Russell, les mots all et any, ce que nous pouvons rendre en français par les mots tous et quelconque.

Il est ainsi conduit à imaginer ce qu’il appelle la hiérarchie des types. Soit une proposition vraie d’un individu quelconque d’une classe donnée. Par un individu quelconque, nous devons entendre d’abord tous les individus de cette classe que l’on peut définir sans se servir de la notion de la proposition elle-même. Je les appellerai des individus quelconques du 1er ordre ; quand j’affirmerai que la proposition est vraie de tous ces individus, j’affirmerai une proposition du 1er ordre. Un individu quelconque du 2e ordre, ce sera alors un individu dans la définition duquel pourra intervenir la notion de cette proposition du ler ordre. Si j’affirme la proposition de tous les individus du 2e ordre, j’aurai une proposition du 2e ordre. Les individus du 3e ordre seront ceux dans la définition desquels peut intervenir la notion de cette proposition du 2e ordre ; et ainsi de suite.

Prenons l’exemple de l’Épiménide. Un menteur du 1er ordre sera celui qui ment toujours sauf quand il dit je suis un menteur du 1er ordre ; un menteur du 2e ordre sera celui qui ment toujours même quand il dit je suis un menteur du 1er ordre, mais qui ne ment plus quand il dit je suis un menteur du 2e ordre. Et ainsi de suite. Et alors quand Epiménide nous dira : je suis un menteur, nous pourrons lui demander : de quel ordre ? Et c’est seulement après qu’il aura répondu à cette légitime question que son assertion aura un sens.

Passons à un exemple plus scientifique et envisageons la définition du nombre entier. On dit qu’une propriété est récurrente si elle appartient à zéro, et si elle ne peut appartenir à sans appartenir à ; on dit que tous les nombres qui possèdent une propriété récurrente forment une classe récurrente. Alors un entier est par définition un nombre qui possède toutes les propriétés récurrentes, c’est-à-dire qui appartient à toutes les classes récurrentes.

De cette définition peut-on conclure que la somme de deux entiers est un entier ? Il semble que oui ; car si est un nombre entier, donné, les nombres qui sont tels que est entier forment une classe récurrente. Le nombre ne serait donc pas entier, si ne l’était pas. Mais la définition de cette classe récurrente dont nous venons de parler n’est pas prédicative, car dans cette définition (qui nous apprend que doit être entier) entre la notion de nombre entier qui présuppose la notion de toutes les classes récurrentes.

D’où la nécessité d’employer le détour suivant : appelons classes récurrentes du 1er ordre toutes celles que l'on peut définir sans introduire la notion d’entier, et entiers du 1er ordre les nombres qui appartiennent à toutes les classes récurrentes du 1er ordre ; appelons ensuite classes récurrentes du 2e ordre celles que l’on peut définir en introduisant au besoin la notion d’entier du 1er ordure, mais sans faire intervenir la notion d’entier d’ordre supérieur ; appelons entiers du 2e ordre les nombres qui appartiennent à toutes les classes récurrentes du 2e ordre, et ainsi de suite. Et alors ce que nous pouvons démontrer ce n’est pas que la sommes de deux entiers est un entier, c’est que la somme de deux entiers d’ordre , est un entier d’ordre .

Ces exemples suffirent, je pense, pour faire comprendre ce que M. Russel appelle la hiérarchie des types. Mais alors se posent diverses questions sur lesquelles l’auteur ne s’est pas prononcé.

1° Dans cette hiérarchie s’introduisent sans difficulté des propositions du 1er, du 2e ordre, etc., et en général du ordre, étant un nombre entier fini quelconque. Est-il possible de considérer de même des propositions d’ordre , étant un nombre ordinal transfini ? C'est ainsi que M. König a imaginé une théorie qui ne diffère pas essentiellement de celle de M. Russell ; il s’y sert d’une notation spéciale, il y désigne par les objets du 1er ordre, par ceux du 2e ordre, etc., étant les initiales de l’ expression ne varietur. Quant à lui, il n'hésite pas à introduire des est transfini, sans d'ailleurs expliquer suffisamment ce qu'il entend par là.

2° Si l'on répond oui à la première question, il faudra expliquer ce qu'on entend par des objets d'ordre , étant l'infini ordinaire, c'est-à-dire le premier nombre ordinal transfini, ou par des objets d'ordre  ; étant un ordinal transfini quelconque.

3° Si au contraire on répond non à la 1re question, comment pourra-t-on fonder sur la théorie des types la distinction entre les nombres finis ou infinis, puisque cette théorie est dénuée de sens si on ne suppose cette distinction déjà faite.

4° Plus généralement, qu'on réponde oui ou non à la 1re question, la théorie des types est incompréhensible, si on ne suppose la théorie des ordinaux déjà constituée. Comment pourra-t-on fonder alors la théorie des ordinaux sur celle des types ?


§ 4. — L’AXIOME DE RÉDUCTIBILITÉ

M. Russell introduit un axiome nouveau qu'il appelle axiom of reducibility. Comme je ne suis pas sûr d'avoir parfaitement compris sa pensée, je vais lui laisser la parole. « We assume, that every function is équivalent, for ail its value to some predicative function of the same argument. » Mais, pour comprendre cette assertion, il faut remonter aux définitions données au début du mémoire. Qu'est-ce qu'une fonction, et qu'est-ce qu'une fonction prédicative ? Si une proposition est affirmée d'un objet donné , c'est une proposition particulière ; si on l'affirme d'un objet indéterminé , c'est une fonction propositionnelle de . La proposition sera d'un certain ordre dans la hiérarchie des types, et cet ordre ne sera pas le même quel que soit , puisqu'il dépendra de l'ordre de . La fonction sera alors dite prédicative, si elle est d'ordre , quand est d'ordre .

Après ces définitions le sens de l'axiome n'est pas encore très clair et quelques exemples ne seraient pas superflus. M. Russell n'en a pas donné, et j'hésite à en donner de mon cru, parce que je crains de trahir sa pensée, que je ne suis pas certain d'avoir entièrement saisie. Mais, sans l'avoir saisie, il y a une chose dont je ne saurais douter, c'est qu'il s'agit d'un nouvel axiome. Grâce à cet axiome, on espère pouvoir démontrer le principe d'induction mathématique ; que cela soit possible, je voudrais d'autant moins le nier que je soupçonne cet axiome d'être une autre forme du même principe.

Et alors je ne puis m'empêcher de penser à tous les gens qui prétendent démontrer le postulatum d'Euclide, en s'appuyant sur une de ses conséquences, et en regardant cette conséquence comme une vérité évidente par elle-même. Qu'ont-ils gagné ? Cette vérité, quelque évidente qu'elle soit, le sera-t-elle plus que le postulatum lui-même ?

Nous ne gagnons donc rien sur le nombre des postulats ; gagnons-nous au moins sur la qualité ?

En quoi le nouvel axiome l'emporte-t-il sur le principe d'induction ?

1° Est-il susceptible d'un énoncé plus simple et plus clair ? C'est possible, car celui que M. Russell nous donne peut sans doute être amélioré ; mais ce n'est pas probable.

2° L'axiome de réductibilité est-il plus général que le principe d'induction ? de sorte que l'on ne puisse démontrer cet axiome en partant de ce principe ?

3° Ou bien au contraire l'axiome est-il moins général en apparence que le principe, de sorte qu’on n'aperçoive pas immédiatement que le second est contenu dans le premier, bien qu'il le soit ?

4° L'emploi de cet axiome est-il plus conforme aux tendances naturelles de notre esprit ; peut-on le justifier psychologiquement ?

Je me borne à poser ces questions ; les éléments me manquent pour les résoudre puisque je n'ai pu arriver même à comprendre complètement le sens de cet axiome.

Mais si je ne puis, avec les indications trop sommaires données par M. Russell, espérer de pénétrer entièrement ce sens, il m'est permis au moins de faire quelques conjectures. Voilà une proposition comme par exemple la définition du nombre entier; un entier fini est un nombre qui appartient à toutes les classes récurrentes ; cette proposition n'a pas de sens, par elle-même ; elle n'en aurait un que si on précisait l'ordre des classes récurrentes dont il s'agit. Mais il arrive heureusement ceci ; tout entier du 2e ordre est a fortiori un entier du 1er ordre, puisqu'il appartiendra à toutes les classes récurrentes des deux premiers ordres, et par conséquent à toutes celles du 1er ordre ; de même tout entier du e ordre sera a fortiori un entier du e ordre. Nous sommes ainsi amenés à définir une série de classes de plus en plus restreintes, entiers du 1er, du 2e, ..., du e ordre, dont chacune sera contenue dans celle qui précède. J'appellerai entier d'ordre tout nombre qui appartiendra à la fois à toutes ces classes ; et cette définition de l'entier de l'ordre aura un sens et pourra être regardée comme équivalente à la définition d'abord proposée pour le nombre entier et qui n'en avait pas. Est-ce là une application correcte de l'axiome de réductibilité, tel que l'entend M. Russell ? Je ne propose cet exemple que timidement.

Admettons-le pourtant, et reprenons le théorème à démontrer au sujet de la somme de deux entiers. Nous avons établi que la somme de deux entiers du e ordre est un entier d'ordre , et nous voulons en conclure que si et sont deux entiers d'ordre , la somme est aussi un entier d'ordre . Et en effet il suffit pour cela d'établir que c'est un entier d'ordre quelque grand que soit . Or si et sont des entiers d'ordre , ce seront a fortiori des entiers d'ordre , donc en vertu du théorème déjà établi, est un entier d'ordre ...

C. Q. F. D.

Est-ce de cette façon qu'on peut se servir de l'axiome de M. Russell ? Je sens bien que ce n'est pas tout à fait cela et que M. Russell donnerait au raisonnement une tout autre forme, mais le fond demeurerait le même.

Je ne veux pas discuter ici la validité de ce mode de démonstration.

Je me bornerai pour le moment aux observations suivantes. Nous avons été conduits à introduire à côté de la notion des objets du e ordre, celle des objets d'ordre et nous croyons avoir réussi en ce qui concerne les entiers, à définir cette notion nouvelle. Mais cela ne réussirait pas toujours ; pour Epiménide par exemple, cela ne marcherait pas du tout. Ce qui a assuré le succès, c’est la circonstance suivante. La classification étudiée n’était pas prédicative, et l’adjonction d’éléments nouveaux obligeait à modifier le classement des éléments antérieurement introduits et classés. Toutefois cette modification ne pouvait se faire que dans un sens ; on pouvait être obligé de transférer des objets de la classe dans la classe (à savoir de celle des entiers dans celle des non-entiers), mais jamais de les transférer de la classe dans la classe . Il faudrait une convention nouvelle pour définir les objets d’ordre dans les cas où la modification devrait se faire tantôt dans un sens, tantôt dans l’autre.

En second lieu, la définition des entiers d’ordre n’est pas la même que celle des entiers d’ordre , étant fini. On définit les entiers d’ordre par récurrence en déduisant la notion d’entier d’ordre , de la notion d’entier d’ordre . On définit les entiers d’ordre , par passage à la limite, en faisant dépendre cette notion nouvelle d’une infinité de notions antérieures, celles des entiers de tous les ordres finis. Les deux définitions seraient donc incompréhensibles pour quelqu’un qui ne saurait pas déjà ce que c’est qu’un nombre fini ; elles présupposent la distinction des nombres finis et des nombres infinis. Ce n'est donc pas sur elles qu'on peut espérer fonder cette distinction.


§ 5. — LE MÉMOIRE DE M. ZERMELO

C'est dans une tout autre direction que M. Zermelo cherche la solution des difficultés que nous avons signalées. Il s'efforce de poser un système d'axiomes a priori, qui doivent lui permettre d’établir toutes les vérités mathématiques sans être exposé à la contradiction. Il y a plusieurs manières de concevoir le rôle des axiomes ; on peut les regarder comme des décrets arbitraires qui ne sont que les définitions déguisées des notions fondamentales. C'est ainsi qu'au début de la géométrie, M. Hilbert introduit des « choses » qu'il appelle points, droites et plans, et que, oubliant ou paraissant oublier un instant le sens vulgaire de ces mots, il pose entre ces choses diverses relations qui les définissent.

Pour que cela soit légitime, il faut démontrer que les axiomes ainsi introduits ne sont pas contradictoires, et M. Hilbert y a parfaitement réussi en ce qui concerne la géométrie, parce qu'il supposait l'analyse déjà constituée et qu'il a pu s'en servir pour cette démonstration. M. Zermelo n’a pas démontré que ses axiomes étaient exempts de contradiction, et il ne pouvait le faire, car, pour cela, il lui aurait fallu s'appuyer sur d'autres vérités déjà établies ; or des vérités déjà établies, une science déjà faite, il suppose qu'il n'y en a pas encore, il fait table rase, et il veut que ses axiomes se suffisent entièrement à eux-mêmes.

Les postulats ne peuvent donc tirer leur valeur d'une sorte de décret arbitraire, il faut qu'ils soient évidents par eux-mêmes. Il nous faudra donc, non pas démontrer cette évidence, puisque l'évidence ne se démontre pas, mais chercher à pénétrer le mécanisme psychologique qui a créé ce sentiment de l'évidence. Et voici d'où provient la difficulté ; M. Zermelo admet certains axiomes, et il en rejette d'autres qui, au premier abord, peuvent sembler aussi évidents que ceux qu'il conserve ; s'il les conservait tous, il tomberait dans la contradiction, il lui fallait donc faire un choix, mais on peut se demander quelles sont les raisons de son choix, et c'est ce qui nous oblige à quelque attention.

Ainsi il commence par rejeter la définition de Cantor : un ensemble est la réunion d'objets distincts quelconques considérés comme formant un tout. Je n'ai donc pas le droit de parler de l'ensemble de tous les objets qui satisfont à telle ou telle condition. Ces objets ne forment pas un ensemble, une Menge, mais il faut bien mettre quelque chose à la place de la définition qu'on rejette. M. Zermelo se borne à dire : considérons un domaine (Bereich) d'objets quelconques ; il peut arriver qu'entre deux de ces objets et , il y ait une relation de la forme  ; nous dirons alors que est un élément de , et que est un ensemble, une Menge.

Évidemment ce n'est pas là une définition, quelqu'un qui ne sait pas ce que c’est qu’une Menge, ne le saura pas davantage quand il aura appris qu'elle est représentée par le symbole , puisqu'il ne sait pas ce que c'est que . Cela pourrait aller si ce symbole devait être défini dans la suite par les axiomes eux-mêmes qui seraient regardés comme des décrets arbitraires. Mais nous venons de voir que ce point de vue était intenable. Il faut donc que nous sachions d’avance ce que c'est qu’une Menge, que nous en ayons l'intuition, et c'est cette intuition qui nous fera comprendre ce que c’est que , qui ne serait sans cela qu'un symbole dépourvu de sens, et dont on ne pourrait affirmer aucune propriété évidente par elle-même. Mais qu’est-ce que cette intuition peut être si elle n’est pas la définition de Cantor que nous avons dédaigneusement rejetée ?

Passons sur cette difficulté que nous chercherons plus loin à éclaircir et énumérons les axiomes admis par M. Zermelo ; ils sont au nombre de sept :

1° Deux Mengen qui ont mêmes éléments sont identiques.

2° Il y a une Menge qui ne contient aucun élément, c’est la Nullmenge ; s'il existe un objet , il existe une Menge dont cet objet est l'unique élément ; s'il existe deux objets et , il existe une Menge dont ces deux objets sont les seuls éléments.

3° L'ensemble de tous les éléments d'une Menge qui satisfont à une condition forme un sous-ensemble, une Untermenge de .

4° A chaque Menge correspond une autre Menge , formée de toutes les Untermengen de .

5° Considérons une Menge dont les éléments sont eux-mêmes des Mengen; il existe une Menge , dont les éléments sont les éléments des éléments de . Si par exemple a trois éléments , qui sont eux-mêmes des Mengen ; si a deux éléments et , deux éléments et , deux éléments et , aura six éléments .

6° Si on a une Menge dont les éléments sont eux-mêmes des Mengen, on peut choisir dans chacune de ces Mengen élémentaires un élément, et l'ensemble des éléments ainsi choisis forme une Untermenge de .

7° Il existe au moins une Menge infinie.

Avant de discuter ces axiomes, je dois répondre à une question ; pourquoi, dans leur énoncé, ai-je conservé le nom allemand Menge au lieu de le traduire par le mot français ensemble ? C'est parce que je ne suis pas sûr que le mot Menge conserve dans ces axiomes son sens intuitif, sans quoi il serait difficile de rejeter la définition de Cantor; or le mot français ensemble suggère ce sens intuitif d'une façon trop impérieuse, pour qu'on puisse l'employer sans inconvénient quand ce sens est altéré.

Je n'insisterai pas beaucoup sur le 7e axiome ; j'en dois cependant dire un mot pour faire remarquer la façon très originale dont M. Zermelo l'énonce ; il ne se contente pas en effet de l’énoncé que j'ai donné ; il dit : il existe une Menge qui ne peut contenir l'élément , sans contenir également comme élément la Menge , c'est-à-dire celle dont est l'unique élément. Et alors si admet l'élément , elle en admettra une série d'autres, à savoir la Menge dont est l'unique élément, la Menge dont l'unique élément est la Menge dont l'unique élément est et ainsi de suite. On voit assez que le nombre de ces éléments doit être infini. Au premier abord, ce détour parait bien bizarre et bien artificiel, et il l'est en effet ; mais M. Zermelo a voulu éviter de prononcer le mot infini, parce qu'il considère ses axiomes comme antérieurs à la distinction du fini et de l'infini.

Passons aux six premiers axiomes ; ils peuvent être regardés comme évidents, dès qu'on donne au mot Menge son sens intuitif et si on ne considère que des objets en nombre fini. Mais ils ne le sont pas plus que cet autre axiome que l'auteur rejette expressément :

Des objets quelconques forment une Menge.

Et alors nous devons nous poser une question ; pourquoi l'évidence de l'axiome 8 cesse-t-elle dès qu'il s'agit de collections infinies, tandis que celle des six premiers subsiste ?

Si, pour résoudre cette question, nous nous reportons à l'énoncé des axiomes, nous aurons un premier étonnement; nous constaterons que tous ces axiomes sans exception ne nous apprennent qu'une chose, c'est que certaines collections, formées d'après certaines lois, constituent des Mengen; de sorte que ces axiomes ne nous apparaîtront plus que comme des règles destinées à étendre le sens du mot Menge, comme de pures définitions de mots. Et cela est vrai aussi bien du 8° axiome que nous rejetons, que des sept premiers que nous acceptons.

Nous sommes avertis pourtant bien vite que cette première impression est trompeuse ; de semblables définitions de mots ne nous exposeraient pas à la contradiction; celle-ci ne serait à craindre que si nous avions d'autres axiomes affirmant que certaines collections ne sont pas des Mengen ; et nous n'en avons pas. Cependant si nous rejetons le 8e axiome, c'est pour éviter la contradiction : M. Zermelo le dit explicitement.

Il faut donc bien qu'il n'ait pas considéré ses axiomes comme de simples définitions de mots, et qu'il ait attribué au mot Menge un sens intuitif préexistant à tous ses énoncés, quoique différant quelque peu du sens habituel. Il n'est pas impossible de l'apercevoir en recherchant l'usage que l'auteur en fait dans ses raisonnements. Une Menge c'est quelque chose sur quoi l'on peut raisonner ; c'est quelque chose de fixe et d'immuable dans une certaine mesure. Définir un ensemble, une Menge, une collection quelconque, c'est toujours faire une classification, séparer les objets qui appartiennent à cet ensemble de ceux qui n'en font pas partie. Nous dirons alors que cet ensemble n'est pas une Menge, si la classification correspondante n'est pas prédicative, et que c'est une Menge, si cette classification est prédicative ou si on peut en raisonner comme si elle l'était.

Si nous rejetons le 8e axiome, c'est parce que des objets quelconques formeront sans doute une collection, mais une collection qui ne sera jamais close, et dont l'ordre pourra à chaque instant être troublé par l'adjonction d'éléments inattendus. C'est une collection qui n'est pas prédicative et au contraire, quand nous disons par exemple qu'à chaque Menge correspond une autre Menge ou définie de telle ou telle manière, nous affirmons que cette définition est prédicative, ou que nous avons le droit de faire comme si elle l'était.

Et c'est ici le lieu de parler d'une distinction qui joue un rôle essentiel dans la théorie de M. Zermelo : « Eine Frage oder Aussage , ueber deren Gültigkeit oder Ungültigkeit die Grundbeziehungen des Bereiches vermöge der Axiome und der allgemeingültigen logischen Gesetze ohne Willkür unterscheiden, heisst definit. » Le mot definit semble ici sensiblement synonyme de prédicatif. Mais l'usage qu'en fait M. Zermelo montre que la synonymie n'est pas parfaite. Ainsi supposons par exemple que cette question soit la suivante : tel élément de la Menge possède-t-il telle relation avec tous les autres éléments de la même Menge, et que nous convenions de dire que tous les éléments pour lesquels on doit répondre oui forment une classe  ? Pour moi, et je crois aussi pour M. Russell, une pareille Question n'est pas prédicative ; parce que les autres éléments de sont en nombre infini, qu'on pourra sans cesse en introduire de nouveaux, et que parmi les nouveaux éléments introduits, il pourra y en avoir dans la définition desquels entre la notion de la classe , c'est-à-dire de l'ensemble des éléments qui possèdent la propriété . Pour M. Zermelo, cette question serait definit sans que je sache exactement où est la démarcation exacte, entre les questions qui sont definit et celles qui ne le sont pas. Il lui semble que, pour savoir si un élément possède la propriété par rapport à tous les autres éléments de , il suffit de vérifier s'il la possède par rapport à chacun d'eux. Si la question est definit par rapport à chacun de ses éléments, elle le sera ipso facto par rapport à tous ces éléments.

Et c'est ici qu'apparaît la divergence de nos vues. M. Zermelo s'interdit de considérer l'ensemble de tous les objets qui satisfont à une certaine condition parce qu'il lui semble que cet ensemble n'est jamais clos ; qu'on pourra toujours y faire entrer de nouveaux objets. Au contraire il n'a aucun scrupule à parler de l'ensemble des objets qui font partie d'une certaine Menge et qui satisfont de plus à une certaine condition. Il lui semble qu'il ne peut posséder une Menge, sans posséder du même coup tous ses éléments. Parmi ces éléments, il choisira ceux qui satisfont à une condition donnée, et il pourra faire ce choix bien tranquillement, sans crainte qu'on vienne le troubler en introduisant des éléments nouveaux et inattendus, puisque ces éléments, il les a déjà tous entre les mains. En posant d'avance sa Menge , il a élevé un mur de clôture qui arrête les gêneurs qui pourraient venir du dehors. Mais il ne se demande pas s'il ne peut y avoir des gêneurs du dedans qu'il a enfermés avec lui dans son mur. Si la Menge a une infinité d’éléments, cela veut dire non que ces éléments puissent être conçus comme existant d'avance tous à la fois, mais qu'il peut sans cesse en naître de nouveaux ; ils naîtront à l'intérieur du mur, au lieu de naître dehors, voilà tout. Quand je parle de tous les nombres entiers, je veux dire tous les nombres entiers qu'on a inventés et tous ceux qu'on pourra inventer un jour ; quand je parle de tous les points de l'espace, je veux dire tous les points dont les coordonnées sont exprimables par des nombres rationnels, ou par des nombres algébriques, ou par des intégrales, ou de toute autre manière que l'on pourra inventer. Et c'est ce « l’on pourra » qui est l’infini. Mais on pourra en inventer que l'on définira de bien des façons, et si nous reprenons comme tout à l'heure notre question et notre classe , la question se pose de nouveau chaque fois qu'on définira un nouvel élément de  ; or, parmi ces éléments que nous pourrons définir, il y en aura dont la définition dépendra de cette classe . De sorte que le cercle vicieux n'aura pu être évité.

Voilà pourquoi les axiomes de M. Zermelo du sauraient me satisfaire. Non seulement ils ne me semblent pas évidents, mais quand l'on me demandera s'ils sont exempts de contradiction, je ne saurai que répondre. L'auteur a cru éviter le paradoxe du plus grand cardinal, en s'interdisant toute spéculation en dehors de l'enceinte d'une Menge bien close ; il a cru éviter le paradoxe de Richard, en ne posant que des questions definit, ce qui, d'après le sens qu'il donne à cette expression, exclut toute considération sur les objets qui peuvent être définis en un nombre fini de mots. Mais s'il a bien fermé sa bergerie, je ne suis pas sûr qu'il n'y ait pas enfermé le loup. Je ne serais tranquille que s'il avait démontré qu'il est à l'abri de la contradiction ; je sais bien qu'il ne pouvait le faire, puisqu'il aurait fallu s'appuyer par exemple sur le principe d'induction, qu’il ne révoquait pas en doute, mais qu'il se proposait de démontrer plus loin. Il aurait dû passer outre ; cela aurait été au prix d'une faute de logique, mais du moins nous en serions sûrs.


§ 6. — L’EMPLOI DE L’INFINI

Est-il possible de raisonner sur des objets qui ae peuvent pas être définis en un nombre fini de mots ? Est-il possible même d'en parler en sachant de quoi l'on parle, et. en prononçant autre chose que des paroles vides ? Ou au contraire doit-on les regarder comme impensables ? Quant à moi, je n'hésite pas à répondre que ce sont de purs néants.

Tous les objets que nous aurons jamais à envisager, ou bien seront définis en un nombre fini de mots, ou bien ne seront qu’imparfaitement déterminés et demeureront indiscernables d’une foule d’autres objets ; et nous ne pourrons raisonner congrument à leur endroit, que quand nous les aurons distingués de ces autres objets avec lesquels ils demeurent confondus, c’est-à-dire quand nous serons arrivés à les définir en un nombre fini de mots.

Si nous considérons un ensemble, et que nous voulions en définir les différents éléments, cette définition se décomposera naturellement en deux parties ; la première partie de la définition, commune à tous les éléments de l’ensemble, nous apprendra à les distinguer des éléments qui sont étrangers à cet ensemble ; ce sera la définition de l’ensemble ; la seconde partie nous apprendra à distinguer les uns des autres les différents éléments de l’ensemble.

Chacune de ces deux parties devra se composer d’un nombre fini de mots. Si on parle de tous les éléments d’un ensemble dont on donne la définition, on veut parler de tous les objets qui satisfont à la première partie de la définition et qu’on pourra achever de définir par telle phrase d’un nombre fini de mots que l’on voudra. On ne vous donne que la moitié de la définition, vous pouvez ensuite la compléter, en choisissant la seconde moitié comme il vous plaira ; mais il faut que vous la complétiez. Si j'affirme une proposition au sujet de tous les objets d'un ensemble, je veux dire que si un objet satisfait à la première partie de la définition, la proposition en ce qui concerne cet objet restera vraie, quelle que soit la manière dont vous énoncerez la seconde partie ; mais si vous pouvez l'énoncer comme vous voulez, il est nécessaire que vous l'énonciez, sans quoi l'objet serait impensable et la proposition n'aurait aucun sens.

Ce n'est pas qu'on ne puisse faire et qu'on n'ait fait quelques objections à cette façon de voir. Les phrases d'un nombre fini de mots pourront toujours être numérotées, puisqu'on peut par exemple les classer par ordre alphabétique. Si tous les objets pensables doivent être définis par de semblables phrases, on pourra aussi leur donner un numéro. Il n'y aurait donc pas plus d'objets pensables que de nombres entiers; et si l'on considère l'espace, par exemple, si l'on en exclut les points qui ne peuvent être définis en un nombre fini de mots et qui sont de purs néants, il n'y restera pas plus de points qu'il n'y a de nombres entiers. Et Cantor a démontré le contraire.

Ce n'est là qu'un trompe-l'œil ; représenter les points de l'espace par la phrase qui sert à les définir ; classer ces phrases et les points correspondants d'après les lettres qui forment ces phrases, c'est construire une classification qui n'est pas prédicative, qui entraîne tous les inconvénients, tous les paralogismes, toutes les antinomies dont j'ai parlé au début de ce chapitre. Qu'a voulu dire Cantor et qu'a-t-il réellement démontré ? On ne peut trouver, entre les nombres entiers et les points de l'espace définissables en un nombre fini de mots, une loi de correspondance satisfaisant aux conditions suivantes : 1° Cette loi peut s'énoncer en un nombre fini de mots. 2° Étant donné un entier quelconque, on peut trouver le point de l'espace correspondant, et ce point sera entièrement défini sans ambiguïté ; la définition de ce point qui se compose de deux parties, la définition de l'entier et l'énoncé de la loi de correspondance, se réduira à un nombre fini de mots, puisque notre entier peut se définir, et notre loi s'énoncer en nombre fini de mots. 3° Étant donné un point de l'espace que je suppose défini en un nombre fini de mots (sans m'interdire de faire figurer dans cette définition des allusions à la loi de correspondance elle-même, ce qui est essentiel dans la démonstration de Cantor) il y aura un entier qui sera déterminé sans ambiguïté par l'énoncé de la loi de correspondance et par la définition du point . 4° La loi de correspondance doit être prédicative, c'est-à-dire que si elle fait correspondre un point à un entier, elle ne devra pas cesser de faire correspondre ce point à ce même entier, quand on aura introduit de nouveaux points de l'espace. Voilà ce que Cantor a démontré et cela reste toujours vrai ; on voit quel est le sens compliqué enfermé dans cette brève proposition : le nombre cardinal des points de l'espace est plus grand que celui des entiers.

Et alors que devons-nous conclure ? Tout théorème de mathématiques doit pouvoir être vérifié. Quand j'énonce ce théorème, j'affirme que toutes les vérifications que j'en tenterai réussiront ; et même si l'une de ces vérifications exige un travail qui excéderait les forces d’un homme, j'affirme que, si plusieurs générations, cent, s'il le faut, jugent à propos de s'atteler à cette vérification, elle réussira encore. Le théorème n'a pas d'autre sens, et cela est encore vrai si dans son énoncé on parle de nombres infinis; mais comme les vérifications ne peuvent porter que sur des nombres finis, il s'ensuit que tout théorème sur les nombres infinis ou surtout sur ce qu'on appelle ensembles infinis, ou cardinaux transfinis, ou ordinaux transfinis, etc., etc., ne peut être qu'une façon abrégée d'énoncer des propositions sur les nombres finis. S'il en est autrement, ce théorème ne sera pas vérifiable, et s'il n'est pas vérifiable, il n'aura pas de sens.

Et il s'ensuit qu'il ne saurait y avoir d'axiome évident concernant les nombres infinis ; toute propriété des nombres infinis n'est que la traduction d’une propriété des nombres finis ; c'est cette dernière qui pourra être évidente, tandis qu'il faudra démontrer la première en la comparant à la dernière et en montrant que la traduction est exacte.


§ 7. — RÉSUMÉ

Les antinomies auxquelles certains logiciens ont été conduits proviennent de ce qu'ils n'ont pas pu éviter certains cercles vicieux. Cela leur est arrivé quand ils considéraient des collections finies, mais cela leur est arrivé bien plus souvent quand ils avaient la prétention de traiter des collections infinies. Dans le premier cas, ils auraient pu éviter aisément le piège où ils sont tombés ; ou plus exactement ils ont eux-mêmes tendu le piège où ils se sont amusés à tomber, et même ils ont été obligés de faire bien attention pour ne pas tomber à côté du piège ; en un mot, dans ce cas les antinomies ne sont que des joujoux. Bien différentes sont celles qu'engendre la notion de l'infini ; il arrive souvent qu'on y tombe sans le faire exprès, et même quand on est averti, on n'est pas encore bien tranquille.

Les tentatives qui ont été faites pour sortir de ces difficultés sont intéressantes à plus d'un titre, mais elles ne sont pas entièrement satisfaisantes. M. Zermelo a voulu construire un système impeccable d'axiomes ; mais ces axiomes ne peuvent être regardés comme des décrets arbitraires, puisqu'il faudrait démontrer que ces décrets ne sont pas contradictoires, et qu'ayant fait entièrement table rase on n'a plus rien sur quoi l'on puisse appuyer une semblable démonstration. Il faut donc que ces axiomes soient évidents par eux-mêmes. Or quel est le mécanisme par lequel on les a construits ? on a pris les axiomes qui sont vrais des collections finies ; on ne pouvait les étendre tous aux collections infinies, on n'a fait cette extension que pour un certain nombre d'entre eux, choisis plus ou moins arbitrairement. A mon sens, d'ailleurs, ainsi que je l'ai dit plus haut, aucune proposition concernant les collections infinies ne peut être évidente par intuition.

M. Russell a mieux compris la nature de la difficulté à vaincre, il ne l'a cependant pas entièrement vaincue, parce que sa hiérarchie des types suppose la théorie des ordinaux déjà faite.

Quant à moi, je proposerais de s'en tenir aux règles suivantes :

1° Ne jamais envisager que des objets susceptibles d'être définis en un nombre fini de mots ;

2° Ne jamais perdre de vue que toute proposition sur l'infini doit être la traduction, l’énoncé abrégé de propositions sur le fini ;

3° Éviter les classifications et les définitions non prédicatives.

Toutes les recherches dont nous avons parlé ont un caractère commun. On se propose d'enseigner les mathématiques à un élève qui ne sait pas encore la différence qu'il y a entre l'infini et le fini ; on ne se hâte pas de lui apprendre en quoi consiste cette différence ; on commence par lui montrer tout ce qu'on peut savoir de l'infini sans se préoccuper de cette distinction ; puis dans une région écartée du champ qu'on lui a fait parcourir, on lui découvre un petit coin où se cachent les nombres finis.

Cela me paraît psychologiquement faux; ce n'est pas ainsi que l'esprit humain procède naturellement, et quand même on devrait s'en tirer sans trop de mésaventures antinomiques, cela n'en serait pas moins une méthode contraire à toute saine psychologie.

M. Russell me dira sans doute qu'il ne s'agit pas de psychologie, mais de logique et d'épistémologie ; et moi, je serai conduit à répondre qu'il n'y a pas de logique et d'épistémologie indépendantes de ta psychologie ; et cette profession de foi clora probablement la discussion parce qu'elle mettra en évidence une irrémédiable divergence de vues.