Essai philosophique sur les probabilités/2f

La plupart de nos jugemens étant fondés sur la probabilité des témoignages, il est bien important de la soumettre au calcul. La chose, il est vrai, devient souvent impossible, par la difficulté d’apprécier la véracité des témoins, et par le grand nombre de circonstances dont les faits qu’ils attestent sont accompagnés ; mais on peut dans plusieurs cas, résoudre des problèmes qui ont beaucoup d’analogie avec les questions qu’on se propose, et dont les solutions peuvent être regardées comme des approximations propres à nous guider et à nous garantir des erreurs et des dangers auxquels de mauvais raisonnemens nous exposent. Une approximation de ce genre, lorsqu’elle est bien conduite, est toujours préférable aux raisonnemens les plus spécieux. Essayons donc de donner quelques règles générales pour y parvenir.

On a extrait un seul numéro d’une urne qui en renferme mille. Un témoin de ce tirage annonce que le no 79 est sorti ; on demande la probabilité de cette sortie. Supposons que l’expérience ait fait connaître que ce témoin trompe une fois sur dix, en sorte que la probabilité de son témoignage soit . Ici, l’évènement observé est le témoin attestant que le no 79 est sorti. Cet évènement peut résulter des deux hypothèses suivantes, savoir : que le témoin énonce la vérité, ou qu’il trompe. Suivant le principe que nous avons exposé sur la probabilité des causes, tirée des évènemens observés, il faut d’abord déterminer à priori la probabilité de l’évènement dans chaque hypothèse. Dans la première, la probabilité que le témoin annoncera le no 79, est la probabilité même de la sortie de ce numéro, c’est-à-dire . Il faut la multiplier par la probabilité de la véracité du témoin ; on aura donc pour la probabilité de l’événement observé dans cette hypothèse. Si le témoin trompe, le no 79 n’est pas sorti, et la probabilité de ce cas est . Mais pour annoncer la sortie de ce numéro, le témoin doit le choisir parmi les 999 numéros non sortis ; et comme il est supposé n’avoir aucun motif de préférence pour les uns plutôt que pour les autres, la probabilité qu’il choisira le no 79 est  ; en multipliant donc cette probabilité par la précédente, on aura pour la probabilité que le témoin annoncera le no 79 dans la seconde hypothèse. Il faut encore multiplier cette probabilité par la probabilité de l’hypothèse elle-même ; ce qui donne pour la probabilité de l’évènement relative à cette hypothèse. Présentement, si l’on forme une fraction dont le numérateur soit la probabilité relative à la première hypothèse, et dont le dénominateur soit la somme des probabilités relatives aux deux hypothèses, on aura, par le sixième principe, la probabilité de la première hypothèse, et cette probabilité sera , c’est-à-dire la véracité même du témoin. C’est aussi la probabilité de la sortie du no 79. La probabilité du mensonge du témoin et de la non-sortie de ce numéro est .

Si le témoin, voulant tromper, avait quelque intérêt à choisir le no 79 parmi les numéros non sortis ; s’il jugeait, par exemple, qu’ayant placé sur ce numéro une mise considérable, l’annonce de sa sortie augmentera son crédit ; la probabilité qu’il choisira ce numéro ne sera plus, comme auparavant,  ; elle pourra être alors , , etc., suivant l’intérêt qu’il aura d’annoncer sa sortie. En la supposant , il faudra multiplier par cette fraction la probabilité , pout avoir dans l’hypothèse du mensonge la probabilité de l’évènement observé, qu’il faut encore multiplier par  ; ce qui donne pour la probabilité de l’évènement dans la seconde hypothèse. Alors la probabilité de la première hypothèse, ou de la sortie du no 79, se réduit, par la règle précédente, à . Elle est donc très affaiblie par la considération de l’intérêt que le témoin peut avoir à annoncer la sortie du no 79. À la vérité, ce même intérêt augmente la probabilité que le témoin dira la vérité, si le no 79 sort. Mais cette probabilité ne peut excéder l’unité ou  ; ainsi la probabilité de la sortie du no 79 ne surpassera pas . Le bon sens nous dicte que cet intérêt doit inspirer de la défiance ; mais le calcul en apprécie l’influence.

La probabilité à priori du numéro énoncé par le témoin est l’unité divisée par le nombre des numéros de l’urne ; elle se transforme en vertu du témoignage dans la véracité même du témoin ; elle peut donc être affaiblie par ce témoignage. Si, par exemple, l’urne ne renferme que deux numéros, ce qui donne pour la probabilité à priori de la sortie du no 1, et si la véracité d’un témoin qui l’annonce est , cette sortie en devient moins probable. En effet, il est visible que le témoin ayant alors plus de pente vers le mensonge que vers la vérité, son témoignage doit diminuer la probabilité du fait attesté, toutes les fois que cette probabilité égale ou surpasse . Mais s’il y a trois numéros dans l’urne, la probabilité à priori de la sortie du no 1 est accrue par l’affirmation d’un témoin dont la véracité surpasse .

Supposons maintenant que l’urne renferme 999 boules noires et une boule blanche, et qu’une boule en ayant été extraite, un témoin du tirage annonce que cette boule est blanche. La probabilité de l’évènement observé, déterminée à priori dans la première hypothèse, sera ici, comme dans la question précédente, égale à . Mais dans l’hypothèse où le témoin trompe, la boule blanche n’est pas sortie, et la probabilité de ce cas est . Il faut la multiplier par la probabilité du mensonge, ce qui donne pour la probabilité de l’évènement observé relative à la seconde hypothèse. Cette probabilité n’était que dans la question précédente : cette grande différence tient à ce qu’une boule noire étant sortie, le témoin qui veut tromper n’a point de choix à faire parmi les 999 boules non sorties, pour annoncer la sortie d’une boule blanche. Maintenant, si l’on forme deux fractions dont les numérateurs soient les probabilités relatives à chaque hypothèse, et dont le dénominateur commun soit la somme de ces probabilités, on aura pour la probabilité de la première hypotlièse et de la sortie d’une boule blanche, et pour la probabilité de la seconde hypothèse et de la sortie d’une boule noire. Cette dernière probabilité est fort approchante de la certitude : elle en approcherait beaucoup plus encore, et deviendrait , si l’urne renfermait un million de boules dont une seule serait blanche, la sortie d’une boule blanche devenant alors beaucoup plus extraordinaire. On voit ainsi comment la probabilité du mensonge croît à mesure que le fait devient plus extraordinaire.

Nous avons supposé jusqu’ici que le témoin ne se trompait point ; mais si l’on admet encore la chance de son erreur, le fait extraordinaire devient plus invraisemblable. Alors au lieu de deux hypothèses, on aura les quatre suivantes, savoir : celle du témoin ne trompant point et ne se trompant point ; celle du témoin ne trompant point et se trompant ; l’hypothèse du témoin trompant et ne se trompant point ; enfin celle du témoin trompant et se trompant. En déterminant à priori dans chacune de ces hypothèses, la probabilité de l’événement observé, on trouve par le sixième principe, la probabilité que le fait attesté est faux, égale à une fraction dont le numérateur est le nombre des boules noires de l’urne, multiplié par la somme des probabilités que le témoin ne trompe point et se trompe, ou qu’il trompe et ne se trompe point, et dont le dénominateur est ce numérateur augmenté de la somme des probabilités que le témoin ne trompe point et ne se trompe point, ou qu’il trompe et se trompe à la fois. On voit par là que si le nombre des boules noires de l’urne est très grand, ce qui rend extraordinaire la sortie de la boule blanche, la probabilité que le fait attesté n’est pas, approche extrêmement de la certitude.

En étendant cette conséquence à tous les faits extraordinaires, il en résulte que la probabilité de l’erreur ou du mensonge du témoin devient d’autant plus grande, que le fait attesté est plus extraordinaire. Quelques auteurs ont avancé le contraire, en se fondant sur ce que la vue d’un fait extraordinaire étant parfaitement semblable à celle d’un fait ordinaire, les mêmes motifs doivent nous porter à croire également le témoin, quand il affirme l’un ou l’autre de ces faits. Le simple bon sens repousse une aussi étrange assertion ; mais le calcul des probabilités, en confirmant l’indication du sens commun, apprécie de plus l’invraisemblance des témoignages sur les faits extraordinaires.

Ces auteurs insistent et supposent deux témoins également dignes de foi, dont le premier atteste qu’il a vu mort, il y a quinze jours, un individu que le second témoin affirme avoir vu hier plein de vie. L’un ou l’autre de ces faits n’offre rien d’invraisemblable. La résurrection de l’individu est une conséquence de leur ensemble ; mais les témoignages ne portant point directement sur elle, ce qu’elle a d’extraordinaire ne doit point affaiblir la croyance qui leur est due. (Encyclopédie, art. Certitude.)

Cependant, si la conséquence qui résulte de l’ensemble des témoignages était impossible, l’un d’eux serait nécessairement faux ; or, une conséquence impossible est la limite des conséquences extraordinaires, comme l’erreur est la limite des invraisemblances ; la valeur des témoignages, qui devient nulle dans le cas d’une conséquence impossible, doit donc être très affaiblie dans celui d’une conséquence extraordinaire. C’est en effet ce que le calcul des probabilités confirme.

Pour le faire voir, considérons deux urnes Α et B, dont la première contienne un million de boules blanches, et la seconde un million de boules noires. On tire de l’une de ces urnes une boule que l’on remet dans l’autre urne dont on extrait ensuite une boule. Deux témoins, l’un du premier tirage, l’autre du second, attestent que la boule qu’ils ont vu extraire est blanche, sans indiquer l’urne dont elle a été extraite. Chaque témoignage pris isolément n’a rien d’invraisemblable ; et il est facile de voir que la probabilité du fait attesté est la véracité même du témoin. Mais il suit de l’ensemble des témoignages, qu’une boule blanche a été extraite de l’urne Α au premier tirage, et qu’ensuite, mise dans l’urne B, elle a reparu au second tirage, ce qui est fort extraordinaire ; car cette seconde urne renfermant alors une boule blanche sur un million de boules noires, la probabilité d’en extraire la boule blanche est . Pour déterminer l’affaiblissement qui en résulte dans la probabilité de la chose énoncée par les deux témoins, nous remarquerons que l’évènement observé est ici l’affirmation par chacun d’eux que la boule qu’il a vu extraire est blanche. Représentons par la probabilité qu’il énonce la vérité, ce qui peut avoir lieu dans le cas présent, lorsque le témoin ne trompe point et ne se trompe point, et lorsqu’il trompe et se trompe à la fois. On peut former les quatre hypothèses suivantes :

1o. Le premier et le second témoin disent la vérité. Alors une boule blanche a d’abord été extraite de l’urne Α, et la probabilité de cet évènement est , puisque la boule extraite au premier tirage a pu sortir également de l’une ou de l’autre urne. Ensuite, la boule extraite mise dans l’urne B a reparu au second tirage : la probabilité de cet événement est  ; la probabilité du fait énoncé est donc . En la multipliant par le produit des probabilités et que les témoins disent la vérité, on aura pour la probabilité de l’évènement observé, dans cette première hypothèse.

2o. Le premier témoin dit la vérité, et le second ne la dit point, soit qu’il trompe et ne se trompe point, soit qu’il ne trompe point et se trompe. Alors une boule blanche est sortie de l’urne Α au premier tirage, et la probabilité de cet évènement est . Ensuite cette boule ayant été mise dans l’urne B, une boule noire en a été extraite : la probabilité de cette extraction est  ; on a donc pour la probabilité de l’évènement composé. En la multipliant par le produit des deux probabilités et que le premier témoin dit la vérité et que le second ne la dit point, on aura pour la probabilité de l’évènement observé dans la seconde hypothèse.

3o. Le premier témoin ne dit pas la vérité, et le second l’énonce. Alors une boule noire est sortie de l’urne B au premier tirage, et après avoir été mise dans l’urne Α, une boule blanche a été extraite de cette urne. La probabilité du premier de ces évènemens est , et celle du second est  ; la probabilité de l’évènement composé est donc . En la multipliant par le produit des probabilités et , que le premier témoin ne dit pas la vérité, et que le second l’énonce, on aura pour la probabilité de l’évènement observé relative à cette hypothèse.

4o. Enfin, aucun des témoins ne dit la vérité. Alors une boule noire a été extraite de l’urne B au premier tirage ; ensuite ayant été mise dans l’urne Α, elle a reparu au second tirage : la probabilité de cet évènement composé est . En la multipliant par le produit des probabilités et , que chaque témoin ne dit pas la vérité, on aura pour la probabilité de l’évènement observé dans cette hypothèse.

Maintenant, pour avoir la probabilité de la chose énoncée par les deux témoins, savoir, qu’une boule blanche a été extraite à chacun des tirages, il faut diviser la probabilité correspondante à la première hypothèse par la somme des probabilités relatives aux quatre hypothèses ; et alors on a pour cette probabilité , fraction extrêmement petite.

Si les deux témoins affirmaient, le premier, qu’une boule blanche a été extraite de l’une des deux urnes Α et B ; le second, qu’une boule blanche a été pareillement extraite de l’une des deux urnes Α et B, en tout semblables aux premières, la probabilité de la chose énoncée par les deux témoins serait le produit des probabilités de leurs témoignages ou  ; elle serait donc cent quatre-vingt mille fois au moins plus grande que la précédente. On voit par là combien, dans le premier cas, la réapparition au second tirage de la boule blanche extraite au premier, conséquence extraordinaire des deux témoignages, en affaiblit la valeur.

Nous n’ajouterions point foi au témoignage d’un homme qui nous attesterait qu’en projetant cent dés en l’air, ils sont tous retombés sur la même face. Si nous avions été nous-mêmes spectateurs de cet évènement, nous n’en croirions nos propres yeux qu’après en avoir scrupuleusement examiné toutes les circonstances, et après en avoir rendu d’autres yeux témoins, pour être bien sûrs qu’il n’y a eu ni hallucination ni prestige. Mais après cet examen, nous ne balancerions point à l’admettre, malgré son extrême invraisemblance ; et personne ne serait tenté, pour l’expliquer, de recourir à un renversement des lois de la vision. Nous devons en conclure que la probabilité de la constance des lois de la nature est pour nous supérieure à celle que l’évènement dont il s’agit ne doit point avoir lieu, probabilité supérieure elle-même à celle de la plupart des faits historiques que nous regardons comme incontestables. On peut juger par là du poids immense de témoignages nécessaire pour admettre une suspension des lois naturelles, et combien il serait abusif d’appliquer à ce cas les règles ordinaires de la critique. Tous ceux qui, sans offrir cette immensité de témoignages, étayent ce qu’ils avancent de récits d’évènemens contraires à ces lois, affaiblissent plutôt qu’ils n’augmentent la croyance qu’ils cherchent à inspirer ; car alors ces récits rendent très probable l’erreur ou le mensonge de leurs auteurs. Mais ce qui diminue la croyance des hommes éclairés, accroît souvent celle du vulgaire, toujours avide du merveilleux.

Il y a des choses tellement extraordinaires, que rien ne peut en balancer l’invraisemblance. Mais celle-ci, par l’effet d’une opinion dominante, peut être affaiblie au point de paraître inférieure à la probabilité des témoignages ; et quand cette opinion vient à changer, un récit absurde admis unanimement dans le siècle qui lui a donné naissance, n’offre aux siècles suivans qu’une nouvelle preuve de l’extrême influence de l’opinion générale sur les meilleurs esprits. Deux grands hommes du siècle de Louis XIV, Racine et Pascal, en sont des exemples frappans. Il est affligeant de voir avec quelle complaisance Racine, ce peintre admirable du cœur humain et le poète le plus parfait qui fut jamais, rapporte comme miraculeuse la guérison de la jeune Perrier, nièce de Pascal et pensionnaire à l’abbaye de Port-Royal : il est pénible de lire les raisonnemens par lesquels Pascal cherche à prouver que ce miracle devenait nécessaire à la religion, pour justifier la doctrine des religieuses de cette abbaye, alors persécutées par les Jésuites. La jeune Perrier était, depuis trois ans et demi, affligée d’une fistule lacrymale : elle toucha de son œil malade une relique que l’on prétendait être une des épines de la couronne du Sauveur, et elle se crut à l’instant guérie. Quelques jours après, les médecins et les chirurgiens constatèrent la guérison, et ils jugèrent que la nature et les remèdes n’y avaient eu aucune part. Cet événement, arrivé en 1656, ayant fait grand bruit, « tout Paris se porta, dit Racine, à Port-Royal. La foule croissait de jour en jour, et Dieu même semblait prendre plaisir à autoriser la dévotion des peuples, par la quantité de miracles qui se firent en cette église. » À cette époque, les miracles et les sortiléges ne paraissaient pas encore invraisemblables, et l’on n’hésitait point à leur attribuer les singularités de la nature, que l’on ne pouvait autrement expliquer.

Cette manière d’envisager les effets extraordinaires, se retrouve dans les ouvrages les plus remarquables du siècle de Louis XIV, dans l’Essai même sur l’entendement humain, du sage Locke, qui dit, en parlant des degrés d’assentiment : « Quoique la commune expérience et le cours ordinaire des choses aient avec raison une grande influence sur l’esprit des hommes, pour les porter à donner ou à refuser leur consentement à une chose qui leur est proposée à croire, il y a pourtant un cas où ce qu’il y a d’étrange dans un fait, n’affaiblit point l’assentiment que nous devons donner au témoignage sincère sur lequel il est fondé. Lorsque des évènemens surnaturels sont conformes aux fins que se propose celui qui a le pouvoir de changer le cours de la nature, dans un tel temps et dans de telles circonstances, ils peuvent être d’autant plus propres à trouver créance dans nos esprits, qu’ils sont plus au-dessus des observations ordinaires, ou même qu’ils y sont plus opposés. » Les vrais principes de la probabilité des témoignages ayant été ainsi méconnus des philosophes auxquels la raison est principalement redevable de ses progrès, j’ai cru devoir exposer avec étendue les résultats du calcul sur cet important objet.

Ici se présente naturellement la discussion d’un argument fameux de Pascal, que Craig, mathématicien anglais, a reproduit sous une forme géométrique. Des témoins attestent qu’ils tiennent de la Divinité même, qu’en se conformant à telle chose, on jouira, non pas d’une ou de deux, mais d’une infinité de vies heureuses. Quelque faible que soit la probabilité des témoignages, pourvu qu’elle ne soit pas infiniment petite, il est clair que l’avantage de ceux qui se conforment à la chose prescrite est infini, puisqu’il est le produit de cette probabilité par un bien infini ; on ne doit donc point balancer à se procurer cet avantage.

Cet argument est fondé sur le nombre infini des vies heureuses promises au nom de la Divinité par les témoins ; il faudrait donc faire ce qu’ils prescrivent, précisément parce qu’ils exagèrent leurs promesses au-delà de toutes limites, conséquence qui répugne au bon sens. Aussi le calcul nous fait-il voir que cette exagération même affaiblit la probabilité de leur témoignage, au point de la rendre infiniment petite ou nulle. En effet, ce cas revient à celui d’un témoin qui annoncerait la sortie du numéro le plus élevé d’une urne remplie d’un grand nombre de numéros dont un seul a été extrait, et qui aurait un grand intérêt à annoncer la sortie de ce numéro. On a vu précédemment combien cet intérêt affaiblit son témoignage. En n’évaluant qu’à la probabilité que si le témoin trompe il choisira le plus grand numéro, le calcul donne la probabilité de son annonce plus petite qu’une fraction dont le numérateur est l’unité, et dont le dénominateur est l’unité plus la moitié du produit du nombre des numéros, par la probabilité du mensonge considérée à priori ou indépendamment de l’annonce. Pour assimiler ce cas à celui de l’argument de Pascal, il suffit de représenter par les numéros de l’urne tous les nombres possibles de vies heureuses, ce qui rend le nombre de ces numéros infini ; et d’observer que si les témoins trompent, ils ont le plus grand intérêt, pour accréditer leur mensonge, à promettre une éternité de bonheur. L’expression de la probabilité de leur témoignage devient alors infiniment petite. En la multipliant par le nombre infini de vies heureuses promises, l’infini disparaît du produit qui exprime l’avantage résultant de cette promesse, ce qui détruit l’argument de Pascal.

Considérons présentement la probabilité de l’ensemble de plusieurs témoignages sur un fait déterminé. Pour fixer les idées, supposons que ce fait soit la sortie d’un numéro d’une urne qui en renferme cent et dont on a extrait un seul numéro. Deux témoins de ce tirage annoncent que le no 2 est sorti, et l’on demande la probabilité résultante de l’ensemble de ces témoignages. On peut former ces deux hypothèses : les témoins disent la vérité ; les témoins trompent. Dans la première hypothèse, le no 2 est sorti, et la probabilité de cet évènement est . Il faut la multiplier par le produit des véracités des témoins, véracités que nous supposerons être et  : on aura donc pour la probabilité de l’évènement observé dans cette hypothèse. Dans la seconde, le no 2 n’est pas sorti, et la probabilité de cet évènement est . Mais l’accord des témoins exige alors qu’en cherchant à tromper, ils choisissent tous deux le numéro 2 sur les 99 numéros non sortis : la probabilité de ce choix, si les témoins ne s’entendent point, est le produit de la fraction par elle-même ; il faut ensuite multiplier ces deux probabilités ensemble, et par le produit des probabilités et que les témoins trompent ; on aura ainsi pour la probabilité de l’évènement observé dans la seconde hypothèse. Maintenant on aura la probabilité du fait attesté ou de la sortie du no 2, en divisant la probabilité relative à la première hypothèse par la somme des probabilités relatives aux deux hypothèses ; cette probabilité sera donc , et la probabilité de la non-sortie de ce numéro et du mensonge des témoins sera .

Si l’urne ne renfermait que les numéros 1 et 2, on trouverait de la même manière pour la probabilité de la sortie du no 2, et par conséquent pour la probabilité du mensonge des témoins, probabilité quatre-vingt-quatorze fois au moins plus grande que la précédente. On voit par là combien la probabilité du mensonge des témoins diminue, quand le fait qu’ils attestent est moins probable en lui-même. En effet, on conçoit qu’alors l’accord des témoins, lorsqu’ils trompent, devient plus difficile, à moins qu’ils ne s’entendent, ce que nous ne supposons pas ici.

Dans le cas précédent où l’urne ne renfermant que deux numéros, la probabilité à priori du fait attesté est , la probabilité résultante des témoignages est le produit des véracités des témoins, divisé par ce produit ajouté à celui des probabilités respectives de leur mensonge.

Il nous reste à considérer l’influence du temps sur la probabilité des faits transmis par une chaîne traditionnelle de témoins. Il est clair que cette probabilité doit diminuer à mesure que la chaîne se prolonge. Si le fait n’a aucune probabilité par lui-même, tel que la sortie d’un numéro d’une urne qui en renferme une infinité, celle qu’il acquiert par les témoignages décroît suivant le produit continu de la véracité des témoins. Si le fait a par lui-même une probabilité ; si, par exemple, ce fait est la sortie du no 2 d’une urne qui en renferme un nombre fini, et dont il est certain qu’on a extrait un seul numéro ; ce que la chaîne traditionnelle ajoute à cette probabilité décroît suivant un produit continu, dont le premier facteur est le rapport du nombre des numéros de l’urne moins un à ce même nombre, et dont chaque autre facteur est la véracité de chaque témoin, diminuée du rapport de la probabilité de son mensonge au nombre des numéros de l’urne moins un ; en sorte que la limite de la probabilité du fait est celle de ce fait considérée à priori ou indépendamment des témoignages, probabilité égale à l’unité divisée par le nombre des numéros de l’urne.

L’action du temps affaiblit donc sans cesse la probabilité des faits historiques, comme elle altère les monumens les plus durables. On peut, à la vérité, la ralentir en multipliant et conservant les témoignages et les monumens qui les étayent. L’imprimerie offre pour cet objet un grand moyen malheureusement inconnu des anciens. Malgré les avantages infinis qu’elle procure, les révolutions physiques et morales dont la surface de ce globe sera toujours agitée, finiront, en se joignant à l’effet inévitable du temps, par rendre douteux, après des milliers d’années, les faits historiques aujourd’hui les plus certains.

Craig a essayé de soumettre au calcul l’affaiblissement graduel des preuves de la religion chrétienne : en supposant que le monde doit finir à l’époque où elle cessera d’être probable, il trouve que cela doit arriver 1454 ans après le moment où il écrit. Mais son analyse est aussi fautive que son hypothèse sur la durée du monde est bizarre.