Essai philosophique sur les probabilités/1d

L’application des principes que nous venons d’exposer aux diverses questions de probabilité, exige des méthodes dont la recherche a donné naissance à plusieurs branches de l’Analyse, et spécialement à la théorie des combinaisons et au calcul des différences finies.

Si l’on forme le produit des binomes, l’unité plus une première lettre, l’unité plus une seconde lettre, l’unité plus une troisième lettre, et ainsi de suite, jusqu’à n lettres ; en retranchant l’unité de ce produit développé, on aura la somme des combinaisons de toutes ces lettres prises une à une, deux à deux, trois à trois, etc., chaque combinaison ayant l’unité pour coefficient. Pour avoir le nombre des combinaisons de ces n lettres prises s à s, on observera que si l’on suppose ces lettres égales entre elles, le produit précédent deviendra la puissance n du binome, un plus la première lettre ; ainsi le nombre des combinaisons des n lettres prises s à s, sera le coefficient de la puissance s de la première lettre, dans le développement de ce binome ; on aura donc ce nombre, par la formule connue du binome.

On aura égard à la situation respective des lettres dans chaque combinaison, en observant que si l’on joint une seconde lettre à la première, on peut la placer au premier et au second rang ; ce qui donne deux combinaisons. Si l’on joint à ces combinaisons une troisième lettre, on peut lui donner dans chaque combinaison, le premier, le second et le troisième rang ; ce qui forme trois combinaisons relatives à chacune des deux autres ; en tout, six combinaisons. De là il est facile de conclure que le nombre des arrangemens dont s lettres sont susceptibles, est le produit des nombres depuis l’unité jusqu’à s ; il faut donc pour avoir égard à la situation respective des lettres, multiplier par ce produit le nombre des combinaisons des n lettres prises s à s ; ce qui revient à supprimer le dénominateur, du coefficient du terme du binome, qui exprime ce nombre.

Imaginons une loterie composée de n numéros dont r sortent à chaque tirage : on demande la probabilité de la sortie de s numéros donnés dans un tirage. Pour y parvenir, on formera une fraction dont le dénominateur sera le nombre de tous les cas possibles, ou des combinaisons des n numéros pris r à r, et dont le numérateur sera le nombre de toutes ces combinaisons qui contiennent les s numéros donnés. Ce dernier nombre est évidemment celui des combinaisons des autres numéros pris n moins s à n moins s. Cette fraction sera la probabilité demandée, et l’on trouvera facilement qu’elle se réduit à une fraction dont le numérateur est le nombre des combinaisons de r numéros pris s à s, et dont le dénominateur est le nombre des combinaisons des n numéros pris semblablement s à s. Ainsi, dans la loterie de France, formée, comme on sait, de 90 numéros dont cinq sortent à chaque tirage, la probabilité de la sortie d’un extrait donné est ou  ; la loterie devrait donc alors pour l’égalité du jeu, rendre dix-huit fois la mise. Le nombre total des combinaisons deux à deux, de 90 numéros est 4005, et celui des combinaisons deux à deux, de cinq numéros, est dix. La probabilité de la sortie d’un ambe donné est donc et la loterie devrait rendre alors quatre cents fois et demie, la mise : elle devrait la rendre 11 748 fois pour un terne, 511 038 fois pour un quaterne, et 43 949 268 fois pour un quine. La loterie est loin de faire aux joueurs, ces avantages.

Supposons dans une urne, a boules blanches et b boules noires, et qu’après en avoir extrait une boule, on la remette dans l’urne ; on demande la probabilité que dans le nombre n de tirages, on amènera m boules blanches et n moins m boules noires. Il est clair que le nombre de cas qui peuvent arriver à chaque tirage est a plus b. Chaque cas du second tirage, pouvant se combiner avec tous les cas du premier, le nombre de cas possibles en deux tirages, est le carré du binome a plus b. Dans le développement de ce carré, le carré de a exprime le nombre des cas dans lesquels on amène deux fois une boule blanche ; le double produit de a par b, exprime le nombre des cas dans lesquels une boule blanche et une boule noire sont amenées ; enfin le carré de b exprime le nombre des cas dans lesquels on amène deux boules noires. En continuant ainsi, on voit généralement que la puissance n du binome a plus b, exprime le nombre de tous les cas possibles dans n tirages ; et que dans le développement de cette puissance, le terme multiplié par la puissance m de a, exprime le nombre des cas dans lesquels on peut amener m boules blanches, et n moins m boules noires. En divisant donc ce terme par la puissance entière du binome, on aura la probabilité d’amener m boules blanches et n moins m boules noires. Le rapport des nombres a, et a plus b, étant la probabilité d’amener une boule blanche dans un tirage ; et le rapport des nombres b, et a plus b, étant la probabilité d’amener une boule noire ; si l’on nomme p et q ces probabilités, la probabilité d’amener m boules blanches dans n tirages, sera le terme multiplié par la puissance m de p, dans le développement de la puissance n du binome p plus q : on peut observer que la somme p plus q est l’unité. Cette propriété remarquable du binome, est très utile dans la théorie des probabilités.

Mais la méthode la plus générale et la plus directe, pour résoudre les questions de probabilité, consiste à les faire dépendre d’équations aux différences. En comparant les états successifs de la fonction qui exprime la probabilité, lorsque l’on fait croître les variables, de leurs différences respectives ; la question proposée fournit souvent un rapport très simple entre ces états. Ce rapport est ce que l’on nomme équation aux différences ordinaires, ou partielles ; ordinaires, lorsqu’il n’y a qu’une variable ; partielles, lorsqu’il y en a plusieurs. Donnons-en quelques exemples.

Trois joueurs dont les forces sont supposées les mêmes, jouent ensemble aux conditions suivantes. Celui des deux premiers joueurs, qui gagne son adversaire, joue avec le troisième, et s’il le gagne, la partie est finie. S’il est vaincu, le vainqueur joue avec l’autre, et ainsi de suite, jusqu’à ce que l’un des joueurs ait gagné consécutivement les deux autres, ce qui termine la partie : on demande la probabilité que la partie sera finie dans un nombre quelconque n de coups. Cherchons d’abord la probabilité qu’elle finira précisément au coup n. Pour cela, le joueur qui gagne doit entrer au jeu au coup n moins un, et le gagner ainsi que le coup suivant. Mais si au lieu de gagner le coup n moins un, il était vaincu par son adversaire, celui-ci venant de gagner l’autre joueur, la partie finirait à ce coup. Ainsi la probabilité qu’un des joueurs entrera au jeu au coup n moins un, et le gagnera, est égale à celle que la partie finira précisément à ce coup ; et comme ce joueur doit gagner le coup suivant, pour que la partie se termine au coup n, la probabilité de ce dernier cas ne sera qu’un demi de la précédente. Cette probabilité est évidemment une fonction du nombre n ; cette fonction est donc égale à la moitié de la même fonction, lorsqu’on y diminue n de l’unité. Cette égalité forme une de ces équations que l’on nomme équations aux différences finies ordinaires.

On peut déterminer facilement à son moyen, la probabilité que la partie finira précisément à un coup quelconque. Il est visible que la partie ne peut finir au plus tôt qu’au second coup ; et pour cela, il est nécessaire que celui des deux premiers joueurs qui a gagné son adversaire, gagne au second coup le troisième joueur ; la probabilité que la partie finira à ce coup est donc . De là, en vertu de l’équation précédente, on conclut que les probabilités successives de la fin de la partie sont pour le troisième coup, pour le quatrième, etc. ; et généralement élevé à la puissance n moins un, pour le nième coup. La somme de toutes ces puissances de est l’unité moins la dernière de ces puissances ; c’est la probabilité que la partie sera terminée, au plus tard, dans n coups.

Considérons encore le premier problème un peu difficile, que l’on ait résolu sur les probabilités et que Pascal proposa de résoudre à Fermat. Deux joueurs Α et B, dont les adresses sont égales, jouent ensemble avec la condition que celui qui, le premier, aura vaincu l’autre un nombre donné de fois, gagnera la partie, et emportera la somme des mises au jeu : après quelques coups, les joueurs conviennent de se retirer sans avoir terminé la partie ; on demande de quelle manière cette somme doit être partagée entre eux. Il est visible que les parts doivent être proportionnelles aux probabilités respectives de gagner la partie ; la question se réduit donc à déterminer ces probabilités. Elles dépendent évidemment des nombres de points qui manquent à chaque joueur pour atteindre le nombre donné. Ainsi la probabilité de Α est une fonction de ces deux nombres que nous nommerons indices. Si les deux joueurs convenaient de jouer un coup de plus (convention qui ne change point leur sort, pourvu qu’après ce nouveau coup, le partage se fasse toujours proportionnellement aux nouvelles probabilités de gagner la partie) ; alors, ou Α gagnerait ce coup, et dans ce cas, le nombre des points qui lui manquent, serait diminué d’une unité ; ou le joueur B le gagnerait, et dans ce cas, le nombre des points manquans à ce dernier joueur deviendrait moindre d’une unité. Mais la probabilité de chacun de ces cas est  ; la fonction cherchée est donc égale à la moitié de cette fonction, dans laquelle on diminue de l’unité le premier indice ; plus à la moitié de la même fonction dans laquelle le second indice est diminué de l’unité. Cette égalité est une de ces équations que l’on nomme équations aux différences partielles.

On peut déterminer à son moyen les probabilités de Α, en partant des plus petits nombres, et en observant que la probabilité ou la fonction qui l’exprime est égale à l’unité, lorsqu’il ne manque aucun point au joueur Α, ou lorsque le premier indice est nul, et que cette fonction devient nulle avec le second indice. En supposant ainsi qu’il ne manque qu’un point au joueur Α, on trouve que sa probabilité est , , , etc., suivant qu’il manque à B un point, ou deux, ou trois, etc. Généralement, elle est alors l’unité, moins la puissance de égale au nombre des points qui manquent à B. On supposera ensuite qu’il manque deux points au joueur Α, et l’on trouvera sa probabilité égale à , , , etc., suivant qu’il manque à B, un point ou deux, ou trois, etc. On supposera encore qu’il manque trois points au joueur Α, et ainsi de suite.

Cette manière d’obtenir les valeurs successives d’une quantité, au moyen de son équation aux différences, est longue et pénible. Les géomètres ont cherché des méthodes pour avoir la fonction générale des indices, qui satisfait à cette équation, en sorte que l’on n’ait besoin pour chaque cas particulier, que de substituer dans cette fonction les valeurs correspondantes des indices. Considérons cet objet d’une manière générale. Pour cela, concevons une suite de termes disposés sur une ligne horizontale, et tels que chacun d’eux dérive des précédens, suivant une loi donnée. Supposons cette loi exprimée par une équation entre plusieurs termes consécutifs, et leur indice ou le nombre qui indique le rang qu’ils occupent dans la série. Cette équation est ce que je nomme équation aux différences finies à un seul indice. L’ordre ou le degré de cette équation est la différence du rang de ses deux termes extrêmes. On peut, à son moyen, déterminer successivement les termes de la série et la continuer indéfiniment ; mais il faut pour cela connaître un nombre de termes de la série, égal au degré de l’équation. Ces termes sont les constantes arbitraires de l’expression du terme général de la série, ou de l’intégrale de l’équation aux différences.

Concevons maintenant, au-dessus des termes de la série précédente, une seconde série de termes disposés horizontalement ; concevons encore au-dessus des termes de la seconde série, une troisième série horizontale, et ainsi de suite à l’infini ; et supposons les termes de toutes ces séries liés par une équation générale entre plusieurs termes consécutifs, pris tant dans le sens horizontal que dans le sens vertical, et les nombres qui indiquent leur rang dans les deux sens. Cette équation est ce que je nomme équation aux différences finies partielles à deux indices.

Concevons pareillement au-dessus du plan des séries précédentes, un second plan de séries semblables dont les termes soient placés respectivement au-dessus de ceux du premier plan : concevons ensuite au-dessus de ce second plan, un troisième plan de séries semblables, et ainsi à l’infini : supposons tous les termes de ces séries liés par une équation entre plusieurs termes consécutifs, pris dans les sens de la longueur, de la largeur et de la profondeur, et les trois nombres qui indiquent leur rang dans ces trois sens. Cette équation est ce que je nomme équation aux différences finies partielles à trois indices.

Enfin, en considérant la chose d’une manière abstraite et indépendante des dimensions de l’espace, concevons généralement un système de grandeurs qui soient fonctions d’un nombre quelconque d’indices, et supposons entre ces grandeurs, leurs différences relatives à ces indices, et les indices eux-mêmes, autant d’équations qu’il y a de ces grandeurs ; ces équations seront aux différences finies partielles à un nombre quelconque d’indices.

On peut à leur moyen déterminer successivement ces grandeurs. Mais de même que l’équation à un seul indice exige pour cela que l’on connaisse un certain nombre de termes de la série ; de même l’équation à deux indices exige que l’on connaisse une ou plusieurs lignes de séries dont les termes généraux puissent être exprimés chacun par une fonction arbitraire d’un des indices. Pareillement, l’équation à trois indices exige que l’on connaisse un ou plusieurs plans de séries dont les termes généraux puissent être exprimés chacun par une fonction arbitraire de deux indices ; ainsi de suite. Dans tous ces cas, on pourra, par des éliminations successives, déterminer un terme quelconque des séries. Mais toutes les équations entre lesquelles on élimine, étant comprises dans un même système d’équations, toutes les expressions des termes successifs que l’on obtient par ces éliminations doivent être comprises dans une expression générale, fonction des indices qui déterminent le rang du terme. Cette expression est l’intégrale de l’équation proposée aux différences, et sa recherche est l’objet du Calcul intégral.

Taylor est le premier qui dans son ouvrage intitulé Methodus incrementorum, ait considéré les équations linéaires aux différences finies. Il y donne la manière d’intégrer celles du premier ordre, avec un coefficient et un dernier terme, fonctions de l’indice. À la vérité, les relations des termes des progressions arithmétiques et géométriques que l’on a considérées de tout temps, sont les cas les plus simples des équations linéaires aux différences ; mais on ne les avait pas envisagées sous ce point de vue, l’un de ceux qui se rattachant à des théories générales, conduisent à ces théories, et sont par là de véritables découvertes.

Vers le même temps, Moivre considéra, sous la dénomination de suites récurrentes, les équations aux différences finies d’un ordre quelconque, à coefficiens constans. Il parvint à les intégrer d’une manière très ingénieuse. Comme il est toujours intéressant de suivre la marche des inventeurs, je vais exposer celle de Moivre, en l’appliquant à une suite récurrente dont la relation entre trois termes consécutifs est donnée. D’abord, il considère la relation entre les termes consécutifs d’tme progression géométrique, ou l’équation à deux termes qui l’exprime. En la rapportant aux termes inférieurs d’une unité, il la multiplie dans cet état par un facteur constant, et il retranche le produit de l’équation primitive. Par là, il obtient une équation entre trois termes consécutifs de la progression géométrique. Moivre considère ensuite une seconde progression dont la raison des termes est le facteur même qu’il vient d’employer. Il diminue pareillement d’une unité l’indice des termes de l’équation de cette nouvelle progression : dans cet état, il la multiplie par la raison des termes de la première progression, et il retranche le produit de l’équation de la seconde progression, ce qui lui donne, entre trois termes consécutifs de cette progression, une relation entièrement semblable à celle qu’il a trouvée pour la première progression. Puis il observe que si l’on ajoute terme à terme les deux progressions, la même relation subsiste entre trois quelconques de ces sommes consécutives. Il compare les coefficiens de cette relation à ceux de la relation des termes de la suite récurrente proposée, et il trouve, pour déterminer les raisons des deux progressions géométriques, une équation du second degré dont les racines sont ces raisons. Par là, Moivre décompose la suite récurrente en deux progressions géométriques multipliées, chacune par une constante arbitraire qu’il détermine au moyen des deux premiers termes de la suite récurrente. Ce procédé ingénieux est au fond celui que d’Alembert a depuis employé pour l’intégration des équations linéaires aux différences infiniment petites à coefficiens constans, et que Lagrange a transporté aux équations semblables à différences finies.

Ensuite, j’ai considéré les équations linéaires aux différences partielles finies, d’abord sous la dénomination de suites récurro-récurrentes et après, sous leur dénomination propre. La manière la plus générale et la plus simple d’intégrer toutes ces équations, me paraît être celle que j’ai fondée sur la considération des fonctions génératrices dont voici l’idée.

Si l’on conçoit une fonction V d’une variable t, développée suivant les puissances de cette variable, le coefficient de l’une quelconque de ces puissances sera une fonction de l’exposant ou indice de cette puissance, indice que je désignerai par x. V est ce que je nomme fonction génératrice de ce coefficient ou de la fonction de l’indice.

Maintenant, si l’on multiplie la série du développement de V par une fonction de la même variable, telle, par exemple, que l’unité plus deux fois cette variable, le produit sera une nouvelle fonction génératrice dans laquelle le coefficient de la puissance x de la variable t sera égal au coefficient de la même puissance dans V, plus au double du coefficient de la puissance inférieure d’une unité. Ainsi la fonction de l’indice x, dans le produit, égalera la fonction de l’indice x dans V, plus le double de cette même fonction dans laquelle l’indice est diminué de l’unité. Cette fonction de l’indice x est ainsi une dérivée de la fonction du même indice dans le développement de V, fonction que je nommerai fonction primitive de l’indice. Désignons la fonction dérivée par la caractéristique δ placée devant la fonction primitive. La dérivation indiquée par cette caractéristique dépendra du multiplicateur de V, que nous nommerons T, et que nous supposerons développé, comme V, par rapport aux puissances de la variable t.

Si l’on multiplie de nouveau par T le produit de V par T, ce qui revient à multiplier V par le carré de T, on formera une troisième fonction génératrice dans laquelle le coefficient de la puissance x de t sera une dérivée semblable du coefficient correspondant du produit précédent ; on pourra donc l’exprimer par la même caractéristique δ, placée devant la dérivée précédente ; et alors cette caractéristique sera deux fois écrite devant la fonction primitive de x. Mais au lieu de l’écrire ainsi deux fois, on lui donne pour exposant le nombre 2.

En continuant ainsi, on voit généralement que si l’on multiplie V par la puissance n de T, on aura le coefficient de la puissance x de t dans le produit de V par la puissance n de T, en plaçant devant la fonction primitive la caractéristique δ avec n pour exposant.

Supposons, par exemple, que T soit l’unité divisée par t ; alors dans le produit de V par T le coefficient de la puissance x de t sera le coefficient de la puissance supérieure d’une unité dans V ; ce coefficient dans le produit de V par la puissance n de T sera donc la fonction primitive dans laquelle x est augmenté de n unités.

Considérons maintenant une nouvelle fonction Z de t, développée, comme V et T, suivant les puissances de t : désignons par la caractéristique Δ placée devant la fonction primitive, le coefficient de la puissance x de t dans le produit de V par Z ; ce coefficient, dans le produit de V par la puissance n de Z, sera exprimé par la caractéristique Δ affectée de l’exposant n et placée devant la fonction primitive de x.

Si, par exemple, Z est égal à l’unité divisée par t moins un, le coefficient de la puissance x de t dans le produit de V par Z sera le coefficient de la puissance x plus un de t dans V, moins le coefficient de la puissance x. Il sera donc la différence finie de la fonction primitive de l’indice x. Alors la caractéristique Δ indique une différence finie de la fonction primitive, dans le cas où l’indice varie de l’unité ; et la puissance n de cette caractéristique, placée devant la fonction primitive, indiquera la différence finie nième de cette fonction. Si l’on suppose que T soit l’unité divisée par t, on aura T égal au binome Z plus un. Le produit de V par la puissance n de T sera donc égal au produit de V par la puissance de n du binôme Z plus un. En développant cette puissance par rapport aux puissances de Z, les produits de V par les divers termes de ce développement seront les fonctions génératrices de ces mêmes termes, dans lesquels on substitue, au lieu des puissances de Z, les différences finies correspondantes de la fonction primitive de l’indice.

Maintenant le produit de V par la puissance n de T est la fonction primitive, dans laquelle l’indice x est augmenté de n unités ; en repassant donc des fonctions génératrices à leurs coefficiens, on aura cette fonction primitive ainsi augmentée, égale au développement de la puissance n du binome Z plus un ; pourvu que dans ce développement on substitue, au lieu des puissances de Z, les différences correspondantes de la fonction primitive, et que l’on multiplie le terme indépendant de ces puissances par la fonction primitive. On aura ainsi la fonction primitive dont l’indice est augmenté d’un nombre quelconque n, au moyen de ses différences.

En supposant toujours à T et à Z les valeurs précédentes, on aura Z égal au binome T moins un ; le produit de V par la puissance n de Z sera donc égal au produit de V par le développement de la puissance n du binome T moins un. En repassant des fonctions génératrices à leurs coefficiens, comme on vient de le faire, on aura la différence nième de la fonction primitive, exprimée par le développement de la puissance n du binome T moins un, dans lequel on substitue aux puissances de T cette même fonction dont l’indice est augmenté de l’exposant de la puissance, et au terme indépendant de t et qui est l’unité, la fonction primitive : ce qui donne cette différence au moyen des termes consécutifs de cette fonction.

δ placé devant la fonction primitive, exprimant la dérivée de cette fonction, qui multiplie la puissance x de t dans le produit de V par T, et Δ exprimant la même dérivée dans le produit de V par Z, on est conduit, par ce qui précède, à ce résultat général : quelles que soient les fonctions de la variable t, représentées par T et Z, on peut, dans le développement de toutes les équations identiques susceptibles d’être formées entre ces fonctions, substituer les caractéristiques δ et Δ, au lieu de T et de Z, pourvu que l’on écrive la fonction primitive de l’indice à la suite des puissances et des produits de puissances des caractéristiques, et que l’on multiplie par cette fonction les termes indépendans de ces caractéristiques.

On peut, au moyen de ce résultat général, transformer une puissance quelconque d’une différence de la fonction primitive de l’indice x, dans laquelle x varie d’une unité, en une série de différences de la même fonction, dans lesquelles x varie d’un nombre quelconque d’unités, et réciproquement. Supposons en effet que T soit la puissance i de l’unité divisée par t moins un, et que Z soit toujours l’unité divisée par t moins un ; alors le coefficient de la puissance x de t, dans le produit de V par T, sera le coefficient de la puissance x plus i de t dans V, moins le coefficient de la puissance x de t ; il sera donc la différence finie de la fonction primitive de l’indice x, dans laquelle on fait varier cet indice du nombre i. Il est facile de voir que T est égal à la différence entre la puissance i du binome Z plus un et l’unité ; la puissance n de T est donc égale à la puissance n de cette différence. Si, dans cette égalité, on substitue au lieu de T et de Z les caractéristiques δ et Δ, et qu’après le développement on place à la fin de chaque terme la fonction primitive de l’indice x, on aura la différence nième de cette fonction, dans laquelle x varie de i unités, exprimée par une suite de différences de la même fonction, dans laquelle x varie d’une unité. Cette suite n’est qu’une transformation de la différence qu’elle exprime et qui lui est identique ; mais c’est dans de semblables transformations que réside le pouvoir de l’analyse.

La généralité de l’analyse permet de supposer dans cette expression n négatif. Alors les puissances négatives de δ et de Δ indiquent des intégrales. En effet, la différence nième de la fonction primitive ayant pour fonction génératrice le produit de V par la puissance n du binome, un divisé par t, moins l’unité ; la fonction primitive qui est l’intégrale nième de cette différence, a pour fonction génératrice celle de la même différence, multipliée par la puissance n prise en moins du binome, un divisé par t, moins l’unité, puissance à laquelle répond la même puissance de la caractéristique Δ ; cette puissance indique donc une intégrale du même ordre, l’indice x variant de l’unité ; et les puissances négatives de δ indiquent également des intégrales, x variant de i unités. On voit ainsi de la manière la plus claire et la plus simple, la raison de l’analogie observée entre les puissances positives et les différences, et entre les puissances négatives et les intégrales.

Si la fonction indiquée par la caractéristique δ placée devant la fonction primitive est nulle, on aura une équation aux différences finies, et V sera la fonction génératrice de son intégrale. Pour avoir cette fonction génératrice, on observera que dans le produit de V par T toutes les puissances de t doivent disparaître, excepté les puissances inférieures à l’ordre de l’équation aux différences ; V est donc égal à une fraction dont T est le dénominateur, et dont le numérateur est un polynome dans lequel la puissance la plus élevée de t est moindre d’une unité que l’ordre de l’équation aux différences. Les coefficiens arbitraires des diverses puissances de t dans ce polynome, en y comprenant la puissance zéro, seront déterminés par autant de valeurs de la fonction primitive de l’indice, lorsqu’on y fait successivement x égal à zéro, à l’unité, à deux, etc. Quand l’équation aux différences est donnée, on détermine T en mettant tous ses termes dans le premier membre, et zéro dans le second ; en substituant dans le premier membre, l’unité au lieu de la fonction qui a le plus grand indice ; la première puissance de t au lieu de la fonction primitive dans laquelle cet indice est diminué d’une unité ; la seconde puissance de t, à la fonction primitive où cet indice est diminué de deux unités, et ainsi de suite. Le coefficient de la puissance x de t, dans le développement de l’expression précédente de V, sera la fonction primitive de x, ou l’intégrale de l’équation aux différences finies. L’analyse fournit pour ce développement, divers moyens parmi lesquels on peut choisir celui qui est le plus propre à la question proposée ; ce qui est un avantage de cette méthode d’intégration.

Concevons maintenant que V soit une fonction des deux variables t et t′, développée suivant les puissances et les produits de ces variables ; le coefficient d’un produit quelconque des puissances x et x′ de t et de t′, sera une fonction des exposans ou indices x et x′ de ces puissances ; fonction que je nommerai fonction primitive, et dont V est la fonction génératrice.

Multiplions V par une fonction T des deux variables t et t′, développée, comme V, par rapport aux puissances et aux produits de ces variables ; le produit sera la fonction génératrice d’une dérivée de la fonction primitive : si T, par exemple, est égal à la variable t, plus à la variable t′ moins deux, cette dérivée sera la fonction primitive dont on diminue de l’unité l’indice x, plus cette même fonction primitive dont on diminue de l’unité l’indice x′, moins deux fois la fonction primitive. En désignant, quel que soit T, par la caractéristique δ placée devant la fonction primitive cette dérivée, le produit de V par la puissance n de T sera la fonction génératrice de la dérivée de la fonction primitive, devant laquelle on place la puissance n de la caractéristique δ. De là résultent des théorèmes analogues à ceux qui sont relatifs aux fonctions d’une seule variable.

Supposons que la fonction indiquée par la caractéristique δ soit zéro ; on aura une équation aux différences partielles : si, par exemple, on fait, comme ci-dessus, T égal à la variable t, plus à la variable t′ moins deux, on a zéro égal à la fonction primitive dont on diminue de l’unité l’indice x, plus la même fonction dont on diminue de l’unité l’indice x′, moins deux fois la fonction primitive. La fonction génératrice V de cette fonction primitive ou de l’intégrale de cette équation, doit donc être telle que son produit par T ne renferme point les produits de t par t′ ; mais V peut renfermer séparément les puissances de t, et celles de t′, c’est-à-dire une fonction arbitraire de t et une fonction arbitraire de t′ ; V est donc une fraction dont le numérateur est la somme de ces deux fonctions arbitraires, et dont T est le dénominateur. Le coefficient du produit de la puissance x de t par la puissance x′ de t′, dans le développement de cette fraction, sera donc l’intégrale de l’équation précédente aux différences partielles. Cette méthode d’intégrer ce genre d’équations me paraît être la plus simple et la plus facile, par l’emploi des divers procédés analytiques pour le développement des fractions rationnelles.

De plus amples détails sur cette matière seraient difficilement entendus sans le secours du calcul.

En considérant les équations aux différences partielles infiniment petites comme des équations aux différences partielles finies dans lesquelles rien n’est négligé, on peut éclaircir les points obscurs de leur calcul, qui ont été le sujet de grandes discussions parmi les géomètres. C’est ainsi que j’ai démontré la possibilité d’introduire des fonctions discontinues dans leurs intégrales, pourvu que la discontinuité n’ait lieu que pour les différentielles de l’ordre de ces équations ou d’un ordre supérieur. Les résultats transcendans du calcul sont comme toutes les abstractions de l’entendement, des signes généraux dont on ne peut connaître la véritable étendue qu’en remontant, par l’analyse métaphysique, aux idées élémentaires qui y ont conduit : ce qui présente souvent de grandes difficultés ; car l’esprit humain en éprouve moins encore à se porter en avant qu’à se replier sur lui-même.

La comparaison des différences infiniment petites avec les différences finies peut semblablement répandre un grand jour sur la métaphysique du calcul infinitésimal.

On prouve facilement que la différence finie nième d’une fonction, dans laquelle l’accroissement de la variable est E, étant divisée par la puissance n de E ; le quotient réduit en série par rapport aux puissances de l’accroissement E, est formé d’un premier terme indépendant de E. À mesure que E diminue, la série approche de plus en plus de ce premier terme, dont elle peut ainsi ne différer que de quantités moindres que toute grandeur assignable. Ce terme est donc la limite de la série, et il exprime, dans le calcul différentiel, la différence infiniment petite nième de la fonction, divisée par la puissance n de l’accroissement infiniment petit.

En considérant sous ce point de vue les différences infiniment petites, on voit que les diverses opérations du calcul différentiel reviennent à comparer séparément dans le développement d’expressions identiques, les termes finis ou indépendans des accroissemens des variables que l’on regarde comme infiniment petits ; ce qui est rigoureusement exact, ces accroissemens étant indéterminés. Ainsi le calcul différentiel a toute l’exactitude des autres opérations algébriques.

La même exactitude a lieu dans les applications du Calcul différentiel à la Géométrie et à la Mécanique. Si l’on conçoit une courbe coupée par une sécante dans deux points voisins ; en nommant E l’intervalle des ordonnées de ces deux points, E sera l’accroissement de l’abscisse depuis la première jusqu’à la seconde ordonnée. Il est facile de voir que l’accroissement correspondant de l’ordonnée sera le produit de E par la première ordonnée divisée par sa sous-sécante : en augmentant donc dans l’équation de la courbe, la première ordonnée de cet accroissement, on aura l’équation relative à la seconde ordonnée : la différence de ces deux équations sera une troisième équation qui, développée par rapport aux puissances de E, et divisée par E, aura son premier terme indépendant de E, et qui sera la limite de ce développement. Ce terme, égalé à zéro, donnera donc la limite des sous-sécantes, limite qui est évidemment la sous-tangente.

Cette manière singulièrement heureuse d’obtenir les sous-tangentes est due à Fermat, qui l’a étendue aux courbes transcendantes. Ce grand géomètre exprime par la caractéristique E l’accroissement de l’abscisse ; et en ne considérant que la première puissance de cet accroissement, il détermine exactement, comme on le fait par le calcul différentiel, les sous-tangentes des courbes, leurs points d’inflexion, les maxima et minima de leurs ordonnées, et généralement ceux des fonctions rationnelles. On voit même, par sa belle solution du problème de la réfraction de la lumière, insérée dans le Recueil des Lettres de Descartes, qu’il savait étendre sa méthode aux fonctions irrationnelles, en se débarrassant des irrationnalités, par l’élévation des radicaux aux puissances. On doit donc regarder Fermat comme le véritable inventeur du Calcul différentiel. Newton a depuis rendu ce calcul plus analytique, dans sa Méthode des Fluxions ; et il en a simplifié et généralisé les procédés par son beau théorème du binome. Enfin, presqu’en même temps, Leibnitz a enrichi le Calcul différentiel d’une notation qui, en indiquant le passage du fini à l’infiniment petit, réunit à l’avantage d’exprimer les résultats généraux de ce calcul, celui de donner les premières valeurs approchées des différences et des sommes des quantités ; notation qui s’est adaptée d’elle-même au calcul des différentielles partielles.

On est souvent conduit à des expressions qui contiennent tant de termes et de facteurs, que les substitutions numériques y sont impraticables. C’est ce qui a lieu dans les questions de probabilité, lorsque l’on considère un grand nombre d’évènemens. Cependant il importe alors d’avoir la valeur numérique des formules, pour connaître avec quelle probabilité les résultats que les évènemens développent en se multipliant, sont indiqués. Il importe surtout d’avoir la loi suivant laquelle cette probabilité approche sans cesse de la certitude qu’elle finirait par atteindre, si le nombre des évènemens devenait infini. Pour y parvenir, je considérai que les intégrales définies de différentielles multipliées par des facteurs élevés à de grandes puissances, donnaient par l’intégration, des formules composées d’un grand nombre de termes et de facteurs. Cette remarque me fit naître l’idée de transformer dans de semblables intégrales, les expressions compliquées de l’analyse, et les intégrales des équations aux différences. J’ai rempli cet objet par une méthode qui donne à la fois la fonction comprise sous le signe intégral, et les limites de l’intégration. Elle offre cela de remarquable, savoir que cette fonction est la fonction même génératrice des expressions et des équations proposées ; ce qui rattache cette méthode à la théorie des fonctions génératrices dont elle est ainsi le complément. Il ne s’agissait plus ensuite que de réduire l’intégrale définie en série convergente. C’est ce que j’ai obtenu par un procédé qui fait converger la série avec d’autant plus de rapidité, que la formule qu’elle représente est plus compliquée ; en sorte qu’il est d’autant plus exact, qu’il devient plus nécessaire. Le plus souvent, la série a pour facteur la racine carrée du rapport de la circonférence au diamètre : quelquefois elle dépend d’autres transcendantes dont le nombre est infini.

Une remarque importante qui tient à la grande généralité de l’Analyse, et qui permet d’étendre cette méthode aux formules et aux équations à différences, que la théorie des probabilités présente le plus fréquemment, est que les séries auxquelles on parvient en supposant réelles et positives les limites des intégrales définies, ont également lieu dans le cas où l’équation qui détermine ces limites n’a que des racines négatives ou imaginaires. Ces passages du positif au négatif, et du réel à l’imaginaire, dont j’ai le premier fait usage, m’ont conduit encore aux valeurs de plusieurs intégrales définies singulières, que j’ai ensuite démontrées directement. On peut donc considérer ces passages comme un moyen de découverte, pareil à l’induction et à l’analogie employées depuis long-temps par les géomètres, d’abord avec une extrême réserve, ensuite avec une entière confiance, un grand nombre d’exemples en ayant justifié l’emploi. Cependant il est toujours nécessaire de confirmer, par des démonstrations directes, les résultats obtenus par ces divers moyens.

J’ai nommé Calcul des fonctions génératrices l’ensemble des méthodes précédentes ; ce calcul sert de fondement à l’ouvrage que j’ai publié sous ce titre : Théorie analytique des Probabilités. Il se rattache à l’idée simple d’indiquer les multiplications répétées d’une quantité par elle-même, ou ses puissances entières et positives, en écrivant vers le haut de la lettre qui l’exprime, les nombres qui marquent les degrés de ces puissances. Cette notation employée par Descartes, dans sa Géométrie, et généralement adoptée depuis la publication de cet important ouvrage, est peu de chose, surtout quand on la compare à la théorie des courbes et des fonctions variables, par laquelle ce grand géomètre a posé les fondemens des calculs modernes. Mais la langue de l’Analyse, la plus parfaite de toutes, étant par elle-même un puissant instrument de découvertes, ses notations, lorsqu’elles sont nécessaires et heureusement imaginées, sont autant de germes de nouveaux calculs. C’est ce que cet exemple rend sensible.

Wallis qui, dans son ouvrage intitulé Arithmetica infinitorum, l’un de ceux qui ont le plus contribué aux progrès de l’Analyse, s’est attaché spécialement à suivre le fil de l’induction et de l’analogie, considéra que si l’on divise l’exposant d’une lettre par deux, trois, etc. ; le quotient sera suivant la notation cartésienne, et lorsque la division est possible, l’exposant de la racine carrée, cubique, etc., de la quantité que représente la lettre élevée à l’exposant dividende. En étendant par analogie ce résultat au cas où la division n’est pas possible, il considéra une quantité élevée à un exposant fractionnaire comme la racine du degré indiqué par le dénominateur de cette fraction, de la quantité élevée à la puissance indiquée par le numérateur. Il observa ensuite que suivant la notation cartésienne, la multiplication de deux puissances d’une même lettre revient à ajouter leurs exposans, et que leur division revient à soustraire l’exposant de la puissance diviseur de celui de la puissance dividende, lorsque le second de ces exposans surpasse le premier. Wallis étendit ce résultat au cas où le premier exposant égale ou surpasse le second ; ce qui rend la différence nulle ou négative. Il supposa donc qu’un exposant négatif indique l’unité divisée par la quantité élevée au même exposant pris positivement. Ces remarques le conduisirent à intégrer généralement les différentielles monomes ; d’où il conclut les intégrales définies d’un genre particulier de différentielles binomes dont l’exposant est un nombre entier positif. En observant ensuite la loi des nombres qui expriment ces intégrales, une série d’interpolations et d’inductions heureuses où l’on aperçoit le germe du calcul des intégrales définies, qui a tant exercé les géomètres, et l’une des bases de ma nouvelle Théorie des Probabilités, lui donna le rapport de la surface du cercle au carré de son diamètre, exprimé par un produit infini qui, lorsqu’on l’arrête, resserre ce rapport dans des limites de plus en plus rapprochées ; résultat l’un des plus singuliers de l’Analyse. Mais il est remarquable que Wallis, qui avait si bien considéré les exposans fractionnaires des puissances radicales, ait continué de noter ces puissances comme on l’avait fait avant lui. Newton, si je ne me trompe, employa, le premier, dans ses Lettres à Oldembourg, la notation de ces puissances par des exposans fractionnaires. En comparant par la voie de l’induction dont Wallis avait fait un si bel usage, les exposans des puissances du binome avec les coefficiens des termes de son développement, dans le cas où cet exposant est entier et positif, il détermina la loi de ces coefficiens, et il l’étendit, par analogie, aux puissances fractionnaires et négatives. Ces divers résultats, fondés sur la notation de Descartes, montrent son influence sur les progrès de l’Analyse. Elle a encore l’avantage de donner l’idée la plus simple et la plus juste des logarithmes qui ne sont en effet que les exposans d’une grandeur dont les puissances successives, en croissant par degrés infiniment petits, peuvent représenter tous les nombres.

Mais l’extension la plus importante que cette notation ait reçue, est celle des exposans variables ; ce qui constitue le calcul exponentiel, l’une des branches les plus fécondes de l’Analyse moderne. Leibnitz a indiqué, le premier, les transcendantes à exposans variables, et par-là, il a complété le système des élémens dont une fonction finie peut être composée ; car toute fonction finie explicite d’une variable se réduit, en dernière analyse, à des grandeurs simples, combinées par voie d’addition, de soustraction, de multiplication et de division, et élevées à des puissances constantes ou variables. Les racines des équations formées de ces élémens, sont des fonctions implicites de la variable. C’est ainsi qu’une variable ayant pour logarithme l’exposant de la puissance qui lui est égale dans la série des puissances du nombre dont le logarithme hyperbolique est l’unité, le logarithme d’une variable en est une fonction implicite.

Leibnitz imagina de donner à sa caractéristique différentielle les mêmes exposans qu’aux grandeurs ; mais alors ces exposans, au lieu d’indiquer les multiplications répétées d’une même grandeur, indiquent les différentiations répétées d’une même fonction. Cette extension nouvelle de la notation cartésienne, conduisit Leibnitz à l’analogie des puissances positives avec les différentielles, et des puissances négatives avec les intégrales. Lagrange a suivi cette analogie singulière dans tous ses développemens ; et par une suite d’inductions, qui peut être regardée comme une des plus belles applications que l’on ait faites de la méthode d’induction, il est parvenu à des formules générales aussi curieuses qu’utiles, sur les transformations des différences et des intégrales les unes dans les autres, lorsque les variables ont des accroissemens finis divers, et lorsque ces accroissemens sont infiniment petits. Mais il n’en a point donné les démonstrations qu’il jugeait difficiles. La théorie des fonctions génératrices étend à des caractéristiques quelconques, la notation cartésienne : elle montre avec évidence, l’analogie des puissances et des opérations indiquées par ces caractéristiques ; en sorte qu’elle peut encore être envisagée comme le calcul exponentiel des caractéristiques. Tout ce qui concerne les séries et l’intégration des équations aux différences, en découle avec une extrême facilité.