Annales de mathématiques pures et appliquées/Tome 12/Probabilités, article 1

PROBABILITÉS.

Dissertation sur la recherche du milieu le plus probable,
entre les résultats de plusieurs observations ou expériences ;

Par un Abonné.
≈≈≈≈≈≈≈≈≈

Parmi les applications nombreuses et variées dont la doctrine des probabilités est susceptible, il en est peu sans doute qui puissent offrir autant d’intérêt et d’utilité que celle qui a pour objet la recherche de la moyenne la plus convenable entre les résultats de plusieurs expériences ou observations données. Mais, bien que beaucoup de gens paraissent se douter à peine qu’il puisse y avoic là la plus légère difficulté, en y regardant d’un peu près, on voit bientôt que le problème est un des plus délicats et des plus difficiles qu’on puisse se proposer.

Ce problème présente deux cas principaux, qu’il est quelquefois permis de confondre, mais que quelquefois aussi il faut soigneusement distinguer. Il peut se faire, en premier lieu, que les résultats entre lesquels il s’agit de prendre la moyenne soient de nature à pouvoir être à la fois exacts et inégaux ; ou bien, il peut arriver que leur inégalité ait inévitablement sa source dans l’imperfection des instrumens et des procédés employés pour les obtenir, ou encore dans la maladresse ou la négligence de ceux qui ont mis ces instrumens et ces procédés en usage.

Que, par exemple, dans la vue de connaître la durée moyenne de la vie humaine, on examine quelle a été la durée de la vie d’un grand nombre d’individus, pris au hasard ; on ne sera aucunement surpris d’y apercevoir une extrême variété ; et, tandis qu’on trouvera beaucoup d’enfans morts le jour même de leur naissance, on rencontrera, de loin en loin, quelques vieillards qui auront prolongé leur carrière au-delà d’un siècle. Il en sera de même si, pour savoir quel prix on peut raisonnablement donner d’une propriété territoriale qu’on veut acquérir, on examine les produits qui en ont été obtenus pendant une longue suite d’années ; on y verra rogner, sans plus de surprime, la même variété ; et tandis que, pour certaines années, la récolte aura été très-abondante, l’intempérie des saisons l’aura d’autres fois réduite à peu près à rien.

Mais il n’en ira plus de même si, par exemple, des observations solsticiales faites dans le même temps, par plusieurs astronomes, ne donnent pas à l’écliptique la même obliquité ; ou si, pour prendre un exemple beaucoup plus simple, plusieurs mesures d’un même corps ou d’une même distance ne lui assignent pas le même poids ou la même longueur. Il est alors évident que le défaut de coïncidence rigoureuse dans les résultats ne permettra de supposer exact qu’un seul d’entre eux au plus, et les frappera tous de suspicion.

À ces deux cas, on pourrait, peut-être, en ajouter un troisième : ce serait celui où les résultats, étant de nature à pouvoir être inégaux, laisseraient en outre quelque doute sur leur exactitude. C’est, par exemple, ce qui arriverait si, voulant déterminer la durée moyenne de la vie humaine, on se contentait de consulter seulement les registres de décès, où l’âge des morts est souvent indiqué d’une manière très-inexacte ; mais, comme cette sorte de cas mixte rentre plus ou moins dans l’un ou l’autre des deux premiers, nous en ferons constamment abstraction, dans tout ce qui va suivre. Nous aurons donc ainsi uniquement à considérer, 1.o des résultats de nature à être inégaux, mais supposés d’ailleurs être également exacts ; 2.o des résultats qui ne doivent leur inégalité qu’à leur inexactitude, sans laquelle il y aurait entre eux une parfaite coïncidence.

Il paraît raisonnable, dans le premier de ces deux cas, sinon de faire concourir tous les résultats donnés pour la même part dans la composition du résultat moyen, du moins de les prendre tous en considération, dans la recherche de ce résultat ; puisque enfin ce sont autant de faits certains que l’avenir peut amener encore ; mais il n’en est plus de même dans le second cas ; car, puisqu’alors on est contraint de suspecter les procédés par lesquels la plupart de ces résultats ont été obtenus, la suspicion, à l’égard de quelques-uns d’entre eux, peut bien aller, quelquefois, jusqu’à les faire considérer comme tout-à-fait non avenus.

On peut, au surplus, ici distinguer deux sortes de motifs de suspicion, que nous signalerons par les dénominations d’externes et d’internes. Nous entendons par motifs externes de suspicion, ceux qui se tirent des données que l’on peut avoir acquises sur le caractère et la capacité de ceux à qui on doit certains résultats et sur les procédés qu’ils ont mis en usage pour les obtenir. Les motifs internes de suspicion, au contraire, sont ceux que l’on peut tirer de la trop grande disparate entre certains résultats et le reste de ceux dont on est en possession. Des exemples simples vont achever d’éclaircir cette distinction.

Si, parmi les résultats entre lesquels il s’agit de prendre un milieu, il s’en trouve qui soient dus à des gens distraits, mal habiles, peu soigneux et consciencieux, capables d’abréger volontairement le travail, au prix de son exactitude, ou par des gens d’ailleurs doués d’autant d’adresse et de bonne foi qu’on voudra, mais qui ont appliqué leur talent et leur attention à des méthodes évidemment vicieuses ; voilà tout autant de motifs externes pour suspecter et même pour rejeter tout-à-fait ces résultats, en quelque nombre qu’ils soient d’ailleurs, et quel que puisse être leur accord soit entre eux, soit avec ceux qu’on est moins fondé à suspecter.

Que nous soyons, au contraire, en possession d’un certain nombre de résultats, sans savoir aucunement ni à qui ils sont dus, ni quelle méthode on a mis en usage pour les obtenir ; ou bien que ces résultats soient dus à des hommes doués du même degré d’habileté et de bonne foi, appliquant ces qualités à des méthodes susceptibles d’un égal degré de précision ; les motifs externes de suspicion cesseront d’exister ; mais nous pourrons alors en trouver d’internes. Si, par exemple, la plupart de ces résultats ne présentent entre eux que des différences comprises dans les limites des erreurs dont les observations et les expériences, faites même avec le plus de soin, sont inévitablement susceptibles, et si en même temps les autres résultats, en beaucoup plus petit nombre, différent d’une manière très-notable, tant entre eux que de ceux-là, ce sera, contre ces derniers, des motifs internes de suspicion assez graves pour les faire rejeter, sans aucune hésitation.

On peut remarquer, au surplus, que si de trop notables différences entre des résultats suffisent pour en motiver le rejet, une trop parfaite concordance entre ces mêmes résultats doit produire le même effet. Cette coïncidence absolue est effectivement à tel point hors de toute vraisemblance qu’on ne saurait raisonnablement se refuser à l’attribuer à une concertation entre ceux à qui ils sont dus ; concertation qui, décelant chez eux un défaut de bonne foi, les rend tous dès-lors également suspects ; et c’est ainsi, pour le dire en passant, que des motifs internes de suspicion peuvent quelquefois en faire naître d’externes.

Mais quelque peu de coïncidence que puissent offrir entre eux les résultats qu’on examine, quelle que soit l’étendue des limites entre lesquelles ils se trouvent renfermés, s’ils se trouvent à peu près uniformément réparties entre ces limites, si, par exemple, ils forment sensiblement une progression arithmétique, ou si, mieux encore, il s’en trouve un assez grand nombre qui différent fort peu du plus grand d’entre eux, et un autre nombre, à peu près égal, qui diffère fort peu du plus petit ; si, par exemple, ils forment une suite comme celle-ci :

on pourra bien sans doute désirer des résultats moins discordans, et l’on fera fort bien de s’en procurer de tels, si on le peut ; mais on ne verra guère de motifs internes de préférer les uns aux autres, et il faudra conséquemment les faire tous entrer en considération dans la recherche du résultat moyen, si l’on n’est point en situation de s’en procurer d’autres plus satisfaisans.

La discussion des motifs externes de suspicion est sans doute très-importante ; mais elle est en même temps très-délicate et d’autant plus difficile qu’elle ne paraît guère de nature à être soumise à des règles plus précises que celles qu’on prescrit, en général, pour la critique ; et comme ces règles ne sont guère du domaine des sciences exactes, nous ne saurions nous y arrêter ici. Nous supposerons donc, dans tout ce qui va suivre, que les résultats sur lesquels on doit opérer sont ceux-là seulement qu’une saine critique a pu admettre ; nous supposerons même qu’ils ne présentent aucun motif interne de suspicion, de nature à en faire écarter quelques-uns de préférence aux autres ; de telle sorte qu’il paraisse raisonnable de les employer tous ; alors cette seconde question pourra être considérée comme rentrant dans la première, du moins quant au procédé à employer ; car il y aura toujours entre elles cette différence essentielle que, dans la première, l’inégalité des résultats ne saurait en faire suspecter aucun, tandis qu’ici tous sont suspects, tant qu’ils ne sont pas tous égaux.

Il y a long-temps sans doute que le problème de la moyenne entre plusieurs résultats inégaux s’est présenté aux hommes ; et il y a long-temps aussi que, soit par une sorte d’instinct, soit dans la vue d’éviter des calculs trop pénibles, on est convenu d’adopter comme tel le quotient de la division de la somme de ces résultats par leur nombre. Cette pratique a même été constamment suivie, sans aucun scrupule, jusqu’à l’époque où la théorie des probabilités a commencé à être cultivée avec quelque soin et quelque suite. Alors seulement on a commencé à concevoir des doutes sur la légitimité du procédé, et à soupçonner que la véritable moyenne entre plusieurs résultats inégaux ne devait peut-être pas se composer de la même manière de tous ces résultats ; et que chacun d’eux devait concourir pour plus ou moins dans la formation de cette moyenne, à proportion qu’il paraissait s’en rapprocher ou s’en écarter davantage. C’est cette maxime qui paraît avoir servi de base aux méthodes que Boschovich, Bernouilli, Lambert, Lagrange, Condorcet et d’autres ont tour à tour proposé de substituer à la méthode vulgaire. Cependant, dans ces derniers temps, celle-ci a semblé reprendre son ancienne faveur ; on l’a même signalée comme la plus conforme à la doctrine des probabilités ; et on a même été jusqu’à insinuer qu’elle était tout-à-fait indépendante de toute hypothèse sur la loi de facilité des erreurs. Le but que nous nous proposons ici, et que nous désirerions pouvoir remplir d’une manière moins imparfaite, est d’essayer de répandre quelque lumière nouvelle sur celle épineuse question. Quelque jugement que l’on porte d’ailleurs sur cet écrit, nous n’aurons pas à regretter de l’avoir rendu public, s’il peut appeler de nouveau l’attention des géomètres sur le sujet auquel il est relatif, et provoquer de leur part des discussions qui ne sauraient que tourner au profit de la science.

Une chose assez digne de remarque, c’est qu’on se soit beaucoup plus occupé de la recherche des méthodes propres à donner la moyenne la plus convenable entre les résultats de plusieurs observations ou expériences données qu’à bien préciser ce que c’était que cette moyenne, que l’on poursuivait ; sans doute parce qu’on a tacitement supposé que tout le monde était à peu près d’accord sur ce point. Toutefois, comme il pourrait fort bien se faire qu’il n’en fût pas tout-à-fait ainsi, et comme c’est déjà faire un assez grand pas vers la solution d’une question que de la bien circonscrire ; arrêtons-nous un moment à fixer nettement ce que l’on doit entendre par la moyenne entre plusieurs résultats donnés.

Lorsque ces résultats ne présentent entre eux des différences qu’à raison de l’imperfection des procédés par lesquels on les a obtenus, comme, par exemple, lorsqu’on a plusieurs mesures d’une même longueur, cela s’entend, pour ainsi dire, de soi-même. La moyenne cherchée est alors une combinaison de ces divers résultats, de laquelle on puisse présumer qu’elle diffère moins du véritable et unique résultat que toute autre combinaison qu’on pourrait faire des mêmes données. Et encore faut-il remarquer qu’il ne s’agit pas ici d’une présomption absolue, mais d’une présomption tirée uniquement des données du problème. On conçoit, en effet, que, si les données différent toutes dans le même sens et d’une quantité notable du véritable résultat, la moyenne la plus convenable ne sera point celle qui différera réellement le moins de ce résultat, mais bien celle qui, d’après les données, devra être présumée s’en approcher davantage.

Dans le cas où, au contraire, les résultats entre lesquels on cherche une moyenne sont de nature à être inégaux, bien qu’ils soient tous d’ailleurs également exacts, comme il arrive, par exemple, lorsqu’on veut assigner le produit moyen d’une propriété territoriale ; la définition de la moyenne semble devoir nécessairement impliquer l’idée de l’infini. La moyenne rigoureuse serait alors, en effet, celle qu’on déduirait d’une infinité d’observations ou d’expériences, en prenant la somme de leurs résultats et en divisant cette somme par leur nombre ; et le problème consiste alors à suppléer à des résultats en nombre infini, par des résultats en nombre fini ; et à déduire de ces derniers un résultat moyen qui puisse être présumé différer le moins possible de celui qu’on aurait conclu des premiers, du moins d’après les seules lumières acquises par l’inspection des autres.

En résumé, on voit que, dans l’un et dans l’autre cas, on peut distinguer deux sortes de moyennes, savoir ; une moyenne absolue, qui est la véritable, et une moyenne relative, qui est celle que, d’après les données, on doit présumer s’écarter le moins de celle-là, et qui, quelque méthode qu’on emploie pour l’obtenir, ne saurait être rigoureusement égale à l’autre que dans des cas particuliers, et par l’effet d’un concours de circonstances favorables.

La moyenne absolue demeure toujours inconnue, de sorte qu’on ne saurait, en aucun cas, vérifier, à posteriori, la moyenne relative, en la confrontant avec celle-là. Mais, quand bien même la moyenne absolue pourrait être découverte après coup, ce serait une fort mauvaise manière de juger d’un procédé que de prendre pour mesure de sa précision le plus ou le moins de ressemblance de la moyenne relative qu’on en aurait déduite avec la moyenne absolue. Un trop grand écart de cette moyenne absolue pourrait au plus accuser les données, et par suite ceux qui les auraient fournies ; mais pour qui reçoit ces données d’ailleurs, sans avoir eu aucune part à leur détermination, le seul parti raisonnable à prendre est de suivre les indications qu’elles fournissent ; ainsi, par exemple, il ne devra jamais prendre la moyenne relative hors de leurs limites, quoique la moyenne absolue puisse fort bien n’y être point renfermée.

Ces principes ainsi posés, examinons, en premier lien, la méthode vulgaire qui, comme nous l’avons déjà dit, consiste à prendre pour moyenne le quotient de la division de la somme des données par leur nombre ; on conçoit assez qu’on ait pu adopter cette méthode dans le cas où les données sont de nature à être inégales ; on a pu alors se dire, en effet, que, puisque toutes ces données étaient effectives, puisqu’elles étaient toutes fournies par des observations ou par des expériences à l’abri de tout reproche, il était naturel qu’elles concourussent toutes pour une égale part à la formation du résultat moyen.

Cependant, dans ce cas même, la méthode vulgaire n’a pas été généralement suivie ni pratiquée sans quelques restrictions. Il est, par exemple, certaines provinces de France où, pour déterminer le revenu moyen d’une propriété territoriale, il est d’usage de considérer ce revenu durant vingt années consécutives, d’en distraire le revenu le plus fort et le revenu le plus faible, et de prendre ensuite le dix-huitième de la somme des autres. Ceux qui ont imaginé cette méthode, ont sans doute considéré que des récoltes extrêmement abondantes et des récoltes extrêmement faibles devaient être considérées, en quelque sorte, comme des exceptions à la marche habituelle de la nature, et qu’en conséquence on ne devait en tenir aucun compte.

Mais des motifs à peu près semblables à ceux qui font ainsi rejeter le plus fort et le plus faible résultats, ne pourraient-ils pas tout aussi bien motiver l’exclusion des deux plus forts et des deux plus faibles, ou même d’un plus grand nombre des uns et des autres ? et d’exclusion en exclusion n’arriverait-on pas enfin à ne conserver que le résultat du milieu, lorsque les données seraient en nombre impair ? Qui sait même si quelqu’un, au lieu de rejeter les deux résultats extrêmes, ne jugerait pas à propos, au contraire, de ne conserver que ceux-là, et de prendre leur demi-somme pour le résultat moyen ? On sent même qu’il ne serait pas difficile de trouver des motifs plausibles à l’appui de cette pratique. D’autres pourraient, tout aussi bien, employer les deux résultats les plus forts avec les deux plus faibles, ou combiner entre eux un plus grand nombre des résultats extrêmes. D’ailleurs, si l’on est fondé, soit à rejeter, soit à employer exclusivement les deux résultats extrêmes, lorsqu’on n’en considère que vingt seulement, ne faudra-t-il pas, si l’on veut être conséquent, rejeter ou employer exclusivement les deux plus forts et les deux plus faibles sur quarante, les trois plus forts et les trois plus faibles sur soixante, et ainsi de suite ? Mais, tandis que quelques-uns prendront le nombre vingt pour base des rejets ou des admissions exclusives, qui s’opposera à ce que d’autres ne s’accommodent mieux des nombres quinze ou vingt-quatre ? Nous nous trouverons donc jetés ainsi dans le champ de l’arbitraire ; et le résultat moyen, qui, de sa nature devrait être unique, se trouvera, dans le fait, plus grand ou plus petit, suivant les diverses modifications qu’il aura plu à chacun d’introduire dans la méthode destinée à en donner la valeur.

Mais le système des rejets ou des emplois exclusifs, tolérable encore, jusqu’à un certain point, dans l’hypothèse suivant laquelle nous venons de raisonner, ne semble plus pouvoir être admis dans celle où les résultats ne différent les uns des autres qu’à raison de l’imperfection des procédés d’observation ou d’expérience. Que l’on ait fait, par exemple, vingt pesées d’un même corps ; bien qu’il soit fort vraisemblable que ni la plus forte ni la plus faible, ni même aucune d’elles, ne représente exactement le poids de ce corps, cela pourrait pourtant arriver ; en toute rigueur ; et cette considération suffit pour faire comprendre qu’il serait très-déraisonnable de ne les pas toutes prendre en considération.

Mais sera-t-il plus sensé de les faire toutes concourir pour la même part dans la composition du résultat moyen ? nous ne le pensons pas davantage. Nous avons remarqué plus haut que, parmi les données fournies par l’expérience, il peut s’en trouver une ou plusieurs qui s’écartent tellement des autres que l’on doive les rejeter sans aucune hésitation ; mais, jusqu’à quel point devront-elles s’en écarter pour qu’il puisse être permis de n’en tenir aucun compte ? c’est là, à ce qu’il nous paraît, une question qu’il ne serait pas facile de résoudre. Supposons-la cependant résolue ; supposons qu’on ait trouvé que, pour qu’une donnée soit dans le cas d’être rejetée, il faut qu’elle tombe en dehors des deux limites quel parti faudra-t-il prendre alors, si une certaine donnée coïncide exactement avec l’une ou l’autre de ces deux limites, et, en suivant la méthode vulgaire, ne se trouvera-t-on pas dans cette singulière situation de pouvoir, à son gré, et avec tcmt autant de fondement, ou réputer une donnée trop suspecte pour en faire usage, ou la faire concourir pour la même part que toutes les autres à la formation du résultat moyen ?

Avant de nous engager plus avant dans cette discussion, remarquons, en passant, qu’on ne voit pas d’abord trop bien pourquoi on a choisi la somme des données divisée par leur nombre, plutôt qu’une multitude d’autres fonctions de ces données, pour l’expression du résultat moyen. La seule condition de rigueur à laquelle on voie clairement, à priori, que ces sortes de fonctions doivent être assujetties, paraît être que, si les données sont au nombre de égales à la moyenne soit la même que si, les données étant au nombre de seulement, il ne s’en trouvait qu’une de chaque sorte ; de manière que, par exemple, la moyenne de

soit la même que celle de a

or, en se renfermant même dans les fonctions purement algébriques, on peut trouver une multitude de fonctions qui remplissent cette condition. Qui empêcherait, par exemple, de prendre pour résultat moyen une racine du produit des données d’un degré égal a leur nombre ? ou bien, si l’on ne voulait pas sortir du cercle des fonctions rationnelles, ne pourrait-on pas prendre, en général,

formule dans laquelle est le nombre des données, et où expriment les sommes de produits de ces données à et à étant un nombre absolument arbitraire ; ou bien, ne pourrait-on pas prendre encore la formule

expriment les sommes des mes et des mes puissances de ces mêmes données ? La formule ordinaire n’est, au surplus, qu’un cas particulier de ces deux-là : c’est celui qui répond à C’est sans doute l’hypothèse qu’on doit admettre, lorsqu’on aspire uniquement à la plus grande simplicité ; mais la plus grande simplicité est-elle toujours compagne de la plus grande-rigueur ?

Soient donc des résultats donnés d’observations ou d’expériences, au nombre de entre lesquels il soit question d’assigner le résultat moyen le plus probable, et soit ce résultat moyen inconnu ; la méthode vulgaire donne

quel que soit le nombre Or, suivant la doctrine des probabilités, si l’on connaissait les probabilités en faveur de en les représentant respectivement par la moyenne rigoureuse ou absolue serait

donc, la méthode vulgaire revient à considérer tous les résultats obtenus comme ayant le même degré de probabilité. Or, encore un coup, si ces résultats sont nombreux ; si tous, excepté un seul, ne présentent entre eux que des différences très-légères ; et si ce dernier diffère, au contraire, d’une manière notable de celui-là même des autres qui s’en trouve le plus voisin, peut-on dire, de bonne foi, qu’il soit aussi probable qu’eux, et peut-on raisonnablement le faire figurer de la même manière que ceux-ci dans la formation du résultat moyen[1] ?

La formule

devient, en chassant le dénominateur,

et peut ensuite être mise sous cette forme

or, si était le résultat moyen absolu, seraient les erreurs qui affecteraient respectivement les résultats donnés, prises avec leurs signes ; donc la méthode vulgaire revient à supposer que la somme des erreurs est nulle, ou, ce qui revient au même, que la somme des erreurs par excès est égale à la somme des erreurs par défaut. Cette hypothèse paraît assez plausible, lorsque le nombre des erreurs dans un sens est à peu près égal au nombre des erreurs en sens contraire ; mais il paraît fort difficile de l’admettre dans le cas où, par exemple, il existe une erreur unique très-considérable, dans un sens et une multitude d’erreurs très-petites en sens contraire.

La dernière équation ci-dessus peut elle-même être mise sous cette autre forme

ou encore sous celle-ci

donc la méthode vulgaire revient aussi à supposer nulles soit la me dérivée du produit des erreurs, soit la me dérivée de la somme de leurs mes puissances, étant un nombre entier positif quelconque.

Si, dans cette dernière formule, on suppose elle devient

ou, en d’autres termes,

donc, la méthode vulgaire revient à supposer que la somme des quarrés des erreurs qui affectent les données est la moindre possible ; c’est-à-dire que cette méthode n’est qu’une application très particulière de la Méthode des moindres quarrés, publiée, pour la première fois, par M. Legendre, en 1805, et dont M. Gauss a déclaré, en 1809, être de son côté, en possession depuis 1795. Cette méthode, que l’un et l’autre des deux géomètres que nous venons de citer n’avaient indiquée que comme paraissant réunir à une approximation communément suffisante une grande commodité d’application, a acquis postérieurement une insigne faveur ; et on est assez généralement porté aujourd’hui a l’envisager comme jouissant d’une perfection absolue, et donnant conséquemment, dans tous les cas, une moyenne rigoureusement conforme aux principes de la plus saine théorie.

Il arrive cependant, comme nous venons de le faire observer tout-à-l’heure, que cette méthode des moindres quarrés conduit à faire considérer la moyenne arithmétique, entre plusieurs résultats passibles d’erreur, comme le résultat exact le plus probable. Si donc, comme nous croyons l’avoir établi, il ne saurait en être ainsi, dans tous les cas, et si, comme on ne saurait le contester, il est permis de juger d’un principe par ses conséquences, et par les résultats qu’en entraîne l’application ; quel jugement devrons-nous porter de celui-ci ? Un célèbre géomètre a observé, quelque part, que la théorie des probabilités n’est, au fond, que le bon sens réduit en calcul ; or, la conséquence forcée de cette maxime, c’est que tout principe dont les conséquences ne sont pas constamment d’accord avec les aperçus du bon sens, ne saurait être rigoureusement conforme à la doctrine mathématique des probabilités.

On se tromperait étrangement, toutefois, si l’on nous supposait l’intention de faire ici le procès à la méthode des moindres quarrés ; et nous conviendrons volontiers qu’en même temps quelle est d’un service très-commode, elle doit être d’une suffisante exactitude, lorsque les erreurs des observations se trouvent renfermées entre des limites très-étroites ; mais il ne faut pas attendre d’elle au-delà de ce qu’elle peut donner ; et nous pensons que, dans tous les cas, le problème de la moyenne entre plusieurs résultats est une sorte de problème indéterminé ; parce que ce problème ne saurait être rendu tout-à-fait indépendant de toute hypothèse sur la facilité des erreurs, et qu’il est, sur ce point, une infinité d’hypothèses que l’on peut justifier par des motifs à peu près également plausibles.

Après ces réflexions générales, revenons, en particulier, à la recherche de la moyenne entre les résultats de plusieurs expériences, supposés aussi différens les uns des autres qu’on le voudra ; et remarquons d’abord que, excepté certains cas, tels par exemple que ceux des erreurs d’un nombre rond de dizaines ou de centaines en comptant, on peut raisonnablement admettre qu’une erreur grave est généralement plus difficile à commettre qu’une erreur moins considérable, et qu’il est d’autant moins aisé de se garantir d’une erreur que cette erreur est plus petite.

Admettons donc, pour première hypothèse, que la probabilité des erreurs soit simplement en raison inverse de leur étendue ; cette raison inverse sera aussi la mesure du degré de confiance que chaque résultat en particulier devra inspirer ; et ce sera également, en proportion de ce degré de confiance qu’il devra concourir à la formation du résultat moyen. Soient donc toujours les résultats donnés, au nombre de et le résultat moyen cherché, on devra avoir

en chassant le dénominateur et transposant, cette formule devient

ou, en chassant de nouveau les dénominateurs,

ou enfin, plus simplement,

équation dont les racines pourraient conséquemment être indistinctement prises pour le résultat moyen cherché. Loin que cette conclusion ait rien de paradoxal, elle était au contraire très-facile à prévoir. Si, en effet, on admet que le résultat moyen cherché soit égal à l’un des résultats donnés, à par exemple ; l’erreur qui affectera celui-ci sera absolument nulle ; il devra donc entrer pour une part infime dans la composition de la valeur de tandis que les autres n’y entreront chacun que pour une part finie ; on se trouvera donc dans le même cas que s’il y entrait seul ; on devra donc avoir Toutefois, ce procédé ne saurait nous convenir, puisqu’il est de l’essence de notre problème de n’admettre qu’une solution unique.

Cependant, dans le cas où les données seraient comprises entre de très étroites limites, l’équation ayant ses racines sensiblement égales, les dérivées de cette équation auraient sensiblement lieu en même temps qu’elle ; donc, en particulier, on pourrait sensiblement lui substituer sa me dérivée, qui ne serait que du premier degré. Or, nous avons vu plus haut que c’est à cela que revient la méthode ordinaire ; donc la méthode ordinaire n’est qu’une approximation de celle-ci, fondée sur l’hypothèse que les différences entre les données sont fort petites ; d’où il paraît naturel de conclure qu’elle ne peut être employée avec sécurité que sous cette condition.

Il en irait à peu près de même, toutes les fois qu’on supposerait le degré de confiance dû à chaque résultat en raison inverse d’une puissance positive de l’erreur qui l’affecte. Si, par exemple, on supposait ce degré de confiance en raison inverse des quarrés des erreurs, on aurait, pour déterminer l’équation

ou, en chassant le dénominateur et transposant,

Or, il est aisé de voir qu’en posant

et représentant par la dérivée de ce produit, l’équation dessus deviendra

nous retrouvons donc d’abord les mêmes valeurs de que ci-dessus, et en outre celles au nombre de qui résultent de l’égalité à zéro de la dérivée du produit des erreurs.

Après y avoir bien réfléchi, il nous a paru que, pour n’avoir jamais qu’une solution unique, et conserver néanmoins l’esprit de la méthode qui vient de nous guider ci-dessus, on pouvait procéder par une suite d’approximations, ainsi que nous allons l’expliquer. Admettons la formule

non comme moyenne exacte, mais seulement comme moyenne approchée ; en convenant de désigner généralement par la somme des produits des données à cette formule deviendra

(1)

Admettons présentement que le degré de confiance dû à chaque donnée soit en raison inverse de sa différence avec ce premier résultat ; nous aurons, pour seconde approximation,

ou, plus simplement,

On trouve facilement que cette formule revient à

exprimant, en général, la somme des puissances des données. Mais il est connu d’ailleurs que



. . . . . . . . . . . . . . . . . . . . . . . . .

en substituant donc, il viendra, pour seconde moyenne approchée

Or, de même que nous nous sommes servis de la première valeur approchée pour parvenir à celle-ci, nous pourrions pareillement employer cette dernière à la recherche d’une troisième, et procéder ainsi d’approximation en approximation, jusqu’à ce que nous soyons parvenus à deux valeurs successives, ne différant entre elles qu’entre les limites des erreurs qu’on peut tolérer. Mais, au lieu de rechercher péniblement des formules générales, qui deviendraient probablement de plus en plus compliquées, à mesure qu’on voudrait pousser les approximations plus avant, il sera plus commode et plus simple d’appliquer immédiatement le procédé aux données numériques ; mais, avant d’en faire l’application à un exemple, nous placerons d’abord ici quelques remarques préliminaires.

Nous ferons d’abord observer, comme nous l’avons déjà dit plus haut, qu’au lieu de considérer le degré de confiance dû à chaque donnée comme simplement en raison inverse de sa différence avec le résultat moyen hypothétique sur lequel on opère, on peut faire ce degré de confiance inversement proportionnel à une puissance plus ou moins élevée de cette même différence. On sent même qu’il doit y avoir de l’avantage à choisir de préférence une puissance paire qui, étant toujours positive, quel que soit le signe de la différence, ne changera jamais le signe des données qu’elle multipliera. Afin donc de réunir la rigueur à la plus grande simplicité possible, nous admettrons constamment que le degré de confiance que chaque donnée mérite, dans une approximation quelconque, est, en raison inverse du quarré de sa distance à la moyenne obtenue par l’approximation précédente.

En second lieu, il n’est point indispensablement nécessaire de prendre, pour première approximation, la moyenne qui résulte de la méthode vulgaire ; et on peut fort bien lui substituer tout autre nombre que l’inspection des données aura pu faire soupçonner devoir peu différer de la moyenne véritable.

Il faudra bien se garder toutefois de choisir pour cette moyenne l’une des données elle-même ; il est évident ; en effet, par la nature du procédé, que, quand bien même cette donnée serait une des extrêmes, on retomberait perpétuellement sur elle, quelque loin qu’on prétendit pousser l’approximation. Il faudra donc éviter d’employer la méthode vulgaire, pour la première approximation, lorsque l’application de cette méthode fera tomber sur une des données.

Il pourrait se faire que les résultats des approximations successives ne fissent qu’osciller sans cesse autour d’une valeur moyenne, ou même fussent tout-à-fait divergens ; et c’est, en particulier, ce qui arriverait fréquemment, en employant la raison inverse d’une puissance impaire de la distance ; mais il n’y a pas d’apparence qu’on ait cet inconvénient à redouter, en employant la raison inverse du quarré de la distance, ainsi que nous l’avons conseillé plus haut. Au surplus, on pourra être assuré que le procédé marche bien, lorsque les différences consécutives des divers résultats approchés, quels qu’en soient d’ailleurs les signes, seront continuellement décroissantes.

Pour ne nous pas engager dans des calculs trop pénibles, nous bornerons nos applications à la seule question que voici : Une vigne a rapporté, durant quatre années consécutives, et muids de vin ; à combien peut-on raisonnablement en évaluer le produit moyen ?

S’il n’existait que les trois premières données, il serait naturel de prendre pour la moyenne cherchée ; et c’est aussi celle que donnerait alors la méthode ordinaire ; mais, à raison de la quatrième donnée cette méthode donne pour la moyenne. Cependant, cette moyenne ne saurait être raisonnablement admise ; le cas où nous nous trouvons est, en effet, très-différent de celui où nos données seraient

et où le simple bon sens indiquerait pour la moyenne ; car la distance de la donnée 12 aux trois autres, et la grande proximité de celles-ci entre elles, indiquent assez que cette donnée ne saurait être considérée que comme un cas extraordinaire, que comme une sorte d’exception, suffisante, à la vérité, pour rendre la moyenne plus grande que mais pas assez cependant pour la rendre égale à le bon sens indique donc ici la moyenne comme comprise entre et voyons ce que le calcul nous donnera.

En partant de comme première approximation, la seconde valeur approchée de la moyenne sera,

c’est-à-dire,

ou encore

En prenant de même pour seconde approximation nous aurons, pour troisième valeur approchée,

c’est-à-dire,

ou encore

ou enfin

Prenant donc pour troisième approximation, nous aurons, pour quatrième valeur approchée,

c’est-à-dire,

ou encore

ce qui donne, toutes réductions faites,

Nous ne pousserons pas plus loin ce calcul, qui se compliquerait de plus en plus, mais que pourtant on pourrait abréger un peu, comme tous les calculs approximatifs. Nous remarquerons seulement qu’en réduisant nos valeurs successives en décimales, et prenant leurs différences consécutives, on a

d’où l’on voit que les différences décroissent assez rapidement ; de sorte qu’il est probable que, si l’on pouvait poursuivre indéfiniment le calcul, on tomberait enfin sur une moyenne extrêmement voisine de mais une peu inférieure à ce nombre ; ce que le seul bon sens pouvait d’ailleurs indiquer[2].

Nous ne prétendons pas, au surplus, attacher à ce procédé plus d’importance qu’il n’en mérite ; nous pensons même que, pour le cas d’un très-grand nombre de données, le seul pourtant où l’on puisse faire quelque fond sur le résultat moyen, il deviendrait bientôt impraticable ; à raison de la complication des calculs qu’il exigerait ; de sorte que, dans la pratique, on se trouvera contraint de lui préférer la méthode ordinaire ; mais quelque jugement qu’on en porte d’ailleurs, les remarques dont nous avons fait précéder son exposition n’en subsisteront pas moins ; et il restera toujours à justifier la méthode vulgaire, ou à lui substituer quelque autre méthode qui ne soit pas sujette aux mêmes objections.

Lyon, le 26 d’octobre 1821.
  1. Ne serait-il pas possible que tout ce raisonnement ne fût au fond qu’une pure illusion. Si tous les résultats donnés, excepté un seul, sont très-voisins les uns des autres, et si le dernier diffère d’eux d’une manière notable, il y aura sans doute grande apparence que la véritable moyenne doit être plus voisine des premiers que de celui-ci, et cela sera d’autant plus vraisemblable que ceux-là seront plus nombreux ; mais aussi, plus ils seront nombreux et moins l’emploi de la méthode vulgaire donnera d’influence à l’autre résultat ; d’où l’on voit que cette méthode n’est pas si contraire à ce que le bon sens indique qu’on voudrait ici l’insinuer.
    J. D. G.
  2. Ce procédé nous paraît avoir une grande analogie avec la méthode de Newton pour l’approximation des racines incommensurables des équations numériques et nous pensons d’après cela qu’il en doit offrir toutes les vicissitudes. Ainsi, 1.o les diverses valeurs approchées de la moyenne doivent tendre sans cesse vers l’une des données, du moins tant que deux données ne sont pas très-voisines l’une de l’autre ; 2.o suivant le choix du point de départ ou première valeur approchée, les approximations successives peuvent tendre indistinctement vers chacune des données, même vers une des données extrêmes ; 3.o enfin, si l’on prend le point de départ ou première valeur approchée peu différent de deux données qui soient en même temps très-voisines l’une de l’autre et très distantes des autres données, les approximations successives devront alternativement osciller vers l’une et vers l’autre de ces deux données.
    J. D. G.