Statistique et expérience (Simiand)/Chapitre VIII

VIII

Qu’il faut varier l’expérience, la varier méthodiquement, rechercher, éliminer ou discuter toutes les dépendances possibles.


Je viens à une autre condition de preuve aussi communément recherchée. Dans toutes les sciences de la nature et malgré toutes les supériorités qu’y confère l’expérimentation matérielle, nous y voyons une relation n’être tenue pour établie et n’entrer dans la science, en général, qu’après une expérimentation renouvelée, répétée, par le même savant dans le même laboratoire, par d’autres savants dans d’autres laboratoires, reprenant la même étude, la même épreuve, la même détermination. Et ce n’est pas qu’en principe une seule expérience ne soit suffisante à établir une relation et qu’un certain nombre soit nécessaire (car à quel nombre la preuve commencera-t-elle à être valide ?) Mais, malgré que ce soit matériellement que l’expérimentation artificielle permette ici de séparer les éléments et les facteurs, d’en écarter certains, d’en garder certains autres, d’en introduire encore tel ou tel, le savant soupçonne méthodiquement, d’une part, que les relations observées entre ceux qu’il a retenus et fait agir l’un avec l’autre peuvent être fortuites, et, d’autre part, qu’il n’a peut-être pas éliminé tout autre facteur que ceux qu’il a consciemment laissés, qu’il n’a peut-être pas aperçu tel élément qui joue un rôle à côté ou au-dessus de ceux auxquels il attribue toute l’action aperçue.

La répétition de l’expérience, soit en variant, soit au contraire en essayant de ne pas varier les conditions que l’on connaît, est une façon de donner chance que la relation, si elle était fortuite, cesse de se manifester ou se manifeste dans d’autres conditions, et que, d’autre part, les facteurs ou actions inaperçus, s’il en est effectivement, se trouvent varier de quelque épreuve à une autre, et par suite se déceler par quelque variation dans les faits observés. Plus est complexe la matière étudiée, plus longuement est pratiquée cette double précaution.

Dans le domaine de notre expérience statistique, où la matière est tellement complexe, les facteurs tellement multiples, les dépendances directes ou indirectes si souvent possibles, fait-on communément un effort comparable contre ce double danger ?

Et d’abord sans doute, et de façon plus ou moins consciente et plus ou moins réfléchie, on s’essaie aussi à répéter l’expérience ; mais dans quelles conditions et dans quelles limites ? — Particulièrement la statistique biologique, médicale, anthropologique, souvent, et même, dans certains cas, la statistique démographique disposent d’un nombre notable d’expériences distinctes, effectuées ou possibles. Au surplus, si le nombre de ces cas reste encore souvent assez modeste en comparaison de celui que les recherches de laboratoire exigent communément, et eu égard surtout aux complexités de causes ou de facteurs concomitants dont il peut y avoir à tenir compte, c’est justement dans ces branches de statistique que s’est le plus développé l’effort pour apprécier objectivement, mathématiquement, dans quelle mesure le résultat obtenu sur telles ou telles bases pourrait résulter du hasard, c’est-à-dire d’un concours indéterminé de causes multiples, ou encore d’autres éléments non soupçonnés ou non étudiés.

Mais il s’en faut que, pour une bonne part du domaine des recherches statistiques, notamment en statistique sociale ou économique, nous nous trouvions dans des conditions aussi favorables et puissions seulement songer à faire emploi de cette technique de contrôle. Par exemple le grand mouvement général des prix auquel nous assistons en ce moment, n’a, — et encore au degré et à l’extension près, — que deux ou trois analogues au cours du xixe siècle, et quelques-uns de plus peut-être si nous remontons jusqu’au xvie siècle. Le danger d’une expérience unique, surtout en matière aussi complexe, est si grand que nous devons assurément faire effort pour étendre notre connaissance jusqu’à ces mouvements analogues antérieurs : les insuffisances tenant à l’imperfection des données dont nous disposons sur eux à cette heure sont largement compensées, je crois pouvoir le dire, par l’avantage de comparaisons qui, si grossières qu’elles doivent rester, apportent des suggestions intéressantes et des éléments de contre-épreuve et d’interprétation dont la concordance et, par suite, l’utilité dépassent l’attente ; et des sources ou des documents élémentaires qui existent, une plus grande ou meilleure élaboration pourrait être réalisée. Si bien que c’est à peine un paradoxe de dire que ce qui presserait le plus pour bien comprendre et interpréter le grand mouvement actuel serait de pousser les études possibles de statistique historique sur le grand mouvement de prix de la guerre de sécession aux États-Unis, du milieu du xixe siècle en Europe, ou mieux encore, de la grande hausse qui paraît s’être étendue du dernier quart du xviiie siècle à 1815, et de la grande baisse qui a suivi.

Cependant, malgré ces difficultés et ces limitations, supposons une telle recherche et élaboration réalisées. Prenons même des phénomènes économiques ou sociaux plus restreints en extension ou en durée, et dont il peut être présenté plus de répliques soit dans le passé soit dans les diverses contrées ou industries. Au total, le maximum de fois où nous pourrons répéter nos constatations sera encore bien éloigné d’un minimum de répétition dont se contenterait à peine une recherche de laboratoire dans des cas les plus simples, et nous avons affaire à des faits complexes, échappant à toute action matérielle de l’expérimentateur, aussi bien que les concomitants avec lesquels nous recherchons leur relation possible.

Après donc avoir fait le plus grand effort pour répéter notre expérience le plus possible, il faut bien nous rendre compte que, le plus souvent, ici, nous n’arrivons point, par ce seul procédé, à nous garantir contre des relations insuffisamment fondées ou incomplètes, ou contre le risque de coïncidence fortuite ou illusoire. Il faut donc tâcher de nous prémunir encore autrement.

Gardons-nous toutefois de confondre, avec ce que nous cherchons ici, cette preuve qui est encore présentée si communément en ce domaine et qu’on pourrait appeler un échantillonnage empirique.

La plupart des ouvrages économiques sur le salaire répètent, après Adam Smith (qui avait, lui, utilisé au mieux les informations à sa disposition, mais elles se sont développées depuis), que les salaires sont plus hauts dans les professions moins agréables (moins aisées, moins propres, etc.) et moins hauts dans les professions plus agréables. J’ai eu la curiosité de donner en travail d’étudiant (École des Hautes Études) à vérifier cette thèse, en s’astreignant à classer, au point de vue du caractère de la profession, d’une part, et du niveau du salaire, d’autre part, toutes les professions à salaires spécifiés dans une enquête nationale assez étendue. Le travail qui m’a été remis sur ces bases aboutit à contredire à peu près complètement l’affirmation traditionnelle. Et je ne dis pas que cette épreuve soit suffisante pour fonder l’affirmation contraire.

J’en tire seulement que, dans notre matière, il ne faut pas nous contenter des cas qui se présentent au petit bonheur : il faut nous astreindre à embrasser un ensemble de cas objectivement constitué, assez large et assez varié pour que, soit que nous l’analysions intégralement, soit que nous y prélevions un certain nombre de cas par un hasard systématique, nous ayons chance suffisante de ne pas nous prendre à des coïncidences fortuites ou incomplètes.

Ou enfin, si nous ne pouvons embrasser tout l’ensemble désirable, il faut nous rendre compte de ce que nous atteignons par rapport à lui, et de la chance que cette part atteinte peut présenter d’être assez représentative du tout. La statistique biométrique notamment a recherché et perfectionné, à cet égard, des procédés d’appréciation que d’autres emplois de la statistique gagneraient à utiliser ou à adapter.

Mais ne confondons pas non plus ce hasard systématique avec ce mode d’opérer dont on se contente encore si souvent aujourd’hui : à l’appui d’une proposition, on cite un nombre plus ou moins grand de cas conformes, pris d’ici, de là, dans les sources les plus inégales de valeur et de signification, sans examen et, par conséquent, sans détermination des autres facteurs ou conditions que ces cas peuvent présenter ou non, sans souci de passer en revue ou de reconnaître, même sommairement, les cas comparables dont l’étude serait possible, et sans choix objectif et justifié de ceux que l’on retient, — simplement d’ordinaire, disons-le, à la fortune des constatations trouvées toutes faites dans des ouvrages déjà existants. Des preuves de ce genre, je me chargerais volontiers, dans le domaine de faits dont je me suis spécialement occupé, d’en trouver, et en nombre notable, à peu près en faveur de toute thèse. Et sans doute ici mon choix serait tendancieux. Mais, s’il ne l’était pas, c’est-à-dire si, au lieu de tromper, je me trompais moi-même, le résultat en acquerrait-il meilleure valeur de preuve ?

Supposons même, cependant, que ces conditions soient améliorées, que la variation de l’expérience ainsi réalisée soit plus systématique et plus consciente : il reste toujours que notre expérience n’est pas matérielle et que par suite les facteurs ou éléments inaperçus, qui peuvent subsister à côté ou au-dessus de ceux entre lesquels nous avons dégagé et retenu une relation, ne se décèleront pas à nous de façon physique. C’est, donc à nous de nous en inquiéter par quelque opération intellectuelle, par quelque précaution spéciale. Si nombreux que soient les cas où nous avons pu constater une relation entre l’élément que nous étudions et un autre facteur, si étroite et exacte que soit statistiquement établie la corrélation entre leurs variations, il faut encore nous imposer de chercher si tous ces cas n’ont vraiment de commun que la présence ou la variation de ce second facteur, si tous autres éléments ou actions peuvent être dûment considérés comme éliminés, ou non communs à tous ces cas. Il faut que nous nous astreignons à faire une revue aussi complète et systématique que possible de tous autres facteurs avec lesquels pourrait s’établir plus exactement la relation, ou quelque dépendance inaperçue et cependant important à cette relation même. Si, comme il est probable en matière aussi complexe et en l’absence d’expérimentation artificielle, nous ne réussissons pas à éliminer sûrement toutes les dépendances possibles, il faut qu’après avoir établi au mieux nos résultats plus directs, et, si je puis dire, nos résultats bruts, nous examinions, discutions l’influence que ces dépendances possibles sont susceptibles d’avoir exercé sur eux, et en faire ainsi la part qui convient, en réserves à nos conclusions.