Statistique et expérience (Simiand)/Chapitre VI

VI

« Abstraction statistique » et « Fait scientifique »
Base homogène et extension opportune


Supposons réalisées ces conditions premières et en quelque sorte préjudicielles. Ne nous heurtons-nous pas aussitôt, et avant d’aller plus avant, à une objection considérable qui ne laisse pas, je crois, d’avoir encore un crédit assez répandu ?

N’y a-t-il pas, nous dira-t-on, entre l’expérimentation ordinaire des sciences de la nature et notre recherche statistique, cette différence essentielle que la première opère sur des réalités, tandis que la seconde opère sur des abstractions ? « Abstractions, créations de l’esprit, nous répète-t-on, illusions, irréalités, donc possibilité de jouer avec les données comme l’on veut ; donc possibilité d’arriver, avec de la statistique, à tout prouver, et le contraire aussi. »

Mais est-ce là bien apercevoir, bien caractériser une différence effective entre ces deux opérations de l’esprit ? ou bien, plutôt, le rapprochement avec l’expérimentation ordinaire des sciences de la nature ne va-t-il pas nous éclairer sur les conditions dont il dépendra que la statistique porte sur une réalité ou au contraire reste sans fondement ?

N’est-ce pas, en effet, un lieu commun de la méthodologie courante que de montrer que le fait scientifique des sciences de la nature, étant, on l’a vu, détaché, séparé (par définition même, on peut le dire) de la complexité que présente la réalité concrète, est à proprement parler une abstraction ? Mais, ajoute aussitôt cette méthodologie, ce n’est pas à dire que ce détachement, cette séparation, cette abstraction se fasse à la fantaisie de l’expérimentateur, que le fait scientifique soit une entité librement créée par l’esprit du savant, à la manière des entités de la scolastique médiévale. Pour mériter ce nom de fait scientifique, pour entrer dans la science, il faut que cette abstraction, tout en se distinguant de la complexité concrète, se modèle cependant suffisamment sur elle, respecte, comme l’a dit un philosophe contemporain, les articulations de la réalité, et enfin se prouve efficace et vraie par les résultats qui s’en tirent, par le succès.

Transposons dans le domaine statistique ces conditions de bonne abstraction enseignées par la méthodologie des sciences positives ; et nous apercevrons que la première précaution à prendre pour ne pas tromper et ne pas nous tromper nous-mêmes avec nos abstractions statistiques est de nous inquiéter que nos expressions de faits complexes, nos moyennes, nos indices, nos coefficients, ne soient pas des résultats de comptages quelconques, de combinaisons arbitraires entre des chiffres et des chiffres, mais qu’elles aussi se modèlent sur la complexité concrète, respectent les articulations du réel, expriment quelque chose à la fois de distinct et de vrai par rapport à la multiplicité des cas individuels à laquelle elles correspondent. Observons, au contraire, que ce qui peut nous égarer, ce qui, en fait, nous égare bien souvent dans l’emploi des abstractions statistiques, ce n’est pas qu’elles soient des abstractions, mais c’est qu’elles sont de mauvaises abstractions.

Nous ne voyons aucun physicien déterminer la densité d’un groupement quelconque d’objets hétéroclites ; car manifestement, ce groupement n’ayant aucune identité physique, la donnée n’aurait aucun intérêt scientifique. Nous ne voyons aucun botaniste grouper ses observations sur des plantes cinq mois par cinq mois, dix mois par dix mois, parce que manifestement la végétation marche selon le cycle de l’année ou de douze mois. Plus près encore et déjà dans le domaine statistique, nous ne voyons pas de biologiste déterminer et étudier une moyenne des tailles de tous les animaux divers d’une ménagerie.

Mais, par contre, est-il sans exemple, même dans des travaux d’une certaine qualification, de trouver des indices de prix établis entre des prix de toutes catégories confondues pêle-mêle et sans aucune discrimination, des prix de matières premières avec des prix de produits fabriqués, des prix de marchandises avec des prix de services, des salaires, des loyers, alors que les mouvements de ces divers groupes sont souvent assez différents soit de sens, soit d’allure, soit de date, pour qu’une expression commune, brouillant tout, ne puisse être que dépourvue de sens ou trompeuse, s’il n’est pris garde à ces différences ?

Bien moins encore n’est-il pas sans exemple de voir grouper et étudier par moyennes quinquennales, décennales, telles données de statistique économique sur des éléments dont les variations caractéristiques se présentent en cycles ou plus courts ou plus longs que le lustre ou le décennat, et souvent irréguliers. La représentation que de telles moyennes nous donnent nous dissimulera donc le trait essentiel de l’élément étudié, au lieu de le mettre en évidence, et elle ne peut que nous égarer. — Et combien d’autres exemples pourraient s’ajouter à ces quelques indications !

Elles suffiront toutefois à nous faire apercevoir, d’abord, où doit être reconnue la vraie différence, à ce point de vue, entre l’expérience ordinaire des sciences positives et l’expérience statistique, et ensuite où nous pouvons chercher un remède à l’infériorité de celle-ci à ce même point de vue.


La différence entre les deux sortes de recherches n’est pas que l’une opère sur des réalités et l’autre sur des abstractions, mais que, dans l’expérimentation matérielle des sciences positives, l’abstraction mauvaise, sans correspondance suffisante avec la réalité, sans fondement objectif, s’avère le plus souvent aussitôt telle par une évidence physique, matérielle ; en recherche statistique, au contraire, des chiffres comme tels ne refusent jamais d’être combinés avec d’autres chiffres, la correspondance ou la non-correspondance avec quelque réalité objective n’est pas ici, en général, un fait qui, comme on dit, « saute aux yeux ».

Dans l’expérience matérielle, le savant isole bien, au milieu de la complexité présentée par la nature, certains éléments en relation reconnue ou soupçonnée avec de certains autres ; mais, s’il se trompe sur la relation, s’il oublie quelque élément essentiel, il est bien obligé de s’en apercevoir, parce que, matériellement, le phénomène attendu ne se produit plus. — Ici, au contraire, le statisticien isole bien aussi, dans le donné complexe, certains éléments d’avec d’autres qu’il soupçonne d’être en relation avec eux : mais c’est par une opération de l’esprit ; il ne dispose presque jamais d’expérience factice ; il ne retire ou n’introduit pas matériellement quelque facteur. Et, par suite, la réalité ou la non-réalité de la relation aperçue ne peut se manifester à lui de façon matérielle.

Plus même, on peut voir que l’on touche ici à un risque de cercle vicieux ; c’est que souvent l’expression statistique est nécessaire pour dégager et, on peut dire même, pour constituer le fait statistique, et que pourtant il faudrait savoir déjà d’avance quel est, comment se comporte au juste ce fait statistique, pour choisir avec pleine convenance la base et la nature d’expression statistique à employer.

Mais nous apercevons, en même temps, comment la recherche statistique peut se rapprocher des conditions par lesquelles l’expérimentation physique distingue l’abstraction bonne de l’abstraction mauvaise. Les quelques exemples confrontés plus haut nous font ressortir que, pour avoir quelque correspondance avec une réalité, la première condition est que nos expressions statistiques soient établies sur une base présentant une certaine homogénéité, ou encore sur une base ayant une extension appropriée, une extension opportune.

Sans doute, il est bien clair que les cas individuels embrassés dans une donnée statistique présentent toujours une hétérogénéité plus ou moins grande et plus ou moins complexe (sans quoi il n’y aurait pas besoin d’expression statistique pour les représenter d’ensemble) et que l’homogénéité ne peut donc être que relative ; que l’extension opportune aussi variera, non seulement selon les données, mais selon les problèmes, et ne sera également que relative. Mais l’exemple de l’expérimentation des sciences positives nous montre que le choix des abstractions statistiques à adopter ne sera pas pour cela arbitraire, s’il veut être fondé.

Nous ne pouvons compter ici sur des évidences matérielles : tâchons donc de nous garder par des précautions intellectuelles. Procédons par tâtonnements, par essais, par épreuves, contre-épreuves, recoupements.

Justement parce qu’il y a de bonnes et de mauvaises moyennes, des moyennes qui ont un sens et d’autres qui n’en ont aucun, défions-nous des moyennes : contrôlons, recoupons les indications de moyennes d’un type par celles d’un autre type, par d’autres indices, par des données complémentaires ; et ne retenons que celles qui, après ces épreuves, nous apparaissent avoir une consistance véritable et répondre à quelque réalité collective.

Et de même pour les autres modes d’expression statistique. Aujourd’hui, par exemple, en raison du mouvement considérable des prix et de ses conséquences, qui ne parle, qui ne raisonne, qui ne discute des « index numbers » ? Qui n’en tire preuve et argument pour les thèses les plus diverses et parfois les plus opposées ? — Mais, avant un tel usage, combien de personnes se sont avisées ou souciées de savoir comment ces index numbers sont établis, sur quelles bases, par quelles méthodes, ce qu’ils signifient, ce qu’ils ne signifient pas ? M. Irving Fisher[1] a signalé que pour représenter un ensemble de prix ou de quantités, il peut être établi un nombre indéfini de formules de nombres indices, qui sont loin d’avoir le même sens ou les mêmes usages ; il s’est borné, du point de vue de son étude, à dégager seulement quarante-quatre de ces formules possibles, en indiquant les caractéristiques de chacune par rapport à telle ou telle condition. Stanley Jevons[2] avait employé une moyenne géométrique pour de certaines raisons et pour un certain problème. M. Wesley C. Mitchell[3] a employé, par contre, pour de certaines raisons autres et également avec succès pour le problème étudié par lui, une médiane, accompagnée des quartiles et déciles. Les divers index numbers les plus souvent cités et invoqués aujourd’hui sont établis souvent dans des conditions et sur des bases assez différentes. — Tout cela est-il sans importance ? Ou, au contraire, tout cela n’est-il pas à considérer, selon les questions étudiées, et en vue même des conclusions qu’on cherche à en tirer ? Ou encore, justement à cause de ces différences, ne sont-ils pas à utiliser en complément réciproque ou en recoupement utile, pour telles ou telles questions, et pour faire apparaître les limites de leur valeur et de leur légitime emploi ?

En un mot, nous avons pris d’abord telle base, tel cadre pour nos expressions statistiques et notre étude : avant de nous satisfaire des relations aperçues dans ce cadre et sur ces expressions, modifions le cadre, essayons d’autres expressions. Si le résultat se maintient ou bien si le résultat disparaît, voilà réalisée par des opérations intellectuelles, cette épreuve qui, dans l’expérience ordinaire des sciences positives, se réalise par une présence ou une absence matérielle du fait considéré.

C’est seulement après ces tâtonnements, après ces épreuves, — et en considération tant de l’ordre de faits envisagé, que de la nature des sources à notre disposition et des problèmes dont nous nous proposons l’étude, — que nous pourrons reconnaître avec fondement les bases et les types d’expressions statistiques, les limites de temps, d’espace, les catégories de faits ou d’objets, ou, autrement dit, les modes et les cadres d’abstraction que nous devrons adopter de préférence, pour avoir le plus de chances d’éliminer les traits particuliers ou secondaires et de mettre, au contraire, en évidence, en juste valeur, dans une présentation adéquate à la fois à l’objet et au problème, le ou les traits qui correspondent le mieux et à la réalité proposée et à l’étude entreprise.

Et, sans que je puisse détailler ici toutes les précautions appropriées à cette fin, c’est ainsi que, nous mettant dans les conditions les plus propres à nous conduire à l’établissement de relations probantes, nous nous mettons par là même en situation de réaliser également ici, entre la bonne et la mauvaise abstraction, cette discrimination par les résultats, par le succès, dont nous avons rappelé le rôle dans les sciences de la nature.

Ce premier ensemble de précautions suffit-il à bien fonder une preuve statistique expérimentale ?

  1. I. Fisher, The purchasing power of money, New-York, Macmillan, 1912. Chap. x et appendice au chap. x. (Traduction française, Giard, 1921.)
  2. W. Stanley Jevons, Investigations in currency a. finance, London, Macmillan. Essai III.
  3. Wesley C. Mitchell, Gold, prices a. wages under the greenback standard, Berkeley, Univ. press, 1908.