Leçons sur l’intégration et la recherche des fonctions primitives (seconde édition)/Chapitre XI



CHAPITRE XI.

L’INTÉGRALE DE STIELTJÈS.


En 1894, Stieltjès, à l’occasion de recherches relatives à des développements en fractions continues[1], a défini un nouveau mode d’intégration des fonctions continues. Il importe de bien comprendre l’originalité de la généralisation de Stieltjès et en quoi elle diffère profondément de celles que nous avons examinées jusqu’ici. Au Chapitre I, nous avions rappelé ce qu’on appelle l’intégration dans les cours élémentaires de calcul infinitésimal ; c’est une opération bien déterminée faisant correspondre un nombre à chaque fonction continue . Aux Chapitres II, III, VI, VIIX nous avons défini cette opération pour des familles de fonctions de plus en plus larges ; nous avons étendu la notion d’intégration en profondeur dans la mine des fonctions . Stieltjès, lui, laisse invariable la famille de fonctions considérées ; mais, pour la même fonction , il définit autant d’intégrations que l’on veut ; chacune d’elles fait correspondre un nombre à . Il étend la notion d’intégration en surface dans le champ des opérations fonctionnelles.

Dans ce Chapitre, nous donnerons la définition de l’intégrale de Stieltjès d’une fonction continue , ce qui est l’analogue du Chapitre I, puis nous devrions, comme aux Chapitres II, III, VI, VIIX, étendre cette notion à des classes de fonctions de plus en plus larges, enfin nous aurions à examiner, comme aux Chapitres IV, V, VIIIIX, des notions et des problèmes liés à la nouvelle intégrale. L’exécution de ce programme supposerait effectuées des recherches qui n’ont même pas encore été abordées ; sur bien des points nous nous contenterons de poser des problèmes.


I. — L’intégration de Stieltjès définie à l’aide de la théorie des fonctions sommables.

Soit une fonction à variation bornée dans un intervalle  ; nous l’appellerons la fonction déterminante de l’intégration qui va être définie.

étant une fonction continue dans , nous appelons intégrale de Stieltjès de , prise dans par rapport à la fonction déterminante , la limite de la somme

,

relative à une division de faite à l’aide de valeurs se succédant dans l’ordre : , , , …, , quand on fait croître indéfiniment le nombre et que l’on choisit les de façon que le maximum de tende vers zéro. désigne une valeur quelconque de prise dans .

Pour justifier cette dénomination, il faut, prouver que la limite existe. Considérons une suite de divisions de , soit , , …, obtenues chacune par subdivision des intervalles de la division précédente, et soient , , … les valeurs de fournies par ces divisions et certains choix des .

Soit la contribution dans d’un des intervalles de . Dans l’intervalle se trouve divisé par des points et fournit une contribution de la forme

,

la sommation étant étendue à certaines valeurs de . Or, avec les mêmes valeurs de , on a

.

La différence entre les deux contributions de est donc

désignant l’oscillation de dans et la variation totale de dans le même intervalle.

D’où, par addition,

,

étant la variation totale de dans et le maximum de l’oscillation de dans les intervalles de la division . Or tend vers zéro quand augmente indéfiniment, par hypothèse, donc la suite des est convergente.

Le cas particulier des suites , , …, obtenues par subdivisions successives, ainsi examiné, on passe au cas général par le raisonnement qui nous a tant de fois servi.

L’intégrale que nous venons de considérer est l’intégrale définie, elle se note

.

Elle jouit évidemment des propriétés

,
,
.

Pour cette intégrale, le théorème de la moyenne s’énonce ainsi : Si l’on a

,

il en résulte

,

étant la variation totale de dans .

Toutes ces propriétés résultent de suite de l’examen des sommes .

La fonction

est dite la fonction d’une variable intégrale indéfinie, au sens de Stieltjès, de prise par rapport à . Cette définition s’applique pour , nous compléterons tout à l’heure la définition pour .

L’intégrale indéfinie est une fonction à variation bornée. Représentons par la variation totale de de à on a ;

,

désignant la limite supérieure du module de dans . Donc si l’on partage en un nombre fini d’intervalles on a

.

Cette inégalité démontre la proposition et donne la limite supérieure pour la variation totale de l’intégrale indéfinie.

Lorsque la fonction déterminante est continue, l’intégrale indéfinie est continue. En effet, dans ce cas, tend vers zéro avec la longueur de  ; donc il en est de même de .

D’une façon plus générale, l’intégrale indéfinie est continue en tout point de continuité de . Mais elle est discontinue en si est différent de zéro et si admet pour point de discontinuité. En effet, étant supposé différent de , soient et deux fonctions définies comme il suit :

pour ,

, ;

en ,

, ;

pour

, .

et sont deux fonctions à variations bornées dont la somme est . L’intégrale indéfinie , relative à , est donc la somme de celles relatives à et  ; soient et . Or est continue en , car est continue en et est évidemment égale à

une constante , pour  ;
, pour»  ;
, pour» .

Donc est discontinue en , et par suite aussi , si est différent de zéro. En même temps, nous avons prouvé que : Si l’on désigne par et les sauts de gauche et de droite de au point , la fonction des sauts de l’intégrale indéfinie de , prise par rapport à , est

,

les sommations étant étendues à toutes les valeurs indiquées par les inégalités, ou, ce qui est équivalent, à toutes celles de ces valeurs qui sont des points de discontinuité de . Toutefois, c’est par une convention nouvelle, complétant la définition de l’intégrale indéfinie, que nous avons fait figurer le point dans la première sommation.

Par suite aussi, l’intégrale corrigée de sa fonction des sauts, , est l’intégrale indéfinie, au sens de Stieltjès, par rapport à la fonction déterminante obtenue en corrigeant de sa fonction des sauts

.

Les intégrales de Stieltjès relatives à des fonctions déterminantes discontinues, se calculent donc facilement à partir de celles résultant des fonctions déterminantes continues. Celles-ci, dans les cas usuels, se calculent de suite.

Supposons, par exemple, continue et croissante, au sens strict, pour  ; le changement de variable transforme en une fonction et la définition de en celle de l’intégrale ordinaire de . Ainsi

,

et l’on est ramené à une intégration ordinaire de fonction continue. C’est d’ailleurs la formule précédente qui est l’origine même de la notation de l’intégrale de Stieltjès.

Le cas général où est continue se ramène à celui-ci.

Soient et les deux variations totales positive et négative de , les deux fonctions

,

sont croissantes au sens strict, et l’on a

.

Si donc on pose

,

on en déduit

.

Enfin, le cas le plus général se traite de même : et étant formées à l’aide des variations totales de corrigée de sa fonction des sauts, on a, avec les notations précédentes,

Toute intégrale de Stieltjès s’exprime donc à l’aide d’intégrales ordinaires. Avant de tirer des conséquences de ce fait essentiel, donnons d’autres formules équivalentes à la précédente. Celle-ci présente l’avantage de ne faire appel à l’intégration que sous sa forme la plus primitive : intégrale d’une fonction continue dans un intervalle ; par contre elle exige deux intégrales, l’emploi des séries et des changements de variables.

Supposons que soit continue, croissante au sens strict, et à dérivée continue ; alors aucun changement de variable n’est nécessaire car on a

,

en revenant de la variable à la variable par la formule classique du changement de variable[2]. En somme, nous traitons ici l’intégrale de Stieltjès en remarquant qu’elle se réduit à l’intégrale curviligne , attachée à la courbe .

La formule précédente s’étend au cas où est seulement supposée absolument continue ; désignons alors par la fonction, déterminée seulement aux points d’un ensemble de mesure nulle près, dont est l’intégrale indéfinie ; fonction qu’on pourrait appeler la presque dérivée de . On a

.

Donc

.

Il en résulte, désignant le maximum de l’oscillation de dans les intervalles et représentant toujours la variation totale de dans ,

.

D’où, par passage à la limite,

.

Lorsque la fonction à variation bornée est simplement supposée continue, un changement de variable suffit pour nous ramener au cas précédent ; il est clair en effet que si l’on a un changement de variable uniforme dans les deux sens faisant correspondre à , on a toujours

.

Il suffit de choisir de manière que soit absolument continue en pour pouvoir appliquer la formule précédente. Cette variable pourrait être la longueur de la courbe , depuis jusqu’à  ; il est plus simple ici de prendre[3]

,

étant, comme précédemment, la variation totale de de à . Alors on a, en posant ,

.

Si était continue et variable dans tout intervalle on pourrait poser et l’on aurait

.

Nous allons étendre cette formule à tous les cas : posons pour cela les définitions suivantes :

désignant la variation totale, de à , de la fonction déterminante , à toute valeur comprise entre 0 et , il correspond :

a. Soit une ou plusieurs valeurs de telles que l’on ait , nous choisissons alors l’une de ces valeurs et nous posons

,,

b. Soit une valeur , telle que l’on ait

ou ;

nous posons alors et, dans le premier cas

,

dans le second

,

Avec ces conventions, on a

.

Pour justifier cet énoncé, partageons en intervalles partiels dans chacun desquels l’oscillation de est inférieure à . Dans chaque intervalle choisissons arbitrairement une valeur et posons

,.

Alors on a

Le théorème résulte de suite du rapprochement de ces deux inégalités.

La fonction a, dans , une variation totale égale à  ; a donc presque partout une dérivée égale à ±1 et par suite on peut supposer partout égale à ±1. Cela rend la formule précédente particulièrement simple ; mais, pour ce qui suit, les formules plus compliquées obtenues auparavant conviendraient aussi fort bien ; c’est surtout pour fixer les idées que nous partirons d’une formule bien déterminée de réduction des intégrales de Stieltjès aux intégrales ordinaires ; nous utiliserons la dernière formule établie. Elle exige que soit connue la théorie des fonctions sommables ; mais, dès que cette théorie est connue, le second membre de notre formule a un sens pour des cas beaucoup plus étendus que celui examiné jusqu’ici, où était continue. Et par suite nous pouvons prendre la formule

comme définition même de l’intégrale de Stieltjès de .

Cette définition s’appliquera, en n’utilisant pour le moment que l’intégration des fonctions sommables, toutes les fois que sera sommable, donc pour toutes les fonctions qui sont sommables, puisque , c’est-à-dire pour toutes les fonctions qui sont sommables quand on prend pour variable la variation totale de entre à , et en particulier pour toutes les fonctions bornées qui sont mesurables par rapport à .

Or, parmi les fonctions qui sont mesurables par rapport à , il faut citer toutes les fonctions qui sont mesurables B par rapport à . En effet, la formule fait correspondre à tout intervalle en un intervalle en ou un point, à une somme d’ensembles en , une somme d’ensembles en , à une différence d’ensembles en une différence d’ensembles en plus parfois certaines des valeurs de correspondant aux intervalles de constance de  ; et comme ces valeurs sont en nombre fini ou dénombrables, à tout ensemble mesurable B en correspond un ensemble mesurable B en . Si donc est mesurable B en , c’est-à-dire si l’ensemble est mesurable B, l’ensemble l’est aussi et est mesurable B en .

Donc la définition précédente s’applique à une classe de fonctions , variable avec la fonction déterminante , mais qui contient toujours la famille des fonctions bornées et mesurables B.

L’inconvénient de la méthode si rapide qui nous a donné ce résultat c’est qu’elle ne met nullement en évidence l’intérêt que peut présenter l’extension de la notion d’intégrale de Stieltjès. Un théorème de M. Frédéric Riesz mettra cet intérêt en évidence[4].


II. — Les fonctionnelles linéaires.

Nul, depuis Stieltjès, ne s’était occupé de l’intégration d’une fonction par rapport à une fonction quand, en 1909, M. F. Riesz nous révéla que pourtant cette notion avait été l’objet d’assez nombreuses recherches mais sous un autre nom, sous le nom d’opération fonctionnelle linéaire.

Une opération fonctionnelle linéaire est celle qui associe à chaque fonction , appartenant à une certaine classe de fonctions, un nombre tel que l’on ait :

1o

 ;

2o

,

étant un nombre fixe.

La fonctionnelle[5] fournie par l’opération linéaire est dite elle-même linéaire.

Ce sont surtout des questions de physique mathématique qui ont conduit à la notion de fonctionnelle linéaire ; la classe de fonctions qui se présentait alors, variable avec les questions, contenait toujours les fonctions continues mais aussi souvent divers types de fonctions discontinues. De sorte que le problème de l’extension du champ d’application des opérations fonctionnelles linéaires était virtuellement posé. Or cette extension sera acquise grâce à la généralisation précédente de la notion d’intégrale de Stieltjès et au théorème de M. Riesz.

Parmi les fonctionnelles linéaires définies dans le champ des fonctions continues se trouvent celles de la forme

 ;

aussi s’est-on adressé à des expressions de cette forme quand on a essayé de construire la fonctionnelle linéaire la plus générale ; M. Hadamard et M. Fréchet avaient obtenu dans cette direction des résultats fort intéressants ; mais il était réservé à M. Riesz de résoudre complètement la question en montrant que toute fonctionnelle linéaire définie pour toutes les fonctions continues dans est de la forme  ; étant une fonction à variation bornée qui caractérise la fonctionnelle[6].

Soit une fonctionnelle linéaire définie dans le champ des fonctions continues de à [7]. L’égalité

a donc lieu dans  ; il existe deux cas importants où l’on peut même supposer les fonctions en nombre infini. C’est d’une part, le cas où la série des converge uniformément, d’autre part le cas où tous les , à partir d’une certaine valeur de , sont de même signe.

Supposons, en effet, que la série des converge uniformément ; si est sa limite et la somme de ses premiers termes, on a, pour suffisamment grand , d’où

.

Le premier cas est ainsi examiné ; or le second se ramène au premier, car si les sont toutes positives ou nulles et si la somme de la série des appartient au champ , l’ensemble des points où l’on a est un ensemble fermé lorsqu’il existe, et comme contient , et qu’il n’y a pas de point commun à tous les , l’ensemble n’existe plus dès que est assez grand. Donc la série des converge uniformément.

Examinons maintenant le cas où l’on sait seulement que les sont positifs ou nuls, et que la série des converge vers une fonction bornée [8]. Alors on a, en remarquant que et sont égaux et de signes contraires, et en posant et du signe de ,

Ainsi, lorsqu’une suite non décroissante ou non croissante de fonctions de tend vers une limite bornée, la suite converge.

Une autre propriété nous sera utile : si est une fonction de et si est une constante, on a

.

Cette propriété est évidente pour entier ou inverse d’un entier ; on arrive ensuite à commensurable, puis enfin on atteint quelconque par un passage à la limite uniforme.

Ceci posé, posons et, pour , prenons égale à la limite des pour la suite décroissante des fonctions continues égales à 1 de à , égales à 0 de à , linéaire de à .

Une fonction continue quelconque dans peut être approchée autant que l’on veut à l’aide d’une combinaison linéaire de fonction . Formons, en effet, la fonction

pour

 ;

elle est, dans chaque , comprise entre et lorsque est inférieur à la plus petite différence .

Si donc on a choisi les de manière que l’oscillation de soit, dans chaque , inférieure à , la différence est inférieure à dès que est assez grand. Et alors la différence sera inférieure à .

Or nous connaissons la limite de pour très grand ; elle s’écrit

ou encore

Et par suite est la limite de la somme précédente, c’est-à-dire que est l’intégrale de Stieltjès de , prise par rapport à . Le théorème de M. Riesz sera démontré, dès que l’on aura vérifié que est à variation bornée.

Or ceci est évident ; si n’était pas à variation bornée, elle aurait une variation positive égale à , on pourrait donc trouver des intervalles , , …, extérieurs les uns aux autres et en nombre fini tels que surpasse  ; étant toujours le nombre qui figure dans la seconde propriété des fonctionnelles linéaires. Dès lors, pour les fonctions continues , égales à 1 dans les , nulles dans les intervalles et linéaires dans les intervalles , , fonctions qui tendent en décroissant vers la fonction égale à 1 dans les et à 0 à l’extérieur, les nombres tendraient vers

 ;

ce qui est impossible, puisque ne peut surpasser .

Ce théorème de M. Riesz attache à chaque fonctionnelle linéaire, définie pour les fonctions continues dans un intervalle , une fonction déterminante et ce que nous avons vu, relativement à l’extension des intégrales de Stieltjès, montre qu’une telle fonctionnelle peut être prolongée au champ de toutes les fonctions qui, par le passage de la variable à la variation totale de dans , se transforment en fonctions sommables de . Cette famille est variable avec mais il importe de noter qu’elle contient toujours toutes les fonctions mesurables B et bornées.

Quand on emploie des fonctionnelles linéaires de fonctions continues , l’une des propriétés les plus utiles est celle-ci : la somme de deux fonctionnelles linéaires et est elle-même une fonctionnelle linéaire.

Quand on veut étendre le champ des fonctions et cependant conserver l’avantage de cette propriété, c’est donc à un champ fonctionnel indépendant de la fonction déterminante qu’il faut s’arrêter ; aussi est-il très intéressant de savoir que toutes les fonctionnelles linéaires définies dans le champ des fonctions continues peuvent être étendues au champ des fonctions mesurables B et bornées.

Il est clair que la fonctionnelle étendue au champ des fonctions mesurables B et bornées, telle que nous l’avons obtenue, y possède la propriété suivante :

3o Si des fonctions tendent en croissant vers une limite , on a

.

Nous allons vérifier que les propriétés 1o, 2o, et 3o suffisent à caractériser l’extension que nous avons faite au champ des fonctions mesurables B et bornées d’une fonctionnelle linéaire donnée, définie pour les fonctions continues.

Voyons, en effet, comment à partir des propriétés 1o, 2o et 3o nous pourrions prolonger à un champ plus vaste une fonctionnelle linéaire donnée dans le champ des fonctions continues.

Nous avons vu que, pour croissant indéfiniment les fonctions tendent en décroissant vers la fonction égale à 1 pour et à 0 pour  ; donc, d’après 1o et 3o, s’en déduit.

Posons, pour ,

.

De 1o se déduit la valeur .

La suite des fonctions tend en décroissant, quand augmente indéfiniment, vers une limite  ; donc la valeur de est déterminée par 1o et 3o.

Nous avons ainsi déterminé la valeur de pour certaines fonctions nulles en dehors d’un ensemble , égales à 1 sur  ; nous venons d’arriver aux fonctions pour lesquelles l’ensemble est un intervalle fermé. Or, à partir de tels intervalles on construit tout ensemble mesurable B par la répétition de deux opérations : additions d’ensembles sans points communs, soustraction d’un ensemble d’un autre qui le contient ; à la première de ces opérations

les conditions 1o et 3o font correspondre l’égalité

,

à la deuxième

,

la condition 1o fait correspondre

,

donc est définie pour chaque fonction relative à un ensemble mesurable B.

Si maintenant est une fonction mesurable B bornée quelconque, elle ne diffère que de au plus de la fonction

 ;

donc la suite des fonctions tend uniformément vers quand tend vers zéro et l’on déduit de 1o et de 2o, comme nous l’avons fait précédemment, que les nombres convergent vers une limite, que nous devons prendre pour valeur de .

Ainsi le prolongement à tout le champ des fonctions mesurables B et bornées, s’il est possible, est unique ; or nous avons vu qu’il était possible[9].

L’extension à ce large champ fonctionnel[10] est donc bien caractérisé par les conditions 1o, 2o et 3o.

Nous allons, grâce à la notion d’intégrale de Stieltjès, obtenir une autre extension. À toute intégration définie nous avons attaché une intégration indéfinie fournissant une fonction de points, une fonction d’intervalles, une fonction d’ensemble mesurable ; de sorte que la notion d’intégrale de Stieltjès conduit à une intégrale indéfinie de Stieltjès fonction de point, à une intégrale indéfinie de Stieltjès fonction d’intervalle, à une intégrale indéfinie de Stieltjès fonction d’ensemble. Cette dernière nous permet, d’associer à la fonction et à un ensemble un nombre déterminé

.

étant l’ensemble des valeurs de pour lesquelles appartient à . Voici donc définie l’intégrale de Stieltjès de prise par rapport à , et étendue à l’ensemble .

Cette intégrale est définie pour les ensembles pour lesquels est mesurable ; cette famille d’ensembles contient tous les ensembles mesurables B.

L’intégrale est définie pour toute fonction ayant une valeur déterminée aux points de et égale sur à une fonction pour laquelle est sommable dans . Donc en particulier cette définition s’applique à toute fonction bornée et mesurable B sur un ensemble mesurable B.

Or est évidemment une fonctionnelle linéaire dans le champ des fonctions données sur  ; donc, quand une fonctionnelle linéaire est définie pour les fonctions continues dans un intervalle , on en déduit une famille de fonctionnelles linéaires , attachées chacune à un ensemble mesurable B situé dans et définies pour les fonctions mesurables B bornées sur , par les conditions

1o

 ;

2o

,

étant un nombre fixe, inconnu, indépendant de et de  ;

3o Si tend en croissant vers sur , on a

 ;

4o Si est égale à sur et nulle ailleurs, on a

.

On peut être surpris de ce résultat car étant donnée, la fonction déterminante n’est pas unique. Il est bien clair, en effet, que si l’on modifie en un seul point intérieur à cela ne modifie par pour les fonctions continues dans , car on a

et pourtant cela modifie en général

Le paradoxe vient uniquement de ce que l’on n’a, pour , l’égalité

,

qu’avec les fonctions qui sont continues à droite en . Tel était le cas pour la fonction qui a été construite au cours de la démonstration du théorème de M. Riesz, on le vérifiera facilement ; mais avec cette fonction on n’a pas

,

quand est un point de discontinuité de .

La difficulté que l’on rencontre ici est la même que celle qui s’est présentée précédemment (p. 153). Pour chaque fonction , est une fonction d’ensemble complètement additive ; si donc on veut avoir

,

en appelant l’intégrale indéfinie , il faut que puisse être fonction génératrice d’une fonction additive d’ensemble et par suite soit, comme nous l’avons vu à l’endroit indiqué, une fonction continue à droite. Or le saut de droite de est, en , égal à , donc doit être continue à droite.

Pour tourner la difficulté qui se présente ainsi, lorsque l’on veut étendre aux ensembles mesurables une fonctionnelle connue dans un intervalle grâce à une fonction déterminée et non continue à droite, on peut décomposer en sa fonction des sauts et sa partie continue

 ;

donne alors naissance à une fonctionnelle de la forme

,

dont la définition s’applique de suite aux fonctions discontinues tout aussi bien qu’aux fonctions continues. Quant à l’extension de la fonctionnelle correspondant à , elle ne soulève plus aucune difficulté[11].


III. — Définition directe de l’intégrale de Stieltjès.

Cette étude des fonctionnelles linéaires fait mieux comprendre la signification des conditions 1I, 2I, …, 6I du problème d’intégration (page 105). Comparons ces conditions aux conditions 1F, 2F, 3F, 4F posées pour les fonctionnelles linéaires (page 269). 3I est identique à 1F ; 6I remplacera 3F ; 2I remplace 4F ; quant à 2F elle se trouve être une conséquence de 4I et 5I. Les conditions 1I, 4I, 5I ne servent qu’à caractériser la fonctionnelle relative aux fonctions continues dont il faut faire le prolongement. En somme, l’intégrale d’une fonction continue étant connue dans tout intervalle où la fonction est donnée, nous aurions pu, au Chapitre VII, nous borner à poser les conditions 1F, 2F, 3F et en déduire le prolongement de l’intégrale en raisonnant comme il y a un instant. Seulement, tandis que pour le prolongement de la fonctionnelle linéaire générale nous avons pu nous borner à prouver que le prolongement était unique, parce que le cas de l’intégrale avait été précédemment examiné, il faudrait maintenant vérifier directement que le prolongement est possible. C’est ce que nous allons faire en nous plaçant dans le cas de l’intégrale de Stieltjès la plus générale ; nous obtiendrons ainsi une définition directe de cette intégrale, d’où celle de l’intégrale ordinaire se déduira en faisant .

Mais, avant de rechercher une forme nouvelle de la définition de l’intégrale de Stieltjès, il convient de voir dans quel cas on peut employer sans modification la définition primitivement posée pour les fonctions continues.

Soit une fonction bornée dans et une fonction à variation bornée, nous formons, comme il a été dit, la somme

.

Si, dans , varie entre et , nous désignerons par et deux nombres définis par les conventions

, , si ,
, , si ,

et seront les bornes supérieure et inférieure de prises par rapport à . L’oscillation de , toujours dans l’intervalle considéré, sera

.

Ceci posé, si l’on fait varier les sans faire varier les , varie entre

et ;

nous allons montrer que ces sommes, pour une suite de divisions , , … en intervalles dont la longueur maximum tend vers zéro, tendent vers des limites déterminées

,,

— que nous appellerons les intégrales de Stieltjès-Darboux de , par excès et par défaut, — pourvu que tout point de discontinuité de soit point de la division , à partir d’une certaine valeur de .

Si , , sont les trois variations totales de ,

,,

on a

Or, pour les fonctions croissantes et , l’étude des sommes telles que est facile. Soit , , … une seconde suite de divisions assujettie aux mêmes conditions que la suite des  ; soient et les nombres fournis par et  ; nous voulons comparer la suite des et celle des .

Si est pris assez grand, étant fixe, dans chaque intervalle fourni par se trouve au plus un des points de si bien que si est l’un des intervalles fourni par , sera dans un intervalle de et dans  ; . Si (ou ) est point de discontinuité de , pour assez grand et seront confondus avec (ou et avec ) ; de sorte que nous ne supposerons (ou ) différent de zéro que si (ou ) est point de continuité de . Alors, remplaçons la contribution de dans par  ; comme diffère de la borne supérieure de dans d’aussi peu que l’on veut quand est pris suffisamment grand, — à cause de la petitesse de et de la continuité de au point , — on modifiera ainsi d’aussi peu que l’on voudra. Faisons cela pour chaque point de division de , nous aurons un nombre différent de de moins de . Si, entre et les points de sont , , … nous pouvons dire que la contribution de dans est de la forme

Or , , , …, sont au plus égaux à la borne supérieure de dans  ; la somme précédente est donc au plus égale à

.

c’est-à-dire à la contribution de dans . Donc on a

.

et par suite

,

dès que est assez grand. Il en résulte que les et les convergent vers une même limite.

Nous venons en somme de démontrer le théorème pour une fonction monotone et l’existence des limites

,,
,,

est prouvée.

En désignant par l’une quelconque des limites du nombre , nous pouvons donc écrire :

ou

.

La différence entre les membres extrêmes de ces inégalités est, d’après la façon même dont elle a été obtenue, la limite de

Or, on a

.

Comparons ces deux différences, on obtient

 ;

tous les sont au plus égaux à l’oscillation de dans , les sont positifs, donc cette quantité est au plus égale à

.

Mais on sait (p. 61) que dans les conditions ici considérées tend vers . De là résultent les relations suivantes :

 ; ;
 ;

donc on a

,.

Le théorème est démontré et l’on a pour les intégrales par excès et par défaut les expressions

Pour que nos énoncés se réduisent exactement à ceux du Chapitre II quand on fait , convenons d’appeler oscillation moyenne de dans , prise par rapport à , la limite du rapport

,

c’est-à-dire le nombre

 ;

alors la condition nécessaire et suffisante pour que les sommes tendent[12] vers une limite déterminée, que nous appellerons l’intégrale de Stieltjès-Riemann de prise par rapport à , est que ait une oscillation moyenne, prise par rapport à , nulle dans l’intervalle considéré. Du fait que la convergence de vers zéro est la condition d’intégrabilité, on déduit de suite, comme au Chapitre II, que la condition nécessaire et suffisante pour que soit intégrable, au sens de Stieltjès-Riemann, par rapport à , est que l’ensemble des points en lesquels a une discontinuité au moins égale à , soit, quel que soit , un groupe intégrable par rapport à . En entendant par groupe intégrable par rapport à , tout ensemble de points qui peut être enfermé à l’intérieur[13] d’intervalles en nombre fini fournissant une somme d’accroissements de la variation totale aussi petite que l’on veut. Le mot intérieur est indispensable si est discontinue ; alors un ensemble réduit à un seul point n’est pas toujours un groupe intégrable. En effet, si est point de discontinuité de , il n’existe pas d’intervalle contenant à son intérieur et pour lequel soit inférieur à . Ainsi les groupes intégrables par rapport à sont formés de points de continuité de  ; une fonction ne peut être intégrable, au sens de Stieltjès-Riemann, par rapport à que si elle est continue en tous les points de discontinuité de . Par contre une fonction peut avoir une intégrale de Stieltjès-Riemann et admettre cependant tous les points d’un intervalle pour points de discontinuité. Il suffit que cet intervalle soit un groupe intégrable par rapport à , c’est-à-dire qu’il suffit que soit constante dans cet intervalle. On voit combien la nature des groupes intégrables varie quand varie . En utilisant la théorie de la mesure qui va être développée, le lecteur démontrera facilement, comme au Chapitre II, que la condition nécessaire et suffisante pour qu’une fonction ait une intégrale de Stieltjès-Riemann c’est que l’ensemble de ses points de discontinuité ait, par rapport à la fonction déterminante , une mesure nulle. N’étudions pas plus longuement la définition primitive de l’intégrale de Stieltjès et, pour préparer une définition plus large de cette intégrale, définissons la mesure d’un ensemble, prise par rapport à une fonction à variation bornée. Nous convenons que la mesure de l’intervalle fermé est

,

que la mesure d’un point est

 ;

de là on déduit la mesure d’un intervalle ouvert ou à demi ouvert en soustrayant de la mesure d’un intervalle fermé la mesure de l’un ou de l’autre ou de ses deux points extrêmes.

Il est évident que cette fonction d’intervalles est complètement additive ; il lui correspond donc (p. 167), une fonction d’ensemble complètement additive et définie en particulier pour tous les ensembles mesurables B. Nous allons compléter ce résultat.

Rappelons que les ensembles pour lesquels nous avons défini la fonction , que nous noterons ici , sont ceux qui sont transformés en ensembles mesurables par rapport à grâce au changement de variable

 ;

désignant toujours la variation totale de de à  ; ce changement de variable étant interprété comme il a été expliqué à la page 168.

Dire que est mesurable, c’est dire qu’on peut l’enfermer dans un ensemble d’intervalles ouverts, et qu’on peut enfermer son complémentaire dans un ensemble d’intervalles ouverts tels que la longueur des parties communes à et soit , aussi petit que l’on veut. À et correspondent des ensembles et d’intervalles enfermant et son complémentaire , si l’on a eu soin de choisir les intervalles constituant et de façon qu’aucun d’eux n’ait une extrémité à l’intérieur d’un intervalle correspondant à un point singulier de  ; ce qui est possible puisque ces intervalles sont, chacun, tout entiers dans ou [14]. Dans chaque intervalle de l’axe des on a

,.

De la première inégalité nous avons déjà déduit que était mesurable, car elle entraîne , la sommation étant étendue aux intervalles communs à et . La seconde nous donne et nous montre que les sont mesurables par rapport à en convenant que : un ensemble est dit mesurable par rapport à s’il peut être enfermé dans une infinité d’intervalles ouverts et si l’on peut enfermer le complémentaire de dans une infinité d’intervalles ouverts , tels que la somme , étendue aux intervalles communs à et , soit aussi petite que l’on veut.

Ainsi nous avons défini pour des ensembles qui sont à la fois mesurables au sens ordinaire et mesurables par rapport à [15] ; si nous nous arrêtions là, la mesurabilité au sens ordinaire jouerait un rôle à part. Nous ne généraliserons complètement la théorie de la mesure qu’en définissant la mesure par rapport à pour tous les ensembles mesurables par rapport à , sans exiger de plus qu’ils soient mesurables au sens ordinaire. C’est ce que nous allons faire maintenant[16].

Le problème de la mesure que nous avons résolu au Chapitre VII peut être énoncé comme il suit.

Trouver une fonction d’ensemble qui soit :

1o Positive ou nulle ;

2o Complètement additive ;

3o Qui, pour les intervalles ouverts et fermés, se réduise à la mesure connue de ces intervalles.

Lorsqu’il s’agit de la mesure par rapport à une fonction non décroissante, on peut conserver exactement cet énoncé. Alors on définit la mesure extérieure de par la limite inférieure des sommes relatives aux ensembles d’intervalles enfermant . La mesure de diminuée de la mesure extérieure du complémentaire de donne la mesure intérieure de . On voit de suite que la première de ces mesures est au moins égale à la seconde ; ces deux mesures sont égales pour les ensembles mesurables par rapport à et seulement pour eux. Bref pour non décroissante, la théorie de la mesure par rapport à se construit identiquement comme celle de la mesure ordinaire, c’est-à-dire de la mesure pour .

Mais si est seulement à variation bornée, la condition 1o ne peut être conservée puisqu’elle n’est même plus vérifiée pour tous les intervalles. Nous la remplacerons par la suivante :

1′ La mesure d’un ensemble par rapport à une fonction non décroissante est positive ou nulle.

La mesure d’un ensemble par rapport à est au plus égale en valeur absolue à la mesure du même ensemble par rapport à la variation totale de .

Si est un ensemble, enfermons-le dans des suites , , … d’ensembles d’intervalles ouverts tels que les sommes , , … correspondantes tendent vers la plus petite valeur possible. Soit l’ensemble commun à et  ; comme enferme il fournit une somme telle que , tendent vers zéro quand et augmentent indéfiniment tous deux. Or les trois ensembles , , fournissent des sommes d’accroissements de telles que l’on ait

Donc les nombres convergent quand augmente indéfiniment ; leur limite est ce qu’on appelle la mesure extérieure, par rapport à de . La mesure intérieure de est la mesure de diminuée de celle du complémentaire de .

Or supposons mesurable par rapport à et enfermons dans une suite d’ensembles d’intervalles — les ensembles , fournissant des sommes et — tels que les parties communes à et fournissent une somme tendant vers zéro quand croît. Alors la somme fournie par ces parties communes tend a fortiori vers zéro et comme l’on a évidemment

,

il en résulte

,

c’est-à-dire

.

Ainsi les mesures extérieure et intérieure, par rapport à , d’un ensemble mesurable par rapport à sont égales. Leur valeur commune est la mesure de l’ensemble, prise par rapport avec .

Pour démontrer ce dernier point, remarquons que l’ensemble , étant enfermé dans les parties communes à et a pour mesure par rapport à au plus . A fortiori on a

 ;

d’où l’on tire

.

Ayant ainsi trouvé le seul nombre qui puisse satisfaire aux conditions du problème de la mesure, il resterait à vérifier qu’il y satisfait effectivement. Pour abréger, et pour revenir à des considérations antérieures, tirons cela de la correspondance entre ensembles situés sur et ensembles de qui nous a déjà servi[17] ; correspondance dans laquelle à tout point de on associe l’intervalle de . À tout intervalle correspond alors un intervalle dont la longueur est la mesure de par rapport à . Dès lors les ensembles mesurables par rapport à sont ceux qui fournissent des ensembles mesurables au sens ordinaire et l’on a pour eux,

.

Comme les ensembles mesurables par rapport à et par rapport à sont, par définition, les mêmes, nous savons quels sont les ensembles mesurables par rapport à .

De plus, la mesure par rapport à d’un intervalle est , c’est-à-dire l’accroissement subi par la fonction , dans l’intervalle transformé de . Donc la mesure qui vient d’être définie n’est pas différente de la fonction complètement additive de l’ensemble déterminée sur par la fonction absolument continue  ; les définitions mêmes de ces deux fonctions sont identiques. Ainsi on a

 ;

ce qui permet d’énoncer toutes les propriétés de la mesure à partir de celles connues des intégrales de fonctions sommables. Bornons-nous à cette indication et passons à l’extension de la notion d’intégrale.

Le problème d’intégration que nous avons résolu au Chapitre VII peut être énoncé ainsi :

Attacher à toute fonction définie dans un nombre tel que

1o

 ;

2o

,

2o lorsque la série , est uniformément convergente ;

3o et lorsque cette série est convergente et à termes positifs ;

4o  se réduit à l’intégrale connue de lorsque est continue ;

5o  si ne diffère de qu’aux points d’un ensemble de mesure nulle.

Nous conserverons cet énoncé pour le prolongement de l’intégrale de Stieltjès ; seulement, l’intégrale et la mesure dont il est parlé aux nos 4o et 5o seront maintenant l’intégrale et la mesure par rapport à .

Il nous suffit pour traiter ce problème de reprendre, légèrement modifiés à cause de la condition 5o, les raisonnements utilisés pour le prolongement d’une fonctionnelle linéaire, page 267, et nous retomberons sur les mêmes considérations qu’au Chapitre VII.

Considérons une fonction ne prenant que les valeurs 0 et 1. Si est un intervalle , est la limite de la suite décroissante des fonctions continues égales à 1 dans , nulles en dehors de , linéaires dans , . De 1o et de 3o il résulte que est la limite de , nombre qui, étant l’intégrale de Stieltjès de la fonction continue , diffère de moins en moins de c’est-à-dire de . On a donc

,

lorsque est un intervalle. Par l’addition de telles fonctions et l’application de la condition 3o, on voit qu’on a la même égalité lorsque est un ensemble d’intervalles. Supposons maintenant que soit un ensemble mesurable par rapport à et enfermons cet ensemble dans des ensembles d’intervalles fournissant des sommes tendant vers la plus petite limite possible ; nous pourrons supposer d’ailleurs que chacun de ces ensembles d’intervalles contient les suivants. À ces ensembles d’intervalles correspondent des fonctions , , …, ne prenant que les valeurs 0 et 1, et telles que ces ensembles se notent , , …. Soit la fonction vers laquelle tendent en décroissant les fonctions . On a, d’après 3o,

et, d’après 5o,

,

d’où encore

.

Soit maintenant une fonction bornée et mesurable par rapport à , c’est-à-dire telle que tous les ensembles soient mesurables par rapport à .

Soit un intervalle contenant à son intérieur l’intervalle de variation de  ; partageons cet intervalle à l’aide des nombres

,

supposons que ne soit jamais supérieur à .

Désignons par (), la fonction égale à 1 quand appartient à et nulle ailleurs. Puisque nous connaissons , des conditions 1 et 2 résulte , pour la fonction

.

Or tend uniformément vers quand tend vers zéro, puisque l’on a

,

donc, d’après 2o,

.

L’intégrale d’une fonction bornée est obtenue.

Si est encore supposée mesurable par rapport à mais n’est plus nécessairement supposée bornée, les seront pris échelonnés de à et distants les uns des autres de au plus. Alors on voit de suite que si la série infinie dans les deux sens

est absolument convergente pour un choix des elle le sera pour tout choix des et quel que soit . La fonction est dite alors sommable par rapport à . Du no 3o il résulte que, pour une telle fonction, on a encore

 ;

ce que l’on peut écrire encore

.

L’intégrale, par rapport à , d’une fonction sommable, par rapport à , est ainsi définie dans tous les cas exactement comme dans le cas particulier .

Il serait facile de démontrer directement, par des raisonnements entièrement analogues à ceux du Chapitre VII, que cette définition fournit un nombre déterminé, que ce nombre vérifie bien les conditions de notre problème et d’en trouver les principales propriétés. Mais nous allons faire tout cela d’un seul coup en prouvant quel est identique à l’intégrale de définie page 261. Nous utiliserons les fonctions et qui nous ont alors servi.

L’expression précédemment obtenue de la mesure d’un ensemble, par rapport à , nous donne

 ;

étant le transformé sur de .

De là on déduit, en utilisant les propriétés des intégrales ordinaires de fonctions sommables,

La définition que nous venons de donner, et qui est due à M. Radon, est donc équivalente à celle de la page 261 et celle-ci nous dispense de toute étude directe des propriétés de l’intégrale de Stieltjès. Nous allons pourtant montrer, à titre d’exemple, comment se présente la généralisation de la notion de fonction absolument continue[18] ; mais, auparavant, examinons comment il se fait que les notions ensembles mesurables B, fonctions mesurables B soient indépendantes de la fonction déterminant les problèmes de mesure ou d’intégration dont on s’occupe, alors que les notions ensembles mesurables et fonctions mesurables varient avec .

C’est qu’il s’agit de notions de caractères entièrement différents ; M. Denjoy dirait que les premières sont descriptives et les secondes métriques. M. Borel avait introduit les ensembles B à l’occasion de la théorie de la mesure, et c’est de là que vient leur nom, mais il ne les a pas caractérisées par une propriété métrique : il indique quelles sont les opérations géométriques qui, effectuées à partir d’intervalles et de points, permettent d’obtenir ces ensembles. L’importance des fonctions mesurables B, en Analyse, vient surtout de ce que ces fonctions sont toutes celles qui rentrent dans la classification de M. Baire, toutes celles qui sont susceptibles d’une représentation analytique[19]. Ici, l’importance des ensembles et fonctions mesurables B vient, comme on a dû le remarquer, de ce que, pour eux, la mesure ou l’intégrale est déterminée par celles des conditions de nos problèmes qui se traduisent par des égalités, et sans qu’il soit nécessaire d’utiliser celles qui impliquent des inégalités ; c’est-à-dire à l’aide des conditions 2o, 3o (p. 278), des conditions 1o, 2o, 3o, 4o (p. 281). Or le champ de ces ensembles est si vaste qu’il a fallu de grands efforts pour construire quelques exemples d’ensembles ou fonctions non mesurables B ; c’est-à-dire qu’il n’y aurait aucun inconvénient pratique à se limiter à l’étude des ensembles et fonctions mesurables B.

Proposons-nous de caractériser les fonctions qui sont des intégrales indéfinies par rapport à une fonction à variation bornée , connue ; ces fonctions sont celles que l’on pourrait appeler fonctions absolument continues par rapport à .

Une première condition c’est que soit à variation bornée et ait en tout point des sauts de droite et de gauche proportionnels à ceux de , d’après l’expression de la fonction des sauts d’une intégrale donnée (p. 256) :

.

Cherchons les autres conditions : nous voulons avoir

pour une fonction inconnue . La fonction continue

est définie dans tout . Pour toute valeur telle que l’équation ait au moins une racine, on a

 ;

les seules valeurs de en lesquelles on n’a pas cette égalité sont donc celles pour lesquelles on a une inégalité de la forme

ou de la forme

.

Dans , est constant et égal à  ; est linéaire dans et et prend les valeurs , , pour , , . Donc est linéaire dans et et y subit les accroissements

,.

Il résulte de là que si l’on pose et si l’on convient de compléter la définition de de manière qu’elle soit partout continue et qu’elle soit linéaire dans les intervalles où elle n’était pas encore déterminée, on doit avoir . En d’autres termes doit être absolument continue en .

Montrons que cette condition jointe à la précédente, est suffisante. Supposons donc ces conditions vérifiées. Si est un point de discontinuité de , nous prendrons

ces deux expressions de sont bien d’accord à cause de la première condition.

Si est un point de continuité de pour lequel l’équation n’admet que la racine , nous prendrons

 ;

quantité finie puisque a été pris égal à +1 ou à −1.

Enfin aux points où n’est pas encore définie nous prendrons arbitrairement ; ces points correspondant en effet à une infinité dénombrable de valeurs de n’ont aucune influence sur une intégrale prise de 0 à .

Avec ce choix il est clair que l’on a

,

donc

.

Transformons la seconde condition trouvée ; pour cela remarquons que, dès que la première condition est remplie, on peut calculer aux points de discontinuité de donc dans les divers intervalles . Désignons par la fonction égale à dans les intervalles et nulle ailleurs. La fonction est sommable, car dans son intégrale est et dans elle est et la somme des valeurs absolues de toutes ces intégrales est bornée puisque a été supposée à variation bornée.

La fonction

peut donc être calculée dès que la première condition est remplie. Il est d’ailleurs clair d’après ce qui précède, que est la transformée de la fonction des sauts de .

étant absolument continue, il nous suffit d’exprimer que est aussi absolument continue. C’est-à-dire que si l’on forme la somme , étendue à un ensemble d’intervalles que l’on peut supposer n’ayant jamais ni leurs origines ni leurs extrémités dans les intervalles puisque est constante dans de tels intervalles, et que l’on peut supposer ouverts puisque est continue — dont la mesure totale est , tend vers zéro avec .

Mais puisque les n’ont ni leurs origines ni leurs extrémités dans les et que ce sont des intervalles ouverts ; ils sont les transformés d’ensembles d’intervalles ouverts de l’axe des et la somme à considérer est

.

est absolument continue,

tend vers zéro avec  ; donc il faut et il suffit que tende vers zéro.

Pour qu’une fonction soit une intégrale indéfinie par rapport à , il faut et il suffit :

1o Que soit à variation bornée ;

2o Qu’en tout point les sauts de droite et de gauche de soient proportionnels à ceux de  ;

3o Que la somme , étendue à un ensemble d’intervalles ouverts dont la mesure, par rapport à la variation totale de est égale à , tende vers zéro avec .

La réponse est bien plus simple s’il s’agit de savoir à quoi l’on peut reconnaître qu’une fonction d’ensemble mesurable B est une intégrale indéfinie par rapport à donnée. Rappelons-nous d’abord que, pour le calcul d’une telle intégrale indéfinie, on peut supprimer toutes les singularités inutiles de , c’est-à-dire remplacer par une fonction égale à en , en et en tous les points de continuité de et qui n’a en aucun point deux sauts de signes contraires. Supposons donc que n’ait plus que des singularités utiles.

Une intégrale indéfinie par rapport à est une fonction d’ensemble mesurable B :

1o Qui est complètement additive ;

2o Qui est nulle dans tout ensemble de mesure nulle par rapport à la variation totale de la fonction , supposée sans singularités inutiles,

et réciproquement.

La propriété énoncée des intégrales indéfinies n’est que la traduction du fait que, considérée comme attachée aux ensembles de , cette fonction d’ensemble est absolument continue. Examinons la réciproque.

À une fonction d’ensemble mesurable B, notre changement de variable fait correspondre une fonction d’ensemble mesurable B mais qui n’est pas définie pour tout ensemble mesurable B de . On sait, en effet, sa valeur dans un intervalle correspondant à un point singulier de mais on ne sait pas sa valeur dans un ensemble mesurable B contenu dans  ; convenons qu’on aura

Cette convention suffit à achever de déterminer pour tous les ensembles mesurables B de , car nous voulons que soit complètement additive.

étant nulle dans tout ensemble de mesure nulle par rapport à , est nulle dans tout ensemble de mesure nulle. Donc est une intégrale indéfinie, et, d’après la façon dont a été choisie à l’intérieur de chaque , la fonction, sommable par rapport à , dont est l’intégrale indéfinie, est constante dans  ; on a bien

,

pour une certaine fonction  ; la presque dérivée étant constante dans tout parce que n’a pas de singularité inutile.

La dernière forme que nous avons donnée, (p. 173), à la condition d’absolue continuité se généralise donc littéralement ; de là on tirerait facilement les généralisations des autres formes de cette condition.


IV. — Signification physique de l’intégrale de Stieltjès.

Nous venons de généraliser l’un des modes de définition analytique de l’intégrale ; les autres modes de définition analytique sont susceptibles de généralisations analogues[20]. Mais n’y a-t-il pas, pour l’intégrale de Stieltjès, une définition analogue à la définition géométrique de l’intégrale, c’est-à-dire qui apparaisse comme une simple mise au point d’une définition intuitive. Ce mode de définition existe, il a certainement guidé les premières idées de Stieltjès, mais Stieltjès n’y insiste pas ; son exposé analytique donne toute satisfaction du point de vue logique de sorte que la signification intuitive de l’intégrale de Stieltjès a été un moment oubliée.

Stieltjès dit cependant : supposons qu’il y ait, répandue sur , de la matière pesante. Soit la masse située sur  ; calculons le moment de la masse totale par rapport à l’origine. Pour cela, partageons l’intervalle considéré à l’aide de valeurs croissantes , nous aurons une valeur approchée du moment sous la forme

 ;

d’où, pour la valeur exacte du moment, une intégrale .

Mais la signification de l’intégrale de Stieltjès est bien plus nettement donnée par Cauchy qui avait, avant Stieltjès, considéré l’intégration par rapport à une fonction ; bien plus amplement que Stieltjès, au point de vue physique, mais sous une forme bien moins précise, au point de vue logique[21].

Le point de départ de Cauchy est la notion de grandeurs coexistantes, notion plus large que celle de fonction, dont celle-ci n’est qu’un cas particulier.

Des grandeurs sont dites coexistantes lorsqu’elles sont déterminées par les mêmes conditions, géométriques ou physiques. La surface et le volume d’un cylindre sont des grandeurs coexistantes, déterminées en même temps par la donnée du cylindre. Dans une étendue gazeuse, isolons par la pensée la matière contenue dans un certain domaine ; le volume du corps ainsi conçu, sa masse, la quantité de chaleur nécessaire pour élever sa température d’un degré à volume constant sont trois grandeurs coexistantes.

Les nombres qui mesurent ces grandeurs ne sont pas nécessairement des fonctions les uns des autres, les exemples précédents le prouvent ; ils le sont parfois ; le rayon, la hauteur, la surface, le volume d’un cylindre de révolution sont des grandeurs coexistantes et deux quelconques d’entre elles déterminent les deux autres. D’une façon plus générale, si une grandeur est fonction d’autres grandeurs, toutes ces grandeurs sont coexistantes. Nous sommes habitués à raisonner sur variables et fonctions, mais il y a tout aussi bien lieu de raisonner sur des grandeurs coexistantes : entre la surface et le volume d’un cylindre, on peut, par exemple, établir des relations d’inégalité. Pour donner une base solide aux raisonnements sur les grandeurs coexistantes, précisons cette notion ce qui d’ailleurs va en restreindre la portée.

Dans les exemples précédents, les grandeurs coexistantes apparaissent comme attachées à un même corps, le cylindre ou le corps gazeux, ce sont des fonctions d’un même domaine. Les grandeurs de la physique directement mesurables apparaissent d’ailleurs toujours comme des fonctions de domaine ; seulement ces domaines ne sont pas toujours à trois dimensions. Il peut s’agir de domaines sur la droite, c’est-à-dire d’intervalles, de domaines plans ou de domaines à plus de trois dimensions ; dans ce dernier cas le domaine ne s’impose plus à nos sens, sa conception purement mathématique est quelque peu artificielle. Si, par exemple, nous avions voulu parler de la quantité de chaleur nécessaire pour élever de degrés un corps gazeux C conçu isolé du reste d’une étendue gazeuse et si nous avions voulu faire varier et et le corps, il nous aurait fallu considérer la quantité de chaleur comme attachée à un domaine à quatre dimensions de l’espace  ; celui qui serait obtenu en faisant subir au corps C, tracé dans , une translation parallèle à l’axe des .

Nous admettrons donc que les grandeurs dont nous parlons sont des fonctions de domaine et nous remplacerons la notion de grandeurs coexistantes par celle, plus précise, de fonctions d’un même domaine ou, par une abstraction de mathématicien, par celle de fonctions d’un même ensemble.

On rencontre aussi en physique des fonctions de points ou si l’on veut d’un certain nombre de variables. Les unes sont encore des fonctions de domaine, mais attachées à des domaines spéciaux ne dépendant plus que d’un nombre fini de paramètres : la masse de la quantité d’eau comprise dans un récipient jusqu’à la hauteur est une fonction de , mais parce que et sont des fonctions d’un même domaine. Les autres sont vraiment attachés à des points ; ces nombres servent en général à étalonner des états, des qualités, à distinguer par exemple des mouvements plus ou moins rapides (vitesse), des matières plus ou moins denses (densité).

Si l’on considère la définition précise de ces nombres, on constate qu’on les obtient comme valeur limite du quotient de deux fonctions d’un même domaine :

Vitesse = lim. Vitesse moyenne = lim longueur d’arc de trajectoire/temps de parcours de cet arc,

Densité = lim. Densité moyenne = lim masse d’un corps/volume de ce corps.

Comme notre but n’est pas d’étudier les nombres de la physique, nous n’avons pas à rechercher, si tous ces nombres rentrent bien dans l’une ou l’autre des deux catégories indiquées et si la distinction entre ces deux catégories de nombres est absolue ; il nous suffira d’avoir remarqué l’importance, en physique, des fonctions de domaine et de cette sorte de dérivation d’une fonction de domaine par rapport à une autre qui fournit les fonctions de points.

Que les fonctions de domaine s’introduisent en physique et y apparaissent même comme plus directement adaptées aux besoins du physicien que les fonctions de points ne doit pas nous étonner. Un point n’est que la conception limite de corps de plus en plus petits, une fonction de point ne peut s’introduire en physique que comme limite d’une fonction de corps, d’une fonction de domaine. Si pourtant, on parle peu de ces fonctions, c’est que les mathématiciens n’ont pas encore créé l’Algèbre et l’Analyse des fonctions de domaine. On possède par contre des notations remarquablement maniables pour les fonctions de points ; aussi, par des artifices divers — mais qui se réduisent toujours au fond à ne raisonner que sur des domaines assez spéciaux pour qu’ils ne dépendent plus que d’un nombre fini de variables —, remplace-t-on toujours l’emploi des fonctions de domaine par celui des fonctions de point.

L’opération de dérivation que nous avons rencontrée est celle qu’étudie Cauchy. Elle se définit ainsi : et étant deux fonctions de domaines, pour avoir la dérivée en un point de par rapport à , on prend la limite du rapport pour une suite de domaines de plus en plus petits et se réduisant à la limite au seul point .

On pourra définir de même la dérivée d’une fonction d’ensemble par rapport à une autre ; on pourra être amené aussi à astreindre la suite des ou des , à des restrictions supplémentaires pour que la limite existe, comme nous avons dû le faire (p. 191) ; laissons ces détails de côté.

Proposons-nous, avec Cauchy, de calculer connaissant et la dérivée de par rapport à . Ce problème ne serait pas déterminé, et nous ne saurions guère comment l’étudier, si nous laissions à la notion de fonction de domaine toute la généralité possible. Nous allons supposer qu’il s’agit de fonctions additives de domaine. C’est là une restriction importante à la conception de Cauchy : la surface et le volume d’un corps sont deux grandeurs coexistantes, ce sont certes aussi deux fonctions de domaine, mais la seconde seule est additive.

En réalité, pour traiter le problème qui va nous occuper, Cauchy se restreint, comme nous allons le faire, mais sans s’en rendre compte nettement, au cas des fonctions additives de domaines. Cette restriction est d’ailleurs légitimée pratiquement par le fait que ceux des nombres fournis par la physique qui sont ce que nous appelons des mesures de grandeur[22] sont des fonctions additives de domaine.

Tout point est alors intérieur à un domaine tel que le rapport diffère de de moins de pour le domaine et pour tous les domaines intérieurs, assujettis aux restrictions qui ont pu être imposées dans la définition de la dérivée. À l’aide d’un nombre fini de ces domaines on couvrira, d’après le théorème de M. Borel (p. 112), tout le domaine que l’on considère. En restreignant ces domaines on pourra les supposer sans points intérieurs communs. Alors on aura partagé en domaines partiels , , …, et pris dans chacun d’eux ou au voisinage de chacun d’eux un point particulier , de manière que l’on ait

.

Si est continue, on modifiera très peu ceci en supposant pris dans .

De là résulte

.

Si donc, quel que soit le morcellement de en les et quel que soit le choix des , la première somme tend vers une limite déterminée pour des de plus en plus petits, et la seconde reste bornée — ce dernier fait exprime que est à variation bornée — on sait calculer .

La précision de ces aperçus conduit tout naturellement à l’intégrale de Stieltjès ; il suffit de supposer qu’il s’agit de domaines à une dimension, d’intervalles, que est , que est la fonction d’intervalle que nous avons attachée à une fonction à variation bornée, pour retrouver la définition posée par Stieltjès, pour .

Mais il est clair que de ces aperçus dériveraient aussi des généralisations de cette intégrale aux fonctions de plusieurs variables. Nous n’insisterons pas puisque, dans ce Livre, nous nous bornons toujours à l’intégration des fonctions d’une variable.

Ces intégrales se réduiraient aux intégrales ordinaires si la fonction se réduisait à la mesure, au sens ordinaire, du domaine  ; l’extension de la notion de mesure étudiée par M. de la Vallée Poussin, la forme donnée par M. Radon à la définition de l’intégrale se relient donc étroitement aux considérations physiques qui viennent d’être développées.

La définition de M. Radon s’impose particulièrement si, au lieu d’examiner avec Cauchy une généralisation du problème des fonctions primitives, on étudie une généralisation du problème des quadratures. Supposons qu’on sache que pour tout domaine ou ensemble , le produit — le nombre étant intermédiaire entre les limites inférieure et supérieure des valeurs prises sur par une fonction — est une valeur approchée de et d’autant plus approchée que est plus petit. Nous serons tout naturellement conduits, pour calculer , à examiner la somme , où est formé des points de en lesquels on a . Or ceci est la définition de M. Radon.

Remarquons que, dans l’Analyse classique, on considère à diverses occasions des sommes . Par exemple, lorsque l’on calcule une intégrale curviligne on cherche la limite de

 ;

et l’on a alors affaire à une fonction égale à la mesure du segment projection, sur , de l’arc .

Ordinairement de telles intégrales se considèrent groupées

.

Si nous rapprochons ceci de la formule classique qui donne l’arc d’une courbe dans les cas simples

,

formule que l’on doit traiter comme une intégrale curviligne, en y substituant en fonction d’un même paramètre  ; on sera conduit à examiner des intégrations par rapport à plusieurs fonctions d’ensembles, ou si l’on veut par rapport à plusieurs grandeurs coexistantes. Soit une fonction d’un point et de variables, supposons homogène et de degré 1 par rapport à l’ensemble de ces variables. Soient, d’autre part, fonctions additives de domaine coexistantes , , …, .

La somme

étendue à une division d’un domaine ou d’un ensemble en ensembles partiels , désignant un point de , définira par sa limite, quand elle existe, une sorte d’intégrale de Stieltjès de par rapport aux fonctions , , …, .

Ces sommations n’ont pas encore été étudiées ; M. Hellinger[23] a pourtant utilisé une intégration qui se note et qui est la limite des sommes

 ;

intégrale qu’a ensuite étudiée à son tour M. Radon.

Terminons ce paragraphe en signalant que, d’après Cauchy, la notion de grandeurs coexistantes est de nature élémentaire et rendrait de grands services si on l’utilisait dès les débuts de l’Analyse ou même de la Géométrie. Il nous semble bien, en tout cas, qu’il y aurait grand avantage à exposer tout d’abord la notion d’intégrale par rapport à une fonction de domaine. On aurait une vue synthétique de l’ensemble des types d’intégrales de fonctions continues, la théorie de ces intégrales serait obtenue plus rapidement et pourtant on préparerait mieux les applications géométriques et physiques.


V. — Fonction primitive par rapport à une fonction.
Totalisation par rapport à une fonction.

Pour le cas des fonctions d’une seule variable, le problème des fonctions primitives qu’on vient de rencontrer s’énonce ainsi : Étant données dans une fonction à variation bornée et une fonction , trouver une fonction qui admette en tout point comme dérivée par rapport à .

Dire que est la dérivée de , c’est-à-dire que l’on a

,

si l’on traduit exactement les considérations du précédent paragraphe ; mais il est évident qu’alors ne serait déterminée en aucun point puisque et interviennent en fait seuls[24]. Exigeons donc que l’on ait

,

pour dire que admet pour dérivée. Dans la recherche de la limite du second membre, il ne sera tenu compte que des nombres pour lesquels le second membre a une valeur déterminée, finie ou non. En un point intérieur à un intervalle dans lequel et seraient toutes deux constantes, la dérivée serait indéterminée ; quelle que soit , on pourrait la dire égale à .

C’est encore par le procédé des chaînes d’intervalles que nous allons étudier ce problème ; mais il nous faudra opérer avec précautions, tout d’abord parce que n’est pas continue. Faisons tendre, en effet, vers zéro par valeurs positives dans la formule de définition de la dérivée, nous voyons que existe et que l’on a

.

Cette formule et la formule analogue pour nous font connaître les points de discontinuité et les sauts de .

À cause de cette discontinuité si , , , …, sont les points de division de la chaîne, nous utiliserons la formule

dans cette formule, la somme doit être étendue à tous les indices des points de la chaîne, finis ou transfinis, et elle doit être calculée en tenant compte de l’ordre de succession de ces indices. Pour démontrer que, dans ces conditions, la formule est exacte, il suffit de prouver que l’on a, pour tout indice ,

Cette formule est évidemment vraie pour si elle est vraie pour  ; d’autre part, elle est vraie pour un indice , nombre transfini de seconde espèce si elle est vraie pour , car pour tendant vers en croissant tend vers . En d’autres termes, que soit de première ou de seconde espèce, la formule est vraie pour parce qu’elle est vraie pour les indices plus petits ; la formule est générale.

Nous prendrons les intervalles de la chaîne de manière que l’on ait

,

et de manière analogue pour . Alors

étant compris entre −1 et +1 ; ceci s’écrit encore

désignant comme toujours la variation totale de de à . D’où

De cette formule et de celle analogue relative à , on déduirait facilement que, toutes les fois que a une intégrale de Stieltjès-Riemann, est l’intégrale indéfinie de prise par rapport à . Contentons-nous d’en déduire que si est identique à zéro, est une constante, d’où il résulte que la fonction primitive, par rapport à une fonction donnée à variation bornée , d’une fonction donnée est déterminée à une constante additive près, puisque la différence de deux fonctions primitives de a, par rapport à , une dérivée identiquement nulle.

Reprenons la formule que nous venons de trouver

,

formule dans laquelle, pour simplifier, nous avons fait rentrer sous le signe la contribution de malgré sa forme spéciale. Et précisons, comme pages 176 et suivantes, le choix des intervalles de la chaîne. Supposons pour cela sommable par rapport à et soit l’ensemble  ; enfermons dans un ensemble d’intervalles non empiétants dont la mesure, par rapport à , ne surpasse celle de que de au plus ; les nombres étant choisis tels que les séries et soient convergentes et de sommes et très petites.

Assujettissons l’intervalle dont l’origine appartient à à être enfermé dans et tel que

,

notre formule deviendra

,

Montrons que la série qui y figure est absolument convergente ; soit la mesure, par rapport à , de ceux des intervalles de la chaîne dont les origines sont points de , soit la mesure de ces mêmes intervalles par rapport à . En groupant les valeurs absolues des termes de la série, on voit que leur somme est au plus

,

laquelle quantité est au plus égale à

La série étant absolument convergente, on en peut grouper les termes et écrire

.

Montrons que, lorsqu’on fait tendre et vers zéro, on peut remplacer sous le signe chaque par sa limite . La série du second membre ayant ses termes qui varient moins que ceux de la dérivée , il suffit de justifier le passage à la limite pour cette série. Or, on a

,

d’où

,

l’indice indiquant que la première sommation ne doit être étendue qu’aux termes positifs.

Pour tendant vers zéro, le premier membre tend en croissant vers  ; le dernier membre est  ; donc la limite de , pour et tendant vers zéro, est . En d’autres termes, on peut passer à la limite sous le signe  ; on a donc

.

Mais nous avons vu que l’on a

,

d’où

.

On aurait pu raisonner de même sur , donc la fonction primitive, par rapport à , d’une fonction sommable, par rapport à , est la fonction d’une variable intégrale indéfinie de par rapport à .

Nous venons de reprendre les raisonnements du Chapitre IX, mais en nous plaçant dans des conditions particulièrement simples. Pour suivre plus exactement les raisonnements de ce Chapitre, il faudrait introduire la notion de nombres dérivés par rapport à une fonction . Le lecteur verra facilement que tous les résultats du Chapitre IX s’étendraient alors à l’intégration et à la dérivation par rapport à , et très souvent littéralement. Bornons-nous à vérifier cet énoncé en relation avec celui qui précède : La fonction d’une variable intégrale indéfinie d’une fonction , par rapport à une fonction à variation bornée , admet pour dérivée par rapport à , sauf tout au plus en un ensemble de points de mesure nulle, par rapport à .

On a, par définition même,

.

Sauf peut-être pour un ensemble de valeurs de , dont la mesure est nulle, la fonction

admet pour dérivée et admet pour dérivée.

En d’autres termes,

et

tendent, pour tendant vers zéro, vers les deux limites indiquées. Et comme est différent de zéro, de ceci résulte que

tend vers . Nous ne pouvons cependant pas conclure immédiatement parce que la fonction ne prend pas toutes les valeurs de et que et peuvent donner la même valeur de  ; nous pouvons dire seulement que presque en tout point , donné par une valeur de n’appartenant pas à , et pour laquelle est continue, admet pour dérivée par rapport à . Les points qui ne sont pas donnés par une valeur de grâce à la formule appartiennent à un intervalle dans lequel est constante ; l’ensemble de ces intervalles donne un ensemble fini ou dénombrable de points  ; donc est de mesure nulle par rapport à , et d’ailleurs, dans ces intervalles, la dérivée de est indéterminée. D’autre part, si est point de discontinuité de , en ce point admet bien pour dérivée, d’après le calcul que nous avons fait des sauts de . Donc le théorème est entièrement démontré.

Essayons maintenant de résoudre le problème des fonctions primitives, sans assujettir la fonction , jusqu’ici supposée sommable par rapport à , à aucune condition restrictive. Nous supposons donc donnée la dérivée, partout finie, , d’une fonction inconnue , cette dérivée étant prise par rapport à une fonction à variation bornée donnée .

Il est clair que, pour la détermination de , l’intégration par rapport à sera insuffisante et qu’il faudra nous adresser à une généralisation de la totalisation, puisqu’il faut recourir à l’opération de totalisation lorsque se réduit à la fonction . Or une telle généralisation s’est présentée à nous (p. 261) ; quand nous avons décidé de prendre pour définition de l’intégrale de Stieltjès la formule

,

nous n’avons considéré que le cas où la théorie des fonctions sommables donnait un sens au second membre et nous n’avons pas fait appel à la théorie de la totalisation. Convenons maintenant d’appeler totale définie de par rapport à , l’expression

,

dans le second membre de laquelle le symbole désigne la totale définie, au sens de M. Denjoy, de la fonction supposée totalisable[25].

Ce nouveau mode de totalisation, définit en même temps la totale indéfinie de par rapport à . Ces deux totales sont obtenues comme précédemment par l’emploi répété par récurrence transfinie d’opérations analogues aux opérations A et B de la page 227 :

A1. On suppose connues des totales indéfinies de dans des intervalles tendant vers

,

La fonction , égale à dans , égale à

dans , et définie d’une manière analogue dans , est prise pour totale indéfinie de dans . On achève la détermination de la totale indéfinie dans en convenant que a, en , un saut à droite égal à

et, en , un saut à gauche égal à

.


B1. On a un ensemble fermé contenu à l’intérieur d’un intervalle  ; on suppose connues des totales de pour les divers intervalles contigus à et contenus dans  : si la série fournie par ces totales est convergente et, si est sommable sur par rapport à on prend

comme totale indéfinie de dans .

Pour que soit totalisable par rapport à il faut : 1o que l’opération A1 donne une fonction pour laquelle et existent ; 2o que quel que soit l’ensemble fermé , il existe un intervalle contenant des points de à son intérieur et dans lequel sont vérifiées les conditions nécessaires à l’opération B1.

De la définition il résulte aussi que : une fonction est une totale indéfinie par rapport à si, et seulement si :

1o Elle n’admet que des points de discontinuité de première espèce ;

2o Quel que soit un ensemble fermé, la fonction égale à sur , linéaire dans les intervalles contigus à et admettant en chaque point de les mêmes sauts que est absolument continue, dans un intervalle contenant des points de à son intérieur, par rapport à la fonction déduite de , comme est déduite de .

Enfin, des relations entre une intégrale indéfinie par rapport à et la fonction intégrée , il résulte que la totale indéfinie, prise par rapport à , d’une fonction admet pour dérivée approximative par rapport à , sauf aux points d’un ensemble de mesure nulle par rapport à la variation totale de .

Par dérivée approximative de par rapport à , en un point , nous entendons la limite du rapport

prise pour des nombres formant un ensemble de densité un, par rapport à , au point . Ce qui revient à dire que, si l’on fait tendre et vers , , et si désigne la partie de située dans , le rapport tend vers un.

Bornons la théorie de la totalisation par rapport à une fonction à ces affirmations, que le lecteur justifiera de suite, et revenons à la recherche des fonctions primitives.

Nous nous proposons donc de former une fonction connaissant la valeur finie de sa dérivée prise par rapport à une fonction donnée , à variation bornée. Reprenons ce que nous avons déjà fait (p. 286).

À toute valeur de telle que l’on ait pour une ou plusieurs valeurs , associons le nombre  ; cette convention ne prête à aucune ambiguïté car, s’il y a plusieurs valeurs correspondant à , c’est qu’elles donnent toutes la même valeur à donc à et par suite à . En effet, si n’était pas constante dans un intervalle où est constante, n’aurait pas une dérivée finie, par rapport à , en tous les points de cet intervalle.

À une valeur telle que l’on ait :
soit

,

soit

,

posons respectivement :
soit

,

soit

,

Il est clair que la fonction , définie dans l’intervalle , y est continue. Laissons de côté l’infinité dénombrable des points donnés par les intervalles dans lesquels est constante et par les formules

,,,

dans lesquelles on ne donnera à que des valeurs de discontinuité de .

Étudions ce que donne la dérivation de en un point n’appartenant pas à . Dans un intervalle la fonction est formée par deux fonctions linéaires de pentes

dans et . Sauf en la dérivée de existe et peut se noter , en utilisant la fonction de la page 259.

Tout point n’appartenant pas à et non situé dans les divers intervalles correspond à une valeur unique par la formule , et n’est pas une valeur de discontinuité de . Si l’on considère une valeur tendant vers , le nombre tend alors vers . Le nombre est égal à si ce nombre résulte de la première partie de la définition de . Dans ce cas on a

,

et quand tend vers zéro le premier rapport tend vers , le second reste compris entre −1 et +1 et tend presque partout vers .

Si la valeur de résulte de la seconde partie de la définition de c’est que est l’abscisse d’un point singulier de et que est compris dans . Supposons, par exemple, que l’on ait

 ;

Dans cet intervalle est linéaire et le rapport est compris entre

et,

ou tout au moins diffère aussi peu que l’on veut de ce second membre, désignant un nombre très petit positif choisi de manière que pour , la valeur de résulte de la première partie de la définition de .

Or ces deux derniers rapports rentrent dans la catégorie de ceux étudiés au début, donc les plus grande et plus petite limites de ces rapports sont toujours comprises entre et et ils tendent presque partout vers une limite déterminée

,

donc :

La fonction , sauf peut-être aux points de l’ensemble dénombrable , tous ses nombres dérivés finis, et par suite est une totale indéfinie ;

La fonction a presque partout une dérivée déterminée et finie égale à , donc est la totale indéfinie

 ;

d’où il résulte que

.

Ainsi, la recherche d’une fonction , dont on connaît la dérivée finie prise par rapport à une fonction donnée à variation bornée, peut toujours être effectuée par la totalisation indéfinie de par rapport à .

Ce résultat généralise exactement celui de M. Denjoy relatif au cas  ; il serait très intéressant de reprendre pas à pas les raisonnements qui nous ont servis dans ce cas particulier et de les étendre au cas général. Le lecteur ne rencontrera aucune difficulté particulière dans cette étude ; il pourra aussi montrer que la méthode développée aux pages 214 et suivantes, et qui permet la résolution du problème des fonctions primitives sans faire appel à une notion d’intégrale, s’applique encore à toute fonction à variation bornée. Il pourra examiner aussi le problème des fonctions primitives des nombres dérivés auquel la méthode de changement de variable utilisée ici ne semble pas permettre de donner une solution. Nous n’examinerons pas cette généralisation du problème des fonctions primitives. Mais il en est d’autres, bien plus élémentaires et immédiats, qui restent sans solution ; on va le voir.

Le cas où est à variation bornée est, d’après ce qui a été expliqué, le seul sans doute qui ait un intérêt physique. Mais au point de vue mathématique, il n’y a aucune raison pour ne considérer la dérivation d’une fonction par rapport à une fonction que dans l’hypothèse où est à variation bornée.

Or, si l’on abandonne cette hypothèse, à peu près aucune de nos conclusions ne subsiste. Montrons, par exemple, que si est à variation non bornée, il existe des fonctions continues qui n’ont pas d’intégrale de Stieltjès par rapport à , c’est-à-dire pour lesquelles les sommes ne tendent vers aucune limite déterminée et finie, quand on fait varier le choix des et des de façon que le maximum de tende vers zéro.

En effet, étant à variation non bornée, on peut (p. 57), trouver une suite ordonnée de points tels que la série

soit divergente. Alors on peut trouver une suite de nombres tendant vers zéro et tels que la série

soit divergente et à termes positifs.

Supposons, pour fixer les idées, que les points se succèdent dans l’ordre

 ;

étant la limite des . Prenons pour une fonction continue, nulle de à , de à et aux points et atteignant la valeur dans .

Je dis que, quel que soit le maximum imposé à la longueur des intervalles de subdivision de , on peut choisir ces intervalles et les points de façon que la somme correspondante surpasse toute limite assignée.

Soit la valeur de l’indice à partir de laquelle reste inférieur à . Divisons arbitrairement en intervalles de longueur au plus et choisissons dans chacun d’eux un point  ; faisons de même pour . Il reste à diviser  ; prenons comme points de divisions les points , , …,  ; étant un entier quelconque. Dans , , … nous prenons des points en lesquels a respectivement les valeurs , , …, . Dans nous prenons en . Alors on a

,

étant la contribution des intervalles , , laquelle ne dépend pas du choix de . Or, pour assez grand, le second terme du second membre surpasse toute limite ; donc est aussi grand qu’on le veut. La définition de Stieltjès ne s’applique donc pas à et .

Ainsi nous ne savons plus attacher à chaque fonction continue une intégrale par rapport à , quand est à variation non bornée.

Le problème des fonctions primitives ne se posera d’ailleurs plus pour toutes les fonctions continues .

Prenons  ; la fonction est croissante dans les intervalles

,

décroissantes dans les intervalles

.

Prenons continue dans (0, 1), nulle dans les , positive dans les  ; cela sera possible même si l’on exige que l’intégrale ait une valeur pourvu que tende vers zéro plus rapidement que l’accroissement de dans . Prenons

Il est alors clair que, dans , si petit que soit positif est la dérivée par rapport à de la fonction

.

Mais cette intégrale augmente indéfiniment quand tend vers zéro, parce que la série des est divergente ; dans (0, 1), la fonction continue n’est donc pas la dérivée par rapport à d’une fonction .

Ainsi, quand nous ne supposons plus que est à variation bornée, le problème des fonctions primitives apparaît tout différent de celui que nous avons résolu.

Voici pourtant une catégorie de fonctions à laquelle les considérations précédentes s’étendent de suite.

La fonction satisfait aux deux conditions suivantes :

1o  n’a que des points de discontinuité de première espèce ;

2o  étant un ensemble fermé quelconque, il existe un intervalle contenant des points de à son intérieur et dans lequel est à variation bornée la fonction égale à aux points de , linéaire dans les intervalles contigus à et telle que , .

Prenons pour l’intervalle lui-même ; est identique à dans  ; dans nous connaissons la dérivée de , par rapport à la fonction à variation bornée  ; donc y est totalisable, par rapport à . Dans existe, par suite, un intervalle dans lequel est sommable, par rapport à  ; l’intégrale de Stieltjès de fournissant .

On connaît ainsi dans des intervalles qui couvrent l’intérieur des intervalles contigus à un certain ensemble fermé. De là on déduit , d’abord dans les intervalles contigus considérés comme ensembles ouverts ; puis, comme on connaît les sauts de en tout point, dans les intervalles contigus fermés.

Supposons que, par cette opération ou toute autre, nous ayons déterminé dans les intervalles fermés contigus à un ensemble fermé . Soit la fonction déduite de comme est déduite de .

Si est un intervalle contigu à , y est linéaire et y admet, par rapport à , une dérivée connue

.

Aux points de on a , , d’où il résulte facilement que admet en ces points pour dérivée par rapport à . Ceci n’est toutefois vrai que pour la dérivée à gauche aux points , à droite aux points  ; la dérivée à droite, en , à gauche en , a été calculée plus haut.

Ainsi, dans , nous connaissons la dérivée de par rapport à la fonction à variation bornée . Cette dérivée est finie et déterminée, exception faite des points d’un ensemble dénombrable en lesquels il existe une dérivée à droite et une dérivée à gauche finies et connues.

Les conditions dans lesquelles nous nous trouvons placés sont donc un peu plus générales que celles examinées précédemment, mais rien d’essentiel ne sera changé. Quand la dérivée existe partout, nous en déduisons que la fonction provenant de a un nombre dérivé supérieur à droite fini, sauf peut-être aux points d’un ensemble dénombrable . Il nous faut maintenant dire, sauf aux points de , étant le transformé de . Si tous les points de sont des points de continuité de , est dénombrable et rien n’est changé à nos conclusions antérieures ; nous n’aurions même pas besoin de savoir qu’aux points de les nombres dérivés de sont finis. Si est un point de discontinuité de appartenant à , à ce point correspond, dans , les deux intervalles[26] ,  ; mais grâce aux dérivées à droite et à gauche en , , , qui sont connues, on connaît dans ces deux intervalles, et l’on sait que y a en tout point une dérivée à droite finie et connue. Ainsi rien d’essentiel n’est changé ; a en tout point, sauf au plus un ensemble dénombrable de points, un nombre dérivé supérieur à droite fini, est une totale indéfinie dans . Toutefois, pour calculer , il conviendrait de modifier légèrement la méthode de calcul des intégrales de Stieltjès  ; car représente maintenant la dérivée connue de par rapport à , laquelle est multiforme au point de discontinuité , si en ce point a une dérivée à droite et une dérivée à gauche . Alors pourra intervenir dans un ensemble , soit à cause seulement de la valeur , soit seulement de , ou des deux ; suivant ces cas, interviendra dans pour

,,[27].

Par de telles modifications élémentaires, nous arriverons donc à trouver une fonction connaissant en tout point la valeur finie de sa dérivée à droite par rapport à une fonction à variation bornée , et connaissant, aux points de discontinuité de , la valeur finie de sa dérivée à gauche[28].

Mais ces modifications sont inutiles ici car les points de sont des origines ou des extrémités d’intervalles contigus à  ; est continue à droite en , à gauche en , de sorte qu’il suffit de prendre aux points de sans tenir compte des valeurs et .

Par suite, dans , on peut trouver un intervalle contenant à son intérieur des points de et dans lequel est sommable par rapport à . L’intégrale de , dans , est la somme des contributions des intervalles , laquelle est connue, et de la contribution de la partie de située dans . Donc, on a

.

Ceci pourrait se remplacer par

,

les extrémités de étant supposées prises sur , mais seulement si, dans le calcul de l’intégrale par rapport à , on ne fait compter les points que pour leur mesure à gauche, et les points pour leur mesure à droite.

Sous l’une ou l’autre forme, on voit qu’il y a là la possibilité de déterminer dans des intervalles contenant des points de  ; ceci suffit pour qu’on soit certain de pouvoir obtenir dans tout par récurrence transfinie ; est, par suite, déterminée à une constante additive près.

La nouvelle catégorie de fonctions est très vaste, pourtant nous ne savons pas toujours trouver la fonction continue admettant par rapport à une fonction continue donnée une dérivée continue donnée . Il suffit de prendre continue et à variation non bornée dans tout intervalle et de prendre pour nous trouver dans ce cas. Sans doute, dans cet exemple, nous connaissons l’une des fonctions primitives de , savoir la fonction elle-même ; mais nous ignorons s’il existe ou non des fonctions primitives qui ne soient pas de la forme

 ;

nous n’avons, en effet, donné ici aucune méthode, ni pour trouver les fonctions primitives de , ni pour délimiter l’étendue de leur indétermination.

  1. Annales de la Fac. des Sc. de Toulouse, 1894.
  2. L’extension aux divers modes d’intégration des procédés classiques permettant le calcul exact ou approché des intégrales de fonctions continues (intégration par parties, par substitution, second théorème de la moyenne, inégalité de Schwarz, etc.) n’a pas trouvé place dans notre exposé. Ce qui suit est en réalité relatif au procédé d’intégration par substitution.
  3. Voir pages 167 et suivantes.
  4. C’est à l’occasion de ce théorème de M. Riesz (C. R. Acad. Sc., 1909 ; voir aussi Annales de l’École Normale supérieure, 1911 et 1914) que j’ai donné (C. R. Ac. Sc., 1909) l’extension de la notion d’intégrale de Stieltjès par les procédés qui viennent d’être indiqués, présentés parfois sous des formes légèrement différentes.
  5. Les mots fonction de fonction prêtant à équivoque, M. Volterra avait appelé fonction de ligne les nombres tels que  ; l’expression fonctionnelle proposée par M. Hadamard a généralement prévalu.
  6. J’imite dans ce qui suit la démonstration donnée par M. Riesz dans son Mémoire des Annales de l’École Normale, 1914. M. Riesz me fait là l’honneur de déclarer qu’une remarque que j’avais faite sur le rôle des suites monotones de fonctions l’a guidé. En réalité, je n’avais que très imparfaitement compris ce rôle sans quoi je n’aurais pas écrit, dans ma Note de 1909, qu’il serait très difficile d’étendre la notion d’intégrale de Stieltjès par un procédé différent de celui que j’employais. Peu de temps après que j’eus commis cette imprudence, M. W. H. Young montrait que mon procédé était loin d’être indispensable et que l’intégrale de Stieltjès se définit exactement comme l’intégrale ordinaire par le procédé des suites monotones indiqué au Chapitre VII, p. 134 (Proceed. of the London Math. Society, 1913).

    Ce travail de M. Young est le premier de ceux qui ont finalement bien fait comprendre ce que c’est qu’une intégrale de Stieltjès. On n’a pénétré vraiment au fond de cette notion que grâce à la définition qu’en a donnée M. Radon (Sitz. d. K. Ak. d. Wiss. in Wien, 1913) et aux travaux de M. de la Vallée Poussin sur l’extension de la notion de mesure (voir, en particulier, dans cette collection, le livre déjà cité de M. de la Vallée Poussin). Mais pour que ces travaux soient eux-mêmes possibles, il avait fallu que soient dégagées les notions de fonction d’ensemble (Lebesgue), de fonction de plusieurs variables à variation bornée (Vitali, Rend. della R. Acc. delle Sc. di Torino, 1908), d’intégrale de Stieltjès d’une fonction continue de plusieurs variables (Fréchet, Nouv. Ann. de Math., 1905), etc.

    Comme je ne m’occupe dans ce livre que des fonctions d’une seule variable, la difficulté et l’importance de certains travaux y apparaissent mal. C’est pourquoi je tiens à dire que si, en ce qui concerne les fonctions d’une seule variable, le Mémoire de M. Radon ne nous a apporté qu’une définition nouvelle, particulièrement heureuse à la vérité, de l’intégrale de Stieltjès, pour le cas de plusieurs variables ce Mémoire fournit une véritable extension de la notion d’intégrale.

  7. On pourrait partir d’un champ plus restreint, de celui des polynômes, par exemple.
  8. Dans le champ un examen analogue pour le cas de la convergence uniforme serait sans objet ; pour d’autres champs il fournit au contraire un résultat intéressant qui, avec celui qui va être donné dans le texte, peut servir à étudier directement l’extension du champ de définition d’une fonctionnelle, sans faire appel à la notion d’intégrale de Stieltjès.
  9. Si nous n’avions pas déjà fait le prolongement, grâce à l’intégrale de Stieltjès, nous devrions ici, ce qui serait facile, vérifier que les valeurs que nous avons attribuées à sont bien déterminées pour chaque du nouveau champ fonctionnel et qu’elles vérifient les conditions 1o, 2o et 3o. C’est au reste ce que nous ferons tout à l’heure.
  10. On verra plus loin comment on peut atteindre le champ fonctionnel plus large encore, constitué par les fonctions qui donnent des fonctions mesurables.
  11. Si l’on décompose en sa fonction des singularités et son noyau
    ,

    la fonctionnelle relative à s’écrit  ; seule la fonctionnelle relative à exige l’emploi des intégrales de Stieltjès (Fréchet, Comptes rendus du Congrès des Sociétés savantes en 1913).

  12. On remarquera qu’ici il n’est plus nécessaire de ne considérer que des suites de divisions telles que tout point de discontinuité de appartienne à toutes les à partir d’une certaine valeur de l’indice.
  13. C’est-à-dire « enfermé dans des intervalles ouverts ».
  14. Comparer, page 169.
  15. Nous avons défini pour tous les ensembles remplissant ces deux conditions à la fois.
  16. On remarquera que le résultat auquel nous allons arriver est celui que fournirait le changement de variable utilisé à la place du changement .
  17. Voir page 259. Pour des démonstrations directes on pourra se reporter au Livre déjà cité de M. de la Vallée Poussin.
  18. Parmi les questions que pourra traiter le lecteur à titre d’exercice je signale les suivantes. Appliquer les méthodes de Jordan au problème de la mesure relative à  ; définir l’étendue par rapport à  ; montrer que les fonctions mesurables J par rapport à sont les fonctions intégrables, au sens de Stieltjès-Riemann, par rapport à . Comparer le champ d’extension de la définition de Radon à celui des diverses définitions données dans le paragraphe I de ce Chapitre ; et en particulier montrer que, de même que l’extension de la notion de mesure obtenue (p. 277) à l’aide d’un changement de variable de la forme , ne s’appliquait qu’aux ensembles qui sont mesurables à la fois au sens ordinaire et par rapport à , l’extension obtenue (p. 259) à l’aide du même changement de variable ne s’applique qu’aux fonctions qui sont à la fois mesurables et sommables au sens ordinaire et par rapport à .

    Il est d’ailleurs clair que deux de ces définitions sont toujours d’accord lorsqu’elles s’appliquent toutes deux, puisqu’elles définissent des fonctionnelles linéaires vérifiant la troisième condition de la page 267 et qu’elles sont identiques pour les fonctions continues.

  19. Lebesgue, Journ. de Math., 1905.
  20. Il a déjà été dit que la définition de M. W. H. Young fut généralisée la première (p. 263, en note).
  21. Sur le rapport différentiel de deux grandeurs qui varient simultanément (Ex. d’Analyse, t. II, p. 188-229 ; Œuvres, 2e série, t. XII, p. 214-262). Voir aussi le Traité de Mécanique analytique de l’abbé Moigno.
  22. À mon avis les grandeurs devraient être définies dès les Éléments comme des nombres attachés à des domaines et tels que les grandeurs attachées à des domaines provenant de la subdivision d’un autre domaine aient pour somme la grandeur attachée à ce dernier domaine.
  23. Journal de Crelle, Bd 136.
  24. Ceci est tout naturel, car n’intervient que pour définir la fonction et que est définie par une fonction de domaine  ; or, à et , correspondent des fonctions et pour lesquelles
    ,,,,

    sont déterminés à une constante additive près, tandis que et ne le sont pas.

    Stieltjès avait déjà remarqué qu’à une distribution donnée de masses sur , c’est-à-dire à une fonction , ne correspond pas une fonction unique. Lorsque est donnée directement, tout point de discontinuité de correspond à la concentration d’une masse au point . Stieltjès imagine que cette concentration est faite en deux points géométriquement confondus en  ; le premier, portant la masse , appartient à  ; le second, de masse , appartient à .

    Cela revient à considérer les symboles , comme des nombres au même titre que les symboles , tous ces symboles étant susceptibles d’être classés par ordre de grandeur, à considérer comme un intervalle les ensembles de nombres , et étant deux nombres différents, , et à prendre pour une fonction de tels intervalles. Les intervalles seraient alors de neuf catégories différentes suivant que leur origine et leur extrémité seraient des symboles , ou  ; il y aurait trois espèces d’intervalles nuls,

    ,,.

    Ces conventions dispenseraient des précautions que nous avons dû prendre dans la division d’un intervalle en plusieurs autres (p. 152) ; dans une telle division devrait figurer une fois et une seule tout intervalle nul des formes

    et.
  25. En évitant d’employer le mot intégrale à la place de totale et le symbole à la place de symbole , je suis l’exemple de M. Denjoy qui a toujours soigneusement distingué l’intégration et la totalisation dans le vocabulaire et dans les formules.

    D’autres Auteurs ont, au contraire, utilisé pour tous les cas le mot intégrale et le symbole .

    Les deux façons de faire ont des avantages et des inconvénients.

  26. désigne ici la variation totale de et non de  ; pour la fonction particulière du texte et l’ensemble spécial , l’un des deux intervalles considérés n’existe pas. est, en effet, continue à droite en , à gauche en .
  27. Ceci revient à ne considérer, dans l’évaluation de la grandeur physique , que l’un ou l’autre ou les deux points matériels que Stieltjès imagine situés au point (p. 297).

    D’une façon plus abstraite, on peut dire qu’on remplace la notion d’ensemble de points par celle d’ensemble d’intervalles nuls. Mais il y a trois espèces d’intervalles nuls et il faut tenir compte dans l’évaluation de la mesure d’un ensemble de la nature des intervalles nuls qui le constituent.

  28. Les considérations précédentes prouvent nettement qu’une fonction n’est pas définie par la connaissance d’un ou plusieurs de ses nombres dérivés à droite, par rapport à une fonction , qu’il faut avoir de plus des renseignements sur l’allure de la fonction cherchée aux voisinages gauches des points de discontinuité de .