Le Principe de relativité et la théorie de la gravitation/chap. 4

CHAPITRE IV.

L’INVARIANCE DE LA VITESSE DE LA LUMIÈRE.


13. La notion de temps. Définition de la simultanéité[1].

Einstein a analysé d’une manière remarquable la notion de temps ; cette analyse a été le début de sa théorie.

Pour décrire le mouvement d’un point, on donne les valeurs de ses coordonnées d’espace en fonction d’une quatrième variable, le temps. Pour que les relations mathématiques aient un sens physique, il faut avoir une idée claire de ce qu’on nomme le temps.

Nous devons d’abord remarquer que, dans toutes les circonstances où le temps joue un rôle, il s’agit toujours d’événements simultanés. Quand nous disons le train part à 8 heures, cela signifie l’indication 8h des aiguilles de l’horloge et le départ du train sont deux événements simultanés. On pourrait croire que toutes les difficultés inhérentes à la définition du temps disparaissent en remplaçant « le temps » par « la position des aiguilles de l’horloge ». Cette définition convient pour le lieu où se trouve l’horloge, parce que, en ce lieu, la simultanéité d’un événement et d’une position particulière des aiguilles de l’horloge est parfaitement définie ; mais on ne peut pas coordonner ainsi des événements qui se passent en des lieux éloignés de l’horloge.

On pourrait s’imaginer que, pour situer dans le temps un événement se produisant en un lieu éloigné, il suffirait de repérer l’heure marquée par l’horloge à l’arrivée d’un signal électromagnétique (ou lumineux) parti du point où s’est produit l’événement et simultané avec cet événement en ce point. Mais on n’arriverait ainsi à aucune définition acceptable, car une pareille coordination des événements dépendrait, dans un même système, du lieu d’observation

Voici ce qu’on doit faire. Considérons un système Au point se trouvent un observateur et une horloge immobiles : l’observateur peut situer dans le temps tous les événements qui se produisent dans son voisinage immédiat. En un autre point se trouvent aussi un observateur et une horloge identique à l’horloge du point cet observateur peut, de son côté, coordonner tous les événements qui se produisent autour de lui. Il s’agit maintenant de coordonner les événements qui se passent en avec ceux qui se passent en car, jusqu’à présent, nous avons bien un temps du point et un temps du point mais nous n’avons pas un temps valable à la fois pour et pour

Ce temps commun aux lieux et sera défini de la façon suivante :

Puisque, dans un même système, la vitesse de la lumière est la même dans toutes les directions, le temps que met la lumière à aller de en est égal au temps qu’elle met à aller de en

Faisons alors partir de un signal électromagnétique ou lumineux à l’instant (temps marqué par l’horloge du point ) ; ce signal arrive en à l’instant (temps marqué par l’horloge du point ) et est réfléchi sur un miroir placé en ce point ; il est enfin de retour au point à l’instant (temps du point ).

L’horloge du lieu est synchrone avec celle du lieu par définition, si l’on a

ou

Cette définition du synchronisme ne soulève aucune objection ; elle est valable pour tous les points d’un même système. En effet :

1o Si l’horloge de est synchrone avec celle de l’horloge de est synchrone avec celle de

2o Si l’horloge de est synchrone avec l’horloge de et avec celle d’un troisième point les horloges de et de sont synchrones entre elles.

Nous savons donc maintenant ce qu’on appelle horloges synchrones dans un même système : on peut dire encore que deux horloges identiques placées en deux points et sont synchrones lorsqu’un signal électromagnétique parti de à l’époque (marquée par l’horloge de ) arrive au point à une époque (marquée par l’horloge de ), telle que étant la vitesse de la lumière dans l’espace vide de matière[2].

Nous comprenons ce qu’on doit entendre par simultanéité de deux événements qui se produisent en des lieux différents et L’événement au point et l’événement au point sont simultanés lorsque les époques simultanées avec ces événements marquées par deux horloges identiques synchrones en et en sont les mêmes.

Par les définitions du synchronisme et de la simultanéité, nous avons une définition précise du temps d’un système, définition valable pour tous les points du système. Toutes les horloges du système ayant été rendues synchrones les unes avec les autres, le temps ou l’époque d’un événement dans le système est l’époque simultanée à cet événement marquée par une horloge immobile qui se trouve au point où il se produit, et plus généralement par toutes les horloges immobiles du système, puisqu’elles ont été synchronisées.

Il est essentiel de remarquer que ce procédé de synchronisation des horloges, et que la définition du temps d’un système sont basés sur la constance de la vitesse de la lumière, quelle que soit la direction de propagation.

Il est impossible de synchroniser deux horloges dans deux systèmes en mouvement relatif. Nous allons d’ailleurs voir bientôt que les deux systèmes ont des temps différents.

14. La vitesse de la lumière est une constante universelle.

Le principe de relativité et le principe de l’isotropie de propagation de la lumière (no 10) ont pour conséquence immédiate que la vitesse de la lumière a la même valeur dans tous les systèmes en translation uniforme les uns par rapport aux autres.

Considérons deux systèmes et en translation uniforme l’un par rapport à l’autre et dans lesquels ne règne aucun champ de force. Dans chacun de ces systèmes, la vitesse de la lumière a une valeur indépendante de la direction : soient et les valeurs de cette vitesse dans et dans

Supposons qu’on ait cela voudrait dire : pour un observateur du système en mouvement par rapport à la vitesse de la lumière est plus grande que pour l’observateur du système et ce résultat serait indépendant de la direction et du sens de la vitesse relative car, pour toutes les directions de l’espace sont équivalentes. Mais alors, comme rien ne distingue le système du système puisque les lois physiques sont les mêmes dans ces deux systèmes (principe de relativité), la même conclusion serait valable dans le passage du système au système car, pour l’observateur toutes les directions de l’espace sont équivalentes. On aurait donc aussi les deux inégalités étant contradictoires, on a [3].

Il importe de bien préciser la signification de ce résultat. Nous supposons que, dans divers systèmes en translation uniforme, les observateurs sont munis des mêmes étalons de longueur, c’est-à-dire de règles qui, si on les mettait les unes à côté des autres dans un des systèmes, auraient la même longueur. Nous supposons que les observateurs ont des horloges étalons identiques, c’est-à-dire qu’ils mesurent le temps en prenant comme étalon de temps la période d’un même phénomène, qui ne soit pas déterminé par des conditions spéciales à un système particulier : par exemple, un pendule ne pourra pas servir d’étalon universel, parce que sa période d’oscillation est déterminée par la pesanteur ; mais on pourra adopter la période d’une radiation émise par un corps et prendre pour unité de temps, dans tous les systèmes, un même multiple de cette période.

Dans ces conditions, si divers observateurs en mouvement uniforme les uns par rapport aux autres prennent, chacun dans son système, une base et mesurent le temps employé par la lumière à parcourir cette base — par exemple, par la méthode de Fizeau — en divisant le nombre qui mesure la distance par le nombre qui mesure l’intervalle de temps, ils trouveront tous le même quotient.

Nous supposerons, dans tout ce qui suit, que tous les observateurs se servent des mêmes règles étalons et des mêmes horloges étalons.

15. Le groupe de Lorentz déduit de l’invariance de la vitesse de la lumière.

Soit un événement noté par les observateurs du système et noté par les observateurs du système en translation uniforme avec la vitesse par rapport à Nous nous proposons de chercher les fonctions satisfaisant aux relations suivantes :

Si l’on suppose la combinaison de l’espace et du temps homogène[4] (euclidienne), ces formules de transformation doivent s’appliquer quel que soit l’événement de référence ou

Cette hypothèse de l’homogénéité permet de trouver la forme des fonctions. Considérons trois événements (indices ), nous aurons

et, par suite :

équation fonctionnelle qui montre que est une fonction linéaire et homogène de ses arguments. Nous allons chercher les coefficients de ces relations.

Ces coefficients ne peuvent évidemment être fonctions que de la vitesse relative De plus, le principe de relativité exige que les formules donnant les en fonction des soient les mêmes que celles donnant en fonction des dans lesquelles serait simplement remplacé par

Adoptons la disposition d’axes précédemment adoptée. Prenons comme premier événement l’émission d’un signal lumineux en et à l’origine des temps, c’est-à-dire à l’instant où les axes des deux systèmes sont en coïncidence.

Au bout du temps pour l’observateur du système le signal lumineux a atteint la surface de la sphère du système

La vitesse de la lumière étant une constante universelle, pour l’observateur du système le signal lumineux est au bout du temps sur la sphère du système

Si sont les coordonnées d’un même appareil qui reçoit le signal lumineux (second événement), on a

Les lois des phénomènes ne devant pas changer quand on passe de à ou réciproquement, on a nécessairement et

(1-4)

La disposition d’axes que nous avons choisie exige que :

(2-4) quels que soient et on ait à la fois et
(3-4) » et » et
(4-4) » et » et

Les relations linéaires et homogènes qui donnent les en fonction des contiennent 16 coefficients fonctions de dont le nombre se réduit avec la disposition d’axes envisagée, car les conditions précédentes montrent que est indépendant de et indépendant de indépendant de De plus, la relation entre et doit être identique à celle entre et car les directions des axes et sont arbitraires et peuvent être permutées.

Il ne reste que 7 coefficients :

(5-4)

Posons la relation entre et ne devant pas dépendre du signe de on a de plus, la réciprocité entre et exige que d’où et

On a donc

(6-4)

D’après (2-4), pour , , par suite

et l’on a

(7-4)

En remplaçant dans l’identité (1-4) par leurs expressions données par (7-4), (6-4), (5-4), il vient

On en conclut que

(8-4)
(9-4)
(10-4)
(11-4)

De (10-4), on tire

(12-4)

portant cette valeur dans (9-4), il vient

(13-4)

et l’on en déduit, en portant cette valeur dans (11-4),

(14-4) en posant

(13-4) et (12-4) donnent ensuite

(15-4)

Finalement, les formules de transformation sont les suivantes :

(16-4) ou

Ce sont précisément les formules de Lorentz (no 11).

16. La mécanique doit être soumise aux lois de l’électromagnétisme.

Nous avons établi que les deux principes énoncés par Einstein :

1o Les lois des phénomènes physiques sont les mêmes dans tous les systèmes en translation uniforme les uns par rapport aux autres ;

2o Dans un même système, la vitesse de la lumière est indépendante de la direction et indépendante du mouvement de la source de lumière,

ont pour conséquence :

1o Que la vitesse de la lumière est une constante universelle ;

2o Que les transformations des coordonnées d’espace et de temps, quand on passe d’un système à un autre, sont les transformations du groupe de Lorentz ; on peut vérifier que ces transformations conservent leur forme aux équations du champ électromagnétique

Inversement, si l’on cherche, comme l’avait fait Lorentz, les formules de transformations qui laissent invariantes les équations de l’électromagnétisme, on obtient les formules (16-4) qui impliquent la constance de la vitesse de la lumière, et la relativité du temps. Nous sommes donc en présence de deux groupes de transformations :

1o Le groupe de Galilée, qui seul laisse invariante la forme des lois de la mécanique classique ;

2o Le groupe de Lorentz, qui seul laisse invariante la forme des lois de l’électromagnétisme.

Ces deux groupes sont incompatibles : le premier admet un temps universel ; le second implique un temps différent d’un système à un autre (4e équation du groupe de Lorentz).

Le désaccord qui s’est manifesté entre la théorie mécanique de l’expérience de Michelson et le résultat expérimental apparaît comme la conséquence d’un conflit entre les lois de la mécanique newtonienne et celles de l’électromagnétisme.

En effet, d’une part en conservant les notions anciennes d’espace et de temps exigées par la mécanique rationnelle, on devait prévoir un déplacement des franges dans l’expérience de Michelson.

D’autre part, on constate que les équations du champ électromagnétique ne conservent pas leur forme quand on leur applique le groupe de transformations de la mécanique, et qu’elles admettent un groupe différent ; la découverte de ce groupe est venu montrer que les équations de Maxwell contenaient implicitement l’explication de l’échec de toutes les tentatives faites pour révéler un mouvement absolu. Le résultat de Michelson, en particulier, est évident : si la vitesse de la lumière est constante, ainsi que l’exige le groupe de Lorentz, les franges doivent garder une position invariable.

L’expérience est donc d’accord avec le groupe de Lorentz, qui exprime l’invariance de forme des équations fondamentales de l’électromagnétisme. Cela est d’ailleurs logique et l’on devait s’y attendre : les lois de l’électromagnétisme ont été établies dans un système de référence qui n’est nullement privilégié dans l’Univers ; elles s’expriment sous une forme claire et simple, et deviendraient compliquées par une transformation différente de celle du groupe de Lorentz. Il serait déraisonnable de supposer que ces lois simples sont spéciales à un système de référence lié à la Terre : elles doivent avoir une portée générale, elles doivent être indépendantes du système de référence et, d’ailleurs, la preuve de leur invariance est le fait qu’elles ne se modifient pas dans le cours de l’année, malgré le changement du système de référence, la Terre changeant de direction sur son orbite.

Mais pourquoi ne pas conserver à la fois les lois de la mécanique classique avec le groupe de Galilée, et les lois de l’électromagnétisme avec le groupe de Lorentz ?

Cela est impossible : adopter le temps absolu de la mécanique, c’est renoncer à l’invariance des lois de l’électromagnétisme ; adopter le temps relatif de l’électromagnétisme, c’est abandonner la mécanique newtonienne, car il serait absurde de supposer deux temps, l’un absolu, l’autre relatif. Il y a bien incompatibilité radicale.

Il faut choisir, et l’hésitation n’est pas possible, car le choix est imposé par l’expérience. Les lois de l’électromagnétisme sont trop bien vérifiées pour qu’on puisse songer à les abandonner[5]. Quant aux lois de la mécanique, nous n’avons vraiment aucune raison de les considérer comme exactes ; elles paraissent valables dans les phénomènes ordinaires, trop grossiers pour qu’une discordance apparaisse ; mais, dès qu’il s’agit de phénomènes comportant une vérification d’une haute précision, le désaccord se révèle (expérience de Michelson).

Il faut donc renoncer à considérer les lois de la mécanique rationnelle comme des lois rigoureuses, et il faut soumettre la mécanique aux lois de l’électromagnétisme, en appliquant à tous les phénomènes les formules de transformation d’espace et de temps exprimées par le groupe de Lorentz[6]. Les lois classiques deviennent alors des approximations, d’ailleurs excellentes dans la plupart des cas ; on remarque, en effet, que si l’on fait dans les équations de Lorentz, on retrouve le groupe de Galilée.

On peut se servir de la mécanique classique tant que le carré de la vitesse des corps (vitesse par rapport à l’observateur) peut être négligé vis-à-vis du carré de la vitesse de la lumière.

On voit par là que le désaccord entre la mécanique classique et l’électromagnétisme n’est qu’un aspect du conflit profond qui a dominé la physique jusqu’à l’époque actuelle, le conflit entre la théorie des actions à distance instantanées admise en mécanique céleste jusqu’à la découverte de la loi de la gravitation d’Einstein, et la théorie de l’action de proche en proche avec vitesse finie, à laquelle Maxwell a donné son plein développement grâce à l’introduction du courant de déplacement.

Les équations de Maxwell entraînent la négation du temps absolu ; impliquant la notion de temps relatif, ces équations interdisent la possibilité d’une relation de cause à effet, quelle qu’elle soit, pouvant se propager avec une vitesse infinie.

En résumé, nous affirmons que « la seule cinématique ayant un sens expérimental et aussi grâce à laquelle les lois de la Physique prennent une forme simple, indépendante du système de référence, est la cinématique du groupe de Lorentz » (P. Langevin)[7].

Séparateur

  1. D’après Einstein, Ann. d. Physik, t. 17, 1905.
  2. Un semblable procédé est pratiquement employé pour la comparaison des heures des observatoires et la détermination des longitudes par la T. S. F.
  3. Raisonnement de M. Max Planck, Acht Vorlesungen über theoretische Physik, 1910, p. 118.
  4. C’est précisément cette hypothèse de l’homogénéité de l’espace-temps qui est à la base de la relativité restreinte, l’Univers considéré est euclidien ; nous verrons plus tard, dans la Théorie de la relativité généralisée, que cet Univers euclidien est l’Univers tangent à l’Univers réel.
  5. Nous verrons plus tard les vérifications expérimentales.
  6. Sous la réserve de la relativité restreinte, c’est-à-dire lorsque l’on considère seulement des systèmes en translation uniforme.
  7. Bulletin de la Société des Électriciens, no 84, décembre 1919.