Il est connu que si nous appliquons l'électrodynamique de Maxwell, telle que nous la concevons aujourd'hui, aux corps en mouvement, nous sommes conduits à une asymétrie qui ne s'accorde pas avec les phénomènes observés. Analysons par exemple l'influence mutuelle d'un aimant et d'un conducteur. Le phénomène observé dans ce cas dépend uniquement du mouvement relatif du conducteur et de l'aimant, alors que selon les conceptions habituelles, une distinction doit être établie entre les cas où l'un ou l'autre des corps est en mouvement. Si par exemple l'aimant se déplace et que le conducteur est au repos, alors un champ électrique d'une certaine énergie apparaît à proximité de l'aimant, ce qui engendre un courant dans les parties du champ où se trouve un conducteur. Mais si l'aimant est au repos et le conducteur mis en mouvement, aucun champ électrique n'apparaît à proximité de l'aimant, mais une force électromotrice qui ne correspond à aucune énergie en soi est produite dans le conducteur. Elle provoque cependant — dans l'hypothèse que le mouvement relatif dans les deux cas est le même — l'apparition d'un courant électrique de même intensité et de même direction que la force électrique, comme la force électrique dans le premier cas. Des exemples similaires, tout comme l'essai infructueux de confirmer le mouvement de la Terre relativement au « médium de la lumière » NdT 1, nous amène à la supposition que non seulement en mécanique, mais aussi en électrodynamique, aucune propriété des faits observés ne correspond au concept de repos absolu ; et que dans tous les systèmes de coordonnées où les équations de la mécanique sont vraies, les équations électrodynamiques et optiques équivalentes sont également vraies, comme il a été déjà montré par l'approximation au premier ordre des grandeurs. Dans le texte qui suit, nous élevons cette conjecture au rang de postulat (que nous appellerons dorénavant « principe de relativité ») et introduisons un autre postulat — qui au premier regard est incompatible avec le premier — que la lumière se propage dans l'espace vide NdT 2, à une vitesse V indépendante de l'état de mouvement du corps émetteur. Ces deux postulats suffisent entièrement pour former une théorie simple et cohérente de l'électrodynamique des corps en mouvement à partir de la théorie maxwellienne des corps au repos. Il sera démontré que l'introduction d'un « éther luminifère » est superflu, puisque selon les conceptions que nous développerons, nous n'introduirons ni un « espace absolument au repos » muni de propriétés spéciales et ni n'associerons un vecteur vitesse à un point où des phénomènes électromagnétiques se déroulent. Comme pour toute autre théorie électrodynamique, la théorie proposée s'appuie sur la cinématique des corps rigides. Dans la formulation de toute théorie, nous devons composer avec les relations entre les corps rigides (système de coordonnées), les horloges et les phénomènes électromagnétiques. Une appréciation insuffisante de ces conditions est la cause des problèmes auxquels se heurte présentement l'électrodynamique des corps en mouvement. § 1. Définition de la simultanéité Supposons un système de coordonnées dans lequel les équations newtoniennes sont vraies. Pour distinguer ce système d'un autre qui sera introduit plus tard, et pour rendre cette notion plus claire, nous l'appellerons le « système stationnaire ». Si un point matériel est au repos dans ce système de coordonnées, alors sa position dans ce système peut être trouvée grâce à une règle à mesurer NdT 3 en utilisant des méthodes en géométrie euclidienne, et exprimée en coordonnées cartésiennes. Si nous voulons décrire le mouvement d'un point matériel, les valeurs de ses coordonnées doivent être exprimées en fonction du temps. Il faut toujours garder en tête qu'une telle définition mathématique possède un sens physique, seulement si nous avons au préalable une perception claire de ce qu'est le « temps ». Nous devons prendre en considération le fait que nos conceptions, où le temps joue un rôle, portent toujours sur des évènements simultanés. Par exemple, si nous disons « qu'un train arrive ici à 7 heures », cela signifie « que la petite aiguille de ma montre qui pointe exactement le 7 et que l'arrivée du train sont des évènements simultanés » 1. Il peut sembler que toutes les difficultés provenant de la définition du « temps » peuvent être supprimées quand, au « temps », nous substituons « la position de la petite aiguille de ma montre ». Une telle définition est dans les faits suffisante, quand il est requis de définir le temps exclusivement à l'endroit où l'horloge se trouve. Mais elle ne suffit plus lorsqu'il s'agit de relier chronologiquement des évènements qui ont lieu à des endroits différents — ou ce qui revient au même —, d'estimer chronologiquement l'occurrence d'évènements qui surviennent à des endroits éloignés de l'horloge. Cependant, pour estimer chronologiquement les évènements, nous pouvons obtenir satisfaction en supposant qu'un observateur, placé à l'origine du système de coordonnées avec l'horloge, associe un signal lumineux — témoignant de l'évènement à estimer et du rayon lumineux qui vient à lui à travers l'espace — à la position correspondante des aiguilles de l'horloge. Cependant, une telle association a un défaut : elle dépend de la position de l'observateur qui observe l'horloge, comme l'expérience nous le dicte. Nous pouvons obtenir un résultat beaucoup plus pratique de la façon suivante. Si un observateur est placé en A avec une horloge, il peut assigner un temps aux évènements à proximité de A en observant la position des aiguilles de l'horloge, qui sont simultanées avec l'évènement. Si une horloge est aussi placée en B — nous ajoutons que cette horloge est de même construction que celle en A —, alors un observateur en B peut chronologiquement estimer les évènements qui surviennent dans le voisinage de B. Mais sans conventions préalables, il est impossible de comparer chronologiquement les évènements en B aux évènements en A. Nous avons jusqu'à maintenant un « temps A » et un « temps B », mais aucun « temps » commun à A et B. Ce dernier temps (c'est-à-dire le temps commun) peut être défini, si nous posons par définition que le « temps » requis par la lumière pour aller de A à B est équivalent au « temps » pris par la lumière pour aller de B à A. Par exemple, un rayon lumineux part de A au « temps A », tA, en direction de B, est réfléchi de B au « temps B », tB, et revient à A au « temps A », t'A. Par définition, les deux horloges sont synchronisées si . Nous supposons que cette définition du synchronisme est possible sans causer d'incohérence, peu importe le nombre de points. En conséquence les relations suivantes sont vraies : 1. Si l'horloge en B est synchronisée avec l'horloge en A, alors l'horloge en A est synchronisée avec l'horloge en B. 2. Si l'horloge en A est synchronisée à la fois avec l'horloge en B et avec l'horloge en C, alors les horloges en B et C sont synchronisées. Donc, à l'aide de certaines expériences physiques (de pensée), nous avons établi ce que nous entendons lorsque nous parlons d'horloges au repos à différents endroits, et synchronisées les unes avec les autres ; et nous avons par conséquent établi une définition de la « simultanéité » et du « temps ». Le « temps » d'un évènement est l'indication simultanée d'une horloge au repos située à l'endroit de l'évènement, qui est synchronisée avec une certaine horloge au repos dans tous les cas de détermination du temps. En accord avec l'expérience, nous ferons donc l'hypothèse que la grandeur est une constante universelle (la vitesse de la lumière dans l'espace vide). Nous venons de définir le temps à l'aide d'une horloge au repos dans un système stationnaire. Puisqu'il existe en propre dans un système stationnaire, nous appelons le temps ainsi défini « temps du système stationnaire ». § 2. Sur la relativité des longueurs et des temps Les réflexions suivantes s'appuient sur le principe de relativité et sur le principe de la constance de la vitesse de la lumière, les deux que nous définissons comme suit : 1. Les lois selon lesquelles l'état des systèmes physiques se transforme sont indépendantes de la façon que ces changements sont rapportés dans deux systèmes de coordonnées (systèmes qui sont en mouvement rectiligne uniforme NdT 4 l'un par rapport à l'autre). 2. Chaque rayon lumineux se déplace dans un système de coordonnées « stationnaire » à la même vitesse V, la vitesse étant indépendante de la condition que ce rayon lumineux soit émis par un corps au repos ou en mouvement. Donc, où « intervalle de temps » doit être compris tel que défini au § 1. Soit une tige rigide au repos ; elle est d'une longueur l quand elle est mesurée par une règle au repos. Nous supposons que l'axe de la tige se confond avec l'axe des x du système stationnaire. Imprimons à la tige une vitesse uniforme v, parallèle à l'axe des x et dans la direction croissante des x. Quelle est la longueur de la longueur de la tige en mouvement ? Elle peut être obtenue de deux façons : a) L'observateur pourvu de la règle à mesurer se déplace avec la tige à mesurer et mesure sa longueur en superposant la règle sur la tige, comme si l'observateur, la règle à mesurer et la tige sont au repos. b) L'observateur détermine à quels points du système stationnaire se trouvent les extrémités de la tige à mesurer au temps t, se servant des horloges placées dans le système stationnaire (les horloges étant synchronisées comme décrit au § 1). La distance entre ces deux points, mesurée par la même règle à mesurer quand elle était au repos, est aussi une longueur, que nous appelons la « longueur de la tige ». Selon le principe de relativité, la longueur trouvée par l'opération a), que nous appelons la « longueur de la tige dans le système en mouvement », est égale à la longueur l de la tige dans le système stationnaire. La longueur trouvée par l'opération b) peut être appelée la « longueur de la tige (en mouvement) dans le système stationnaire ». Cette longueur est à calculer en s'appuyant sur nos deux principes, et nous découvrirons qu'elle diffère de l. Dans la cinématique généralement utilisée, il est implicitement supposé que les longueurs définies par ces deux opérations sont égales ou, dit autrement, qu'à un moment donné t, une tige rigide en mouvement est géométriquement remplaçable par un même corps, quand il est au repos à un endroit précis. Supposons de plus que deux horloges synchronisées avec des horloges dans le système stationnaire sont fixées aux extrémités A et B d'une tige, c'est-à-dire que les temps des horloges correspondent aux « temps du système stationnaire » aux points où elles arrivent ; ces horloges sont donc « synchronisées dans le système stationnaire ». Imaginons encore qu'il y a deux observateurs auprès des deux horloges qui se déplacent avec elles, et que ces observateurs appliquent le critère de synchronisme du § 1 aux deux horloges. Au temps 2 2 tA, un rayon lumineux va de A, est réfléchi par B au temps tB et arrive à A au temps t'A. Prenant en compte le principe de la constance de la vitesse de la lumière, nous avons , et , où rAB est la longueur de la tige en mouvement, mesurée dans le système stationnaire. En conséquence, les observateurs qui se déplacent avec la tige en mouvement n'affirmeront pas que les horloges sont synchronisées, même si les observateurs dans le système stationnaire témoigneront que les horloges sont synchronisées. Nous en concluons que nous ne pouvons pas attacher une signification absolue au concept de simultanéité. Dès lors, deux évènements qui sont simultanés lorsque observés d'un système ne seront pas simultanés lorsque observés d'un système en mouvement relativement au premier. § 3. Théorie de la transformation des coordonnées et du temps d'un système stationnaire à un autre en mouvement relatif uniforme comparativement au premier Plaçons, dans le système « stationnaire », deux systèmes de coordonnées, c'est-à-dire deux séries de trois axes rigides (mutuellement perpendiculaires) tous issus d'un point NdT 5. Faisons coïncider l'axe des x de chacun des systèmes et mettons en parallèle les axes des y et des z. Soit une règle rigide et un certain nombre d'horloges dans chaque système, les tiges et les horloges dans chacun étant identiques. Soit un point initial de l'un des systèmes (k) animé d'une vitesse (constante) v dans la direction croissante de l'axe des x de l'autre système, un système stationnaire (K), et la vitesse étant aussi communiquée aux axes, aux tiges et aux horloges dans le système. N'importe quel temps t du système stationnaire K correspond à une position certaine des axes du système en mouvement. Pour des raisons de symétrie, nous pouvons affirmer que le mouvement de k est tel que les axes du système en mouvement au temps t (par t, nous entendons le temps dans le système stationnaire) sont parallèles aux axes du système stationnaire. Supposons que l'espace est mesuré par la règle immobile placée dans le système stationnaire K, tout comme par la règle en mouvement placée dans le système en mouvement k, nous avons donc les coordonnées x, y, z et ξ, η, ζ, respectivement. De plus, mesurons le temps t à chaque point du système stationnaire grâce aux horloges qui sont placées dans le système stationnaire, à l'aide de la méthode des signaux lumineux décrite au § 1. Soit aussi le temps τ dans le système en mouvement qui est connu pour chaque point du système en mouvement (dans lequel se trouvent des horloges qui sont au repos dans le système en mouvement), grâce à la méthode des signaux lumineux entre ces points (positions où se trouvent des horloges) décrit au § 1. Pour chacun des ensembles de valeurs x, y, z, t qui indique complètement la position et le temps de l'évènement dans le système stationnaire, il existe un ensemble de valeurs ξ, η, ζ, τ dans le système k. Maintenant, le problème est de trouver le système d'équations qui relie ces valeurs. Premièrement, il est évident que, en s'appuyant sur la propriété d'homogénéité que nous attribuons au temps et à l'espace, les équations doivent être linéaires. Si nous posons x' = x - vt, alors il est évident que pour un point au repos dans le système k, il y a un système de valeurs x', y, z indépendant du temps. Premièrement, trouvons τ comme fonction de x', y, z, t. À cet effet, nous devons exprimer en équations le fait que τ n'est nul autre que le temps donné par les horloges au repos dans le système k qui doivent être synchronisées selon la méthode décrite au § 1. Soit un rayon lumineux envoyé au temps τ0 de l'origine du système k selon l'axe des x dans la direction croissante de x' et qui est réfléchi de cet endroit au temps τ1 vers l'origine des coordonnées, où il arrive au temps τ2. Alors, nous avons Si nous introduisons comme condition que τ est une fonction des coordonnées, et appliquons le principe de la constance de la vitesse de la lumière dans le système stationnaire, nous avons Il s'ensuit donc, lorsque x' est infiniment petit : ou Notons qu'au lieu de l'origine des coordonnées, nous pourrions choisir n'importe quel autre point comme point de départ pour les rayons lumineux, et en conséquence l'équation ci-dessus est vraie pour toutes les valeurs de x', y, z. Une approche semblable appliquée aux axes des y et des z donne, quand nous prenons en compte le fait que la lumière se propage toujours le long de ces axes à une vitesse lorsque observée depuis le système stationnaire, ces équations : Puisque est une fonction linéaire, il suit de ces équations que où a est une fonction inconnue φ(v) et pour des raisons de concision, il est fait l'hypothèse qu'à l'origine de k, t = 0 lorsque τ = 0. À l'aide de ces résultats, il est facile d'obtenir les grandeurs ξ, η, ζ, si nous exprimons (en équations) le fait que la lumière (lorsque mesurée dans le système en mouvement) se propage toujours à la vitesse constante V (tel que requis par le principe de la constance de la vitesse de la lumière et le principe de la relativité). Pour un rayon envoyé dans la direction croissante de ξ au temps τ = 0, nous avons ou Cependant, le rayon lumineux se déplace relativement à l'origine de k à une vitesse V-v, mesurée dans le système stationnaire. En conséquence, nous obtenons . Remplaçant ces valeurs de t dans l'équation de ξ, nous obtenons D'une façon analogue, si les rayon lumineux se déplacent selon les deux autres axes, nous avons où et donc et Si pour x', nous substituons sa valeur, nous obtenons où et φ est encore une fonction inconnue de v. Si nous ne faisons aucune hypothèse sur la position initiale du système en mouvement et sur le point sans dimension τ, alors une constante additive doit être ajoutée du côté droit de l'équation. Nous devons démontrer que tout rayon lumineux se déplace dans le système en mouvement à une vitesse V (telle que mesurée dans le système en mouvement) si, comme nous en avons déjà fait l'hypothèse, V est aussi la vitesse dans le système stationnaire. En effet, nous n'avons pas encore présenté une quelconque preuve que le principe de la constance de la vitesse de la lumière est compatible avec le principe de relativité. Au temps τ = t = 0, soit une onde sphérique émise depuis l'origine commune des deux systèmes de coordonnées, onde qui se propage à une vitesse V dans le système K. Si (x, y, z) est un point atteint par l'onde, alors À l'aide de nos équations de transformations, faisons la transformation de cette équation. Par un simple calcul nous avons En conséquence, l'onde se propage dans le système en mouvement à la même vitesse V, comme une onde sphérique. Donc, nous avons démontré que les deux principes sont mutuellement compatibles. Par les transformations, nous avons obtenu une fonction indéterminée φ de v, que nous allons maintenant déterminer. Dans ce but, introduisons un troisième système de coordonnées K' , qui est en mouvement relatif par rapport au système k, le mouvement étant parallèle à l'axe des Ξ de façon à ce que la vitesse de l'origine soit -v par rapport à l'axe des Ξ. Au temps t = 0, toutes les coordonnées des points initiaux coïncident, et pour t = x = y = z = 0, le temps t' du système K' = 0. Si nous posons que x', y', z' sont les coordonnées mesurées dans le système K' , alors par une double application des équations de transformations, nous obtenons Puisque les relations entre x', y', z' et x, y, z ne comprennent pas explicitement le temps t, K et K' sont donc relativement au repos. Il apparaît clairement que la transformation de K à K' doit être identique. D'où Nous sommes prêt à calculer φ(v). Portons notre attention sur la partie de l'axe des y du système k entre ξ = 0, η = 0, ζ = 0 et ξ = 0, η = 1, ζ = 0. Couvrons cette partie de l'axe des y avec une tige qui se déplace à une vitesse v relativement au système K et perpendiculairement à son axe. Les extrémités de la tige ont donc comme coordonnées dans K : et En conséquence, la longueur de la tige mesurée dans le système K est l / φ(v). Donc, la signification de φ est connue. Pour des raisons de symétrie, il est maintenant évident que la longueur (mesurée dans le système stationnaire) d'une certaine tige qui se déplace perpendiculairement à son axe, peut seulement dépendre de sa vitesse, mais pas de la direction et du sens du mouvement. Donc, la longueur de la tige en mouvement, telle que mesurée dans le système stationnaire, ne change pas si v est remplacé par -v. Nous avons donc : ou De ceci et des relations trouvées plus haut, il suit que φ(v) = 1. Donc, les équations de transformations deviennent : où § 4. La signification physique des équations obtenues pour les corps rigides et les horloges en mouvement Supposons une sphère rigide 3 de rayon R qui est au repos relativement au système k et dont le centre coïncide avec l'origine de K, alors l'équation de la surface de cette sphère, qui se déplace à une vitesse v relativement à K, est : Au temps t = 0, l'équation de cette surface s'exprime en fonction de x, y, z par Un corps rigide, qui montre la forme d'une sphère quand mesuré dans un système stationnaire, a en conséquence dans des conditions de mouvement — lorsqu'observé depuis le système stationnaire —, la forme d'un ellipsoïde de révolution dont les demi-axes mesurent Alors que les dimensions en y et z de la sphère (ou de n'importe quel autre solide) ne semblent pas modifiées par le mouvement, la dimension en x est raccourcie selon le rapport  ; le raccourcissement est d'autant plus grand que la vitesse v est grande. Pour v = V, tous les corps en mouvement, lorsqu'observés depuis un système stationnaire, se réduisent à des plans. Pour une vitesse supraluminique, nos propositions sont dénuées de sens. Par ailleurs, dans les observations qui suivent, nous découvrirons que la vitesse de la lumière joue le rôle physique d'une vitesse infiniment grande. Il est évident que des résultats semblables sont vrais pour des corps au repos dans un système stationnaire lorsqu'ils sont observés depuis un système en mouvement rectiligne uniforme. Soit une horloge immobile dans le système stationnaire qui donne le temps t, et qui donne le temps τ lorsqu'immobile dans un système en mouvement. Supposons qu'elle se trouve à l'origine du système en mouvement k et réglée pour donner le temps τ. À quelle cadence avance cette horloge, lorsqu'observée du système stationnaire ? À partir des grandeurs x, t et τ, qui réfèrent à l'endroit de cette horloge, les équations sont données par et D'où . Donc, l'horloge retarde de secondes (lorsqu'observée du système stationnaire) par seconde ou, en négligeant les approximations du quatrième ordre et supérieurs, secondes. De ceci découlent des conséquences remarquables. Supposons qu'en deux points A et B de K, lorsqu'observées depuis le système stationnaire, se trouvent deux horloges synchronisées. Supposons que l'horloge en A est mise en mouvement à la vitesse v sur une ligne qui rejoint B, alors lorsqu'elle arrive à B, les deux ne seront plus synchronisées, mais l'horloge qui s'est déplacée de A à B aura un retard sur l'horloge toujours demeurée en B de la quantité secondes (en négligeant les approximations du quatrième ordre et supérieurs), où t est le temps pris pour accomplir le déplacement de A à B. Nous voyons immédiatement que ce résultat est également vrai quand l'horloge se déplace de A à B en suivant une ligne polygonale, et aussi quand A et B coïncident. Si nous faisons l'hypothèse que le résultat obtenu pour une ligne polygonale est également vrai pour une ligne courbe, nous obtenons le théorème suivant : Si à A, il y a deux horloges synchronisées et si nous déplaçons l'une d'elles à une vitesse constante selon une courbe fermée qui revient à A, le déplacement étant complété en t secondes, alors à son arrivée à A, cette dernière retardera de secondes sur l'horloge immobile. En s'appuyant sur ce résultat, nous concluons qu'une horloge à balancier placée à l'équateur doit être plus lente par une très petite quantité qu'une autre identique placée à l'un des pôles, les autres conditions étant identiques. § 5. Théorème d'addition des vitesses Soit un point en mouvement dans le système k (qui se déplace à une vitesse v parallèlement à l'axe des x du système K) qui respecte les équations où wξ et wη sont des constantes. Trouvons le mouvement du point relativement au système K. Si nous insérons les grandeurs x, y, z, t dans les équations du mouvement en utilisant les équations de transformation du § 3, nous obtenons La règle du parallélogramme pour les vitesses est seulement vraie pour l'approximation au premier ordre. Nous écrivons donc et c'est-à-dire que α est égal à l'angle entre les vitesses v et w. Alors, après un simple calcul, nous avons On observe que v et w sont introduits dans l'expression de la vitesse de façon symétrique. Si w est aussi dans la direction de l'axe des x du système en mouvement, nous avons De cette égalité, il découle que la combinaison de deux vitesses, chacune étant plus petite que V, donne une vitesse toujours plus petite que V. Si nous posons v = V - ϰ et w = V-λ, où ϰ et λ sont chacune positive et plus petite que V, alors Il est également évident que la vitesse de la lumière V ne peut être modifiée en lui ajoutant une valeur plus petite. Dans ce cas, nous obtenons Nous avons déduit la formule pour U dans le cas où v et w sont dans la même direction ; elle peut aussi être calculée en combinant deux transformations selon la section § 3. Si en plus des systèmes K et k du § 3, nous introduisons un troisième système k' (qui se déplace parallèlement à k), dans lequel le point initial se déplace parallèlement à l'axe des Ξ à une vitesse w, alors entre la grandeurs x, y, z, t et les grandeurs correspondantes de k' , nous obtenons un système d'équations différent des équations au § 3, en substituant à v cette grandeur Nous observons qu'une telle transformation parallèle forme (comme il se doit) un groupe. Nous avons déduit la cinématique qui correspond à nos deux principes fondamentaux pour les lois qui nous sont nécessaires, et nous passons maintenant à leur application en électrodynamique. § 6. Transformation des équations de Maxwell-Hertz dans un espace vide. Sur la nature de la force électromotrice induite par le mouvement dans un champ magnétique Les équations de Maxwell-Hertz dans un espace vide devraient être vraies dans un système stationnaire K, d'où où (X, Y, Z) est le vecteur de la force électrique et (L, M, N), de la force magnétique. Si nous appliquons les transformations du § 3 à ces équations et si nous ramenons les processus électromagnétiques au système de coordonnées (introduit à cet endroit) se déplaçant à une vitesse v, nous avons où Le principe de relativité exige que les équations de Maxwell-Hertz dans un espace vide soient vraies dans le système k, si elles sont vraies dans le système K, c'est-à-dire que, pour les vecteurs des forces électriques et magnétiques ((X', Y', Z') et (L', M', N')) qui influencent les masses électriques et magnétiques du système en mouvement k, qui sont définies par leurs réactions pondéromotrices, les équations sont vraies, Évidemment, les deux systèmes d'équations (2) et (3) développés pour le système k devraient exprimer les mêmes choses, puisque ces deux systèmes sont équivalents aux équations de Maxwell-Hertz du système K. Puisque les deux systèmes d'équations (2) et (3) coïncident jusqu'aux symboles représentant les vecteurs, il suit que les fonctions apparaissant aux places correspondantes coïncident au facteur ψ(v) près, qui dépend peut-être de v et est indépendant de ξ, η, ζ, τ. D'où les relations, Maintenant, si la réciproque de ce système d'équations est formée, premièrement en résolvant les équations que nous venons d'obtenir, deuxièmement en appliquant les équations à la transformation inverse (de k à K), qui a comme caractéristique la vitesse -v, il suit, en sachant que les deux systèmes d'équations ainsi calculés doivent être identiques : Toujours pour des raisons de symétrie 4e4 d'où et nos équations prennent la forme En ce qui concerne l'interprétation de ces équations, nous déclarons ceci. Soit une masse ponctuelle d'électricité d'une grandeur unitaire dans le système stationnaire K, c'est-à-dire, dans ce système stationnaire, qu'elle exerce une force de 1 dyne sur un objet similaire placé à une distance de 1 cm. En vertu du principe de relativité, cette masse électrique mesure aussi une grandeur « unité » dans le système en mouvement. Si cette masse électrique est au repos dans le système stationnaire, alors la force exercée sur elle est équivalente au vecteur de la force électrique (X, Y, Z). Mais si cette masse électrique est au repos dans le système en mouvement (du moins au moment où elle est observée), alors la force qui s'exerce sur elle et mesurée dans le système en mouvement est équivalente au vecteur (X', Y', Z'). La première des trois systèmes d'équations (1), (2) et (3) s'exprime alors comme suit : 1. Si une masse ponctuelle et unitaire d'électricité se déplace dans un champ électromagnétique, alors en plus de la force électrique, une « force électromotrice » agit sur elle, qui, en négligeant les termes de second ordre et supérieurs de v/V, est équivalente au produit vectoriel de la vitesse de la masse ponctuelle et de la force magnétique divisé par la vitesse de la lumière. (Ancien mode d'expression.) 2. Si une masse ponctuelle et unitaire d'électricité se déplace dans un champ électromagnétique, alors la force qui agit sur elle est équivalente à la force électrique qui existe à la position de la masse unitaire, que nous obtenons par la transformation du champ en un système de coordonnées qui est au repos relativement à la masse électrique unitaire. (Nouveau mode d'expression.) Des théorèmes semblables faisant appel aux « forces magnétomotrices » sont vrais. Dans la théorie exposée, nous observons que la force électromagnétique joue un rôle auxiliaire, qui doit son introduction à la circonstance que les forces électrique et magnétique n'existent pas indépendamment de la nature du déplacement dans le système de coordonnées. De plus, il est clair que l'asymétrie, mentionnée dans l'introduction et qui apparaît quand nous discutons du courant engendré par le déplacement relatif d'un aimant et d'un conducteur, disparaît. Également, la question de l'« origine » des forces électromotrices électromagnétiques (machine homopolaire) perd tout son sens. § 7. Théorie du principe de Doppler et de l'aberration Supposons une source d'ondes électromagnétiquesNdT 6 dans le système K à une grande distance de l'origine, modélisée avec une bonne approximation dans une partie de l'espace qui contient l'origine par les équations : Ici (X0, Y0, Z0) et (L0, M0, N0) sont les vecteurs qui déterminent l'amplitude du train d'ondes et (a, b, c) sont les cosinus directeurs des normales à l'onde. Questionnons-nous sur la composition de ces ondes, quand elles sont observées par un observateur au repos dans le système en mouvement k. En appliquant les équations de transformation obtenues au § 6 pour les forces électrique et magnétique, et les équations de transformation obtenues au § 3 pour les coordonnées et le temps, il vient immédiatement : où De l'équation donnant ω' , il résulte que si un observateur se déplace à une vitesse v relativement à une source lumineuse située à une distance infinie qui émet des ondes d'une fréquenceν, de telle façon que la ligne qui joint la source de la lumière et l'observateur fait un angle φ avec la vitesse de l'observateur rapportée à un système de coordonnées qui est stationnaire en regard de la source, alors la fréquence ν' perçue par l'observateur se calcule par la formule : C'est le principe de Doppler pour toute vitesse. Si φ = 0, alors l'équation prend une forme plus simple : Nous observons que — contrairement à la conception courante — si v = -V, alors ν' = ∞NdT 7. Si φ' est l'angle entre la normale de l'onde (direction du rayon) dans le système en mouvement et le segment « source-observateur lumière », l'équation pour a' prend la forme Cette équation exprime la loi de l'aberration sous sa forme la plus générale. Si φ = π/2, alors elle prend la forme simple : Nous devons toujours trouver l'amplitude des ondes qui apparaissent dans le système en mouvement. Si A et A' sont les forces (électrique et magnétique) mesurées dans les systèmes stationnaire et en mouvement, nous avons Si φ = 0, alors elle se réduit à la forme simple En s'appuyant sur ces équations, il semble que pour un observateur, qui se déplace à la vitesse V vers la source de lumière, cette source lui apparaîtra infiniment intense. § 8. Transformation de l'énergie des rayons lumineux. Théorie de la pression de radiation exercée sur un miroir parfait Puisque A2/8π est égal à l'énergie de la lumière par unité de volume, nous devons (selon le principe de relativité) considérer A'2/8π comme l'énergie de la lumière dans le système en mouvement. En conséquence, A'2/A2 définit le rapport entre les énergies d'un complexe de lumière NdT 8 borné « mesuré lorsqu'en mouvement » et « mesuré lorsque stationnaire », les volumes du complexe de lumière mesurés dans K et k étant égaux. Or, ce n'est pas le cas. Si a, b, c sont les cosinus directeurs des normales à l'onde lumineuse dans le système stationnaire, alors aucune énergie ne traverse les éléments de la surface sphérique qui se déplace à la vitesse de la lumière. Nous pouvons donc affirmer que cette surface contient toujours le même complexe de lumière. Analysons la quantité d'énergie que cette surface renferme, quand elle est observée du système k, c'est-à-dire l'énergie du complexe de lumière relativement au système k. Observée depuis le système en mouvement, la surface sphérique devient ellipsoïdale et respecte, au temps τ = 0, l'équation : Si S désigne le volume de la sphère et S' le volume de cet ellipsoïde, alors un simple calcul montre que Si E représente l'énergie lumineuse mesurée dans le système stationnaire et E' l'énergie mesurée dans le système en mouvement, bornées par les surfaces décrites plus haut, alors Si φ = 0, nous obtenons une formule plus simple : Remarquons que l'énergie et la fréquence du complexe de lumière varient selon la même loi que l'état de mouvement de l'observateur. Soit un parfait miroir réfléchissant dans le plan de coordonnées ξ=0, à partir duquel l'onde plane étudiée dans le paragraphe précédent est réfléchie. Demandons-nous quelle pression de radiation s'exerce sur la surface réfléchissante, ainsi que la direction, la fréquence et l'intensité de la lumière après la réflexion. Soit la lumière incidente définie par les grandeurs A, cos φ, ν (dans le système K). Observées de k, nous avons les grandeurs correspondantes : Pour la lumière réfléchie, nous obtenons, quand le phénomène est observé du système k : En appliquant une transformation inverse au système stationnaire K, nous obtiendrons pour la lumière réfléchie : L'énergie qui tombe sur une unité de surface du miroir par unité de temps (mesurée dans le système stationnaire) est évidemment (A2 / 8 π) (V cos φ - v). La quantité d'énergie qui en rayonne par unité de surface du miroir par unité de temps est (A''' 2 / 8 π) (-V cos φ''' + v). La différence entre ces deux expressions est, selon le principe de l'énergie, la quantité de travail accomplie par la pression de radiation par unité de temps. Si nous la posons égale à P.v, où P est la pression de radiation, nous avons Par l'approximation au premier ordre, nous obtenons qui est en accord avec les observations et d'autres théories. Tous les problèmes d'optique des corps en mouvement peuvent être résolus en appliquant les méthodes exposées ici. Le point crucial est que toutes les forces électriques et magnétiques de la lumière, qui sont influencées par un corps en mouvement, devraient être transformées dans un système de coordonnées stationnaire relativement au corps. De cette façon, tous les problèmes optiques de corps en mouvement seraient réduits à une suite de problèmes d'optique de corps au repos. § 9. Transformations des équations de Maxwell-Hertz en ce qui concerne les courants de convection Commençons par ces équations : où indique 4π fois la densité de l'électricité et (ux, uy, uz) est le vecteur vitesse de l'électricité. Si nous supposons que les masses électriques sont liées de façon permanente à de petits corps rigides (ions ou électrons, par exemple), alors ces équations forment le fondement électromagnétique de l'électrodynamique et de l'optique des corps en mouvement de Lorentz. Si ces équations, vraies dans le système K, sont transformées pour le système k à l'aide des équations de transformations données aux § 3 et § 6, alors nous obtenons les équations : où Puisque le vecteur (uξ, uη, uζ) n'est rien d'autre que la vitesse de la masse électrique mesurée dans le système k, qui est une conséquence du théorème d'addition des vitesses du § 5, alors il est démontré que, en prenant notre principe cinématique comme base, le fondement électromagnétique de la théorie de Lorentz de l'électrodynamique des corps en mouvement correspond au principe de relativité. Nous pouvons brièvement remarquer qu'une loi importante découle aisément des équations développées : si un corps électriquement chargé se déplace de quelque façon que ce soit dans l'espace et si sa charge est invariable, quand observée depuis un système qui se déplace de la même façon, alors la charge demeure constante même si elle observée depuis le système stationnaire K. § 10. Dynamique de l'électron (lentement accéléré) Supposons qu'une particule ponctuelle qui possède la charge électrique ε (que nous appellerons dorénavant « électron ») se déplace dans un champ électromagnétique. Nous faisons l'hypothèse suivante pour sa loi de déplacement. Si l'électron est au repos à une période de temps bien définie, alors pendant la prochaine parcelle de temps, le mouvement respecte les équations où x, y, z sont les coordonnées de l'électron et μ sa masse, du moment qu'il se déplace lentement. Supposons que l'électron se déplace à une vitesse v à une certaine période de temps. Analysons les lois selon lesquelles l'électron se déplacera pendant la parcelle de temps qui suit immédiatement. Sans modifier la portée générale de notre discussion, nous pouvons et ferons l'hypothèse que, au moment que nous analysons, l'électron est à l'origine du système de coordonnées, puis se déplace à la vitesse v selon l'axe des x du système K. Il est évident qu'à ce moment (t=0), l'électron est au repos relativement au système k, qui se déplace parallèlement à l'axe des x à la vitesse constante v. À partir des hypothèses faites plus haut, en association avec le principe de relativité, il est évident qu'observé depuis le système k, l'électron — pendant la parcelle de temps immédiatement consécutive (pour une petite valeur de t) — se déplace selon les équations où les symboles ξ, η, ζ, τ, X', Y', Z' se rapportent au système k. Si nous fixons t = x = y = z = 0 et τ = ξ = η = ζ = 0, alors les équations de transformation données aux §§ 3 et 6 sont vraies. Nous avons : À l'aide de ces équations, nous pouvons transformer les équations du mouvement plus haut du système k au système K et obtenir : Questionnons-nous, suivant la méthode habituelle de calculs, sur les masses longitudinale et transversale d'un électron en mouvement. Nous réécrivons les équations (A) sous la forme et observons tout de suite que εX', εY', εZ' sont les composantes de la force pondéromotrice qui agit sur l'électron et sont considérées dans un système en mouvement qui, à ce moment, se déplace à la même vitesse que l'électron. (Cette force peut, par exemple, être mesurée par une balance à ressort au repos dans ce système.) Si nous appelons brièvement cette force la « force qui agit sur l'électron », et continuons avec cette équation : Valeur de la masse × valeur de l'accélération = Valeur de la force, et si nous définissons de plus que les accélérations sont mesurées dans le système stationnaire K, alors à partir des équations plus haut, nous obtenons : Naturellement, quand la force et l'accélération sont définies autrement, d'autres valeurs sont obtenues pour la masse. Donc, nous voyons que nous devons procéder avec beaucoup de précautions lorsque nous comparons différentes théories du mouvement de l'électron. Observons que ce résultat sur la masse est également vrai pour une masse de matière pondérable ; parce qu'un point matériel pondérable peut être converti en électron (pour nos sens) en lui ajoutant une charge électrique aussi petite que l'on veut. Déterminons maintenant l'énergie cinétique d'un électron. Si l'électron se déplace à partir de l'origine des coordonnées d'un système K à la vitesse initiale de 0 de façon régulière selon l'axe des x sous l'action d'une force électrostatique X, alors il est évident que l'énergie tirée du champ électrostatique est la valeur ∫ εX dx. Puisque l'électron devrait être accéléré lentement et donc qu'aucune énergie n'est perdue sous la forme de radiation, alors l'énergie tirée du champ électrostatique doit égaler l'énergie W du déplacement. Considérant l'ensemble du phénomène de mouvement à l'étude, la première des équations de (A) est vraie. Nous avons : Lorsque v=V, W est infiniment grand. Comme nos résultats antérieurs le montrent, toute vitesse supraluminique est impossible. En tant que conséquence des arguments écrits plus haut, cette expression pour l'énergie cinétique doit aussi être vraie pour les masses pondérables. Nous sommes à même d'énumérer les caractéristiques du mouvement des électrons qui peuvent être vérifiées expérimentalement, lesquelles découlent du système d'équations (A). 1. De la deuxième équation en (A), il découle qu'une force électrique Y et une force magnétique N produisent la même déflexion d'un électron se déplaçant à la vitesse v quand Y = N.v/V. En conséquence, nous voyons qu'il est possible de mesurer la vitesse d'un électron en calculant le rapport de la déflexion magnétique Am et de la déflexion électrique Ae, en accord avec notre théorie pour toute vitesse arbitraire, en appliquant la loi : Cette relation peut être testée expérimentalement car la vitesse de l'électron peut être directement mesurée à l'aide, par exemple, de champs électriques et magnétiques oscillant rapidement. 2. À partir de la valeur de l'énergie cinétique de l'électron, il suit que si ce dernier subit une différence de potentiel P, cette dernière est liée à la vitesse v par la relation suivante : 3. Nous calculons le rayon de courbure R du chemin, où la force magnétique N est la seule force de déflexion qui agit perpendiculairement à la vitesse de projection. De la seconde équation en (A), nous obtenons : ou Ces trois relations expriment complètement la loi du mouvement de l'électron selon la théorie exposée plus haut. En terminant, je tiens à souligner que mon ami et collègue M. Besso m'a prêté son concours pendant que je travaillais au problème discuté ici, et que je lui suis redevable de suggestions précieuses. Berne, juin 1905 (Reçu le 30 juin 1905.)