L’Électrodynamique et la théorie des quanta

Free texts and images.
Jump to: navigation, search
L’Électrodynamique et la théorie des quanta
written by Jacques Solomon
1931
  • L’ÉLECTRODYNAMIQUE ET LA THÉORIE DES QUANTA
  • Thèse de doctorat pour obtenir le grade de docteur ès sciences physiques


  • SOMMAIRE.

— Le but de ce travail a été de perfectionner la théorie quantique du champ électromagnétique, en particulier en ce qui concerne l’énergie du rayonnement au zéro absolu.

Dans un premier chapitre, on étudie les modifications que la théorie des quanta fait subir à la notion de champ électromagnétique, et l’on montre comment on est amené à constituer une théorie quantique hamiltonienne du champ. Le chapitre suivant est consacré à l’étude de la difficulté de l’énergie du rayonnement au zéro absolu à laquelle amène la généralisation habituelle de la théorie de Maxwell. On est conduit à modifier la fonction de Hamilton du rayonnement pur, en introduisant pour définir le champ des combinaisons complexes des champs électrique et magnétique. Les nouvelles équations de Hamilton sont équivalentes aux équations de Maxwell et d’une façon générale la nouvelle théorie se distingue très peu de la théorie classique, la différence tendant vers zéro avec la constante de Planck. Les chapitres suivants développent les conséquences de cette théorie.

Tout d'abord on montre comment celle-ci permet une étude particulièrement simple de la question des fluctuations du rayonnement noir et de la formule d’Einstein à laquelle elle aboutit. On aborde ensuite la question de l’interaction entre les ondes électromagnétiques et le champ de gravitation auquel elles donnent lieu. Enfin le dernier chapitre est consacré à l’étude de l’interaction du champ électromagnétique et de la matière. On y montre comment s’écrivent les équations de Maxwell avec courant de convection.


  • INTRODUCTION

I1 semble à première vue que le titre « L’Electrodynamique et la théorie des quanta » doive embrasser tout le domaine de cette dernière science. Mais une observation attentive des recherches qui ont été faites dans ces dernières années sur ce sujet montre que pour la plupart elles se con tentent d’adapter à la théorie des quanta un certain nombre de données de l’électrodynamique classique, sans trop se soucier de les mettre d’accord. C’est ainsi qu’on obtient une théorie correcte de l’effet Compton en introduisant dans les équations de Dirac les solutions des équations de Maxwell, et qu’une grande partie des résultats de la mécanique quantique est basée sur la notion de moment électrique. Que les succès de ces méthodes aient dépassé tout ce qu’on pouvait espérer, c’est ce qu’il serait vain de nier. Mais on peut essayer d’aller plus au fond des choses, et de constituer une théorie cohérente de la matière et de la radiation, qui rende compte à la fois de l’action de la radiation sur la matière et de l’action de la matière sur la radiation. Tel est le but de la théorie quantique des champs. Certes, il ne faut pas se dissimuler que dans l’état actuel de la précision expérimentale, les corrections qu’elle peut apporter à la théorie antérieure sont très faibles (1) ; il s’agit donc surtout d’une question de principes. Or c’est là justement que cette théorie a rencontré de très grosses difficultés, qui ont pu faire douter certains de la possibilité d’une théorie basée sur les notions actuelles de radiation et de matière. On obtient en effet, pour le rayonnement comme pour la matière une énergie infinie en dehors de toute interaction. C’est à l’étude de la première de ces difficultés qu’est consacré le présent travail. Nous espérons avoir montré que, au moins dans les cas que nous avons étudiés, il n'est pas impossible d’obtenir un résultat correct simplement en modifiant la théorie, en se laissant guider par l’analogie si féconde entre matière et lumière. C’est un fait très remarquable que, quoique la grandeur fondamentale de la mécanique ondulatoire soit une probabilité,

  • (1) Une telle théorie permettrait par exemple de prévoir la structure fine de l’hélium.

ce n’est pas celle-ci qui intervient clans les équations, mais une « amplitude de probabilité» psi, telle que la probabilité soit psi*psi(étoile). On montre alors que cette grandeur complexe n’est pas observable. Au contraire, dans l’électrodynamique, les équations de Maxwell font intervenir directement les champs E et H, qui sont des grandeurs observables. L'on sait d’autre part que, d’après Heisenberg, il est impossible de mesurer simultanément la position et la vitesse d’un électron. Comme E et H sont définis précisément au moyen d’un électron, et si l’on tient compte de ce principe fondamental de la théorie des quanta, de n’utiliser que des grandeurs qui soient effectivement mesurables, nous sommes conduits à admettre que E et H ne peuvent être mesurés simultanément.

Comme nous le montrons alors au chapitre premier, ceci nous conduit immédiatement à la théorie de quantification des champs dont nous espérons avoir montré ainsi la nécessité. Nous discutons ensuite certaines critiques qui ont été émises à l’égard de la légitimité de la notion de champ en matière de théorie des quanta et nous sommes ainsi conduits à poursuivre le parallélisme entre matière et lumière qui comme nous venons de le voir, se montre ici défaillant.

Dans le chapitre II, nous développons cette idée et introduisons des grandeurs complexes non mesurables pour définir le champ. La théorie se développe suivant la méthode hamiltonienne et permet d’éviter un premier écueil de la théorie antérieure : l’énergie infinie du rayonnement au zéro absolu. Nous indiquons ensuite la correspondance entre nos nouvelles grandeurs et les champs E, H. Cette correspondance permet de vérifier la très grande analogie de notre théorie avec la théorie classique : mêmes équations de Maxwell, même vecteur de Poynting, etc. A la fin de ce chapitre nous développons quelques conséquences du fait que nos nouvelles grandeurs de champ ne sont pas observables, conséquences qui permettent de croire que la théorie des quanta doit procéder à un certain renoncement à la description du champ électromagnétique en termes de fonctions d’espace et de temps.

Dans le chapitre III est indiquée une des principales applications de cette théorie quant au rayonnement pur : c’est la théorie des fluctuations. Notre théorie permet de donner pour la première fois une démonstration correcte et particulièrement simple de la formule d’Einstein par la méthode ondulatoire. Une autre application, relative à l'interaction entre ondes électromagnétiques et ondes gravitationnelles y est rapidement indiquée. Nous espérons revenir prochaine ment sur cette question.

Dans le chapitre IV est abordée la question de l’interaction entre électrons et rayonnement. Nous montrons comment doit se faire le raccord entre les équations de Dirac (pour la matière) et les équations de Hamilton (pour le rayonnement).

On est conduit ainsi à écrire les équations de Maxwell avec courant de convection. Si les relations ne donnent rien de plus que la théorie d’Heisenberg et Pauli et conduisent en particulier au paradoxe de l’énergie électrostatique infinie de l’électron, peut-être est-il permis de penser que la pos session d’une théorie entièrement correcte du rayonnement, sans interaction avec la matière, pourra être utile dans l’étude de ces profondes difficultés.

  • (1) Un résumé de cette théorie a été publié, en collaboration avec L. Rosenfeld dans le Journal de Physique : (1931). p. 139.

Voir aussi : L. Rosenfeld et J. Solomon. Naturwissenschaften (1931), p. 376. Je suis heureux d’exprimer à mon ami L. Rosenfeld tous mes remerciements pour les nombreuses discussions qui ont été pour beaucoup dans l’élaboration de ce travail.


CHAPITRE PREMIER

La notion de champ électromagnétique et la théorie des quanta.


  • 1. Les relations d’incertitude dans la mécanique de l’électron (1).

— Après la découverte fondamentale de Heisenberg et Bohr qu’il est impossible de mesurer simultanément deux grandeurs conjuguées, en particulier la position et la quantité de mouvement d’un électron ou son énergie et l’instant auquel on la mesure, l'interprétation physique de ce résultat est restée assez longtemps hésitante. Certains ont proclamé la faillite du déterminisme. Mais l’interprétation actuelle en est qu’il s’agit seulement de la mise en évidence d’un défaut de notre représentation, de l’incapacité de nos modèles : onde ou corpuscule à se mouler sur le comporte ment des phénomènes observés expérimentalement. Tout phénomène peut être représenté d’une façon plus ou moins compliquée dans le langage ondulatoire ou dans le langage corpusculaire. Les difficultés connues sous le nom de principe d’indétermination ou d’incertitude se présentent lorsqu’on associe les deux représentations. On avait cherché en effet depuis longtemps à « réaliser », à se donner une représentation simultanée de Tonde et du corpuscule : singularité d’une onde par exemple, mais l’évolution de la théorie des quanta a montré rapidement, que ce n’était pas là qu’il fallait chercher la solution de ce dualisme onde- corpuscule, mais que ces deux représentations s’excluaient mutuellement, indiquant deux aspects différents, complémentaires comme le dit Bohr, des phénomènes.

  • (1) W. Heisenberg. Physikalische Prinzipien der Quantentheorie (1930) ; N. Bohr. Atomteori og Ndtarbeskrivelse (1929).

Prenons par exemple le cas de la relation entre une coordonnée q et son moment conjugué p (relation de Heisenberg proprement dite). Dans ce cas, la coordonnée q est quelque chose qui n’a de sens que dans une représentation corpusculaire.

Au contraire la quantité de mouvement p (ou la longueur d’onde de de Broglie correspondante), sont définies dans la représentation ondulatoire, et la célèbre relation de Heisenberg

delta(p)*delta(q) >= (h/(2*Pi))

correspond simplement au fait que, pour représenter par une superposition d’ondes une particule se trouvant à un endroit bien déterminé, il est nécessaire d’utiliser une très large échelle de Fréquences. Nous n’insisterons pas davan tage sur le cas de l’électron isolé, et nous passerons de suite à l’étude du champ électromagnétique et de sa signification dans la théorie des quanta.


  • 2. Les relations d’incertitude dans le champ électromagnétique.

— Comme nous venons de le voir, on peut dans un certain sens dire que la mécanique quantique procède d’un renoncement à la description causale spatio-temporelle des phénomènes de la nature. Cette tendance doit avoir de profondes répercussions sur la conception que nous nous faisons du champ électromagnétique.

Cette conception qui dans le domaine du microscopique reste toujours un guide si fécond, s’est avérée impuissante à saisir le lien entre 1 aspect continu et l’aspect discontinu du rayonnement.

Depuis Faraday, la notion de champ électromagnétique s’est formée à l’image de l’hydrodynamique théorique et le génie de Maxwell n'a fait que formuler une correspondance entre un certain formalisme mathématique et l’idée intuitive de champ, c’est-à-dire d’une région de l’espace « déformée», contenant en puissance les actions auxquelles serait soumis un petit corps d’épreuve. Si les champs électriques et magnétiques sont définis dans la théorie classique au moyen des forces auxquelles est soumis un petit corps d’épreuve placé en un point de l’espace, cette propriété est rapportée à l’espace lui-même.

On dit non plus que le corpuscule est soumis à une force e*E au point 0, mais qu’il existe au point de l’espace 0 un champ électrique E. La théorie classique rapporte donc les forces auxquelles est soumis le corps d’épreuve à l’espace qui entoure le point géométrique qu’il occupe. Cette définition suppose évidemment que l’on puisse considérer un corps d’épreuve arbitrairement petit et d’autre part que l’on puisse négliger la réaction de la charge sur le champ. Cette dernière condition implique, jointe à la précédente, que la densité électrique du corps d’épreuve reste finie à la limite.

Enfin cette conception postule la permanence de cette déformation, c’est-à-dire qu’elle existe constamment virtuelle ment sans qu’il soit nécessaire de faire appel au corps d’épreuve.

La théorie des quanta consistant en la limitation des notions classiques par une analyse plus profonde de la définition des grandeurs en tenant compte des limitations qu’apporte la structure discontinue de l’électricité et de l’énergie, il est évident que les notions précédentes doivent être soumises à une révision. Si l’on considère par exemple, que la force électrique à laquelle est soumise une particule ne dépend pas de la vitesse de celle-ci, alors que la force magnétique en dépend, et si l’on considère d’autre part, qu’il est impossible de mesurer simultanément très exactement, la position et la vitesse de la particule, on comprend aisément qu’il soit impossible de mesurer simultanément toutes les grandeurs caractérisant le champ électromagnétique au point où se trouve la particule.

Ainsi sans calcul, nous sommes amenés à supposer qu’il doit exister certaines relations d'incertitude entre les différentes composantes du tenseur électromagnétique. Si maintenant nous considérons comme il est logique de le faire, ces composantes comme des opérateurs appliqués a la fonction d’onde, nous sommes amenés à penser que, étant donné que la mécanique quantique déduit du fait que deux grandeurs ne sont pas permutables, qu’elles ne sont pas observables simultanément avec une précision illimitée, on peut retourner le raisonnement et supposer que ces différentes composantes ne sont pas permutables entre elles. Nous allons donc nous proposer de chercher la forme de ces différentes relations de permutation, relations qui mettront donc en accord la notion de champ électromagnétique classique avec la notion d’électron. Une telle théorie, où les champs seront soumis à des conditions de quantification supplémentaires (1), constitue la théorie de quantification des champs, qui a été développée, d’ailleurs à partir de bases différentes, par Dirac, Pauli, Jordan, Heisenberg.

Mais il y a plus et ici se place une remarque fondamentale qui ne semble pas avoir suffisamment attiré l’attention de ceux qui ont étudié cette question. C’est que ces conditions supplémentaires de quantification doivent en même temps concilier les représentations d’onde lumineuse et de photons.

Depuis Debye, en effet on a pu envisager l’existence des photons comme résultant d’une quantification des ondes électromagnétiques.

Si nous considérons une onde plane monochromatique de fréquence nu, l’énergie qu’elle transporte doit être un multiple entier de h*nu. Prenons maintenant un rayonnement quelconque, décomposons-le par l’analyse de Fourier en ondes monochromatiques planes qui seront chacune quantifiée de la façon que je viens d’indiquer; recomposons ces ondes, nous devons obtenir une condition de quantification pour le rayonnement résultant, condition qui s’exprimera naturelle ment par des conditions de permutation portant sur les différentes composantes du tenseur électromagnétique.

  • (1) En allemand "Uberquantelung"

Nous sommes donc en présence de deux interprétations des relations d’incertitude dans le champ électromagnétique : l’une ne fait appel qu’aux propriétés de ce champ lui-même, l’autre utilise les propriétés des électrons. Et nous devons demander à notre théorie que les deux définitions concordent. Nous allons voir qu’il n’en est ainsi que dans une certaine mesure. Mais nous avions voulu auparavant attirer l’attention sur cette double interprétation, qui n’existe pas pour les ondes matérielles.

Passons maintenant à la première interprétation des relations d’incertitude : celle électromagnétique pure. D’après la théorie électromagnétique classique, l’énergie et la quantité de mouvement correspondant à un élément de volume (epsilon)^3 d’un champ sans matière sont :

E(ronde)=((epsilon^3)/2)*(E^2 + H^2), G(ronde)=((epsilon^3)/c)*[vecteur(E).vecteur(H)] (2)

Heisenberg remarque (1) alors, que si l’on fait tendre epsilon vers zéro, il en est de même pour E(ronde) et G(ronde) et ce qui est en contradiction absolue avec la notion de quanta de lumière, puisque E(ronde) et G(ronde) sont composés respectivement de quanta h*nu et h*nu/c. Comme la longueur d’onde la plus petite que l’on puisse mettre en évidence dans le volume epsilon^3 est lambda=epsilon, il s’ensuit que h*nu <= h*c/epsilon. Donc les expressions de E(ronde) et G(ronde) doivent être entachées d’incertitudes h*c/epsilon et h/epsilon respectivement pour ne pas être en contradiction avec la notion de quanta de lumière. Soit alors delta(E), delta(H) les incertitudes sur le champ électrique et le champ magnétique :

  • (1) Heisenberg. Loc. cit., p. 37.

delta(E(ronde)) = ((epsilon^3)/2)*[2*|E*delta(E)| + 2*|H*delta(H)| + ((delta(E))^2) + ((delta(H))^2)]

(3)

delta(G(ronde)_x) = ((epsilon^3)/c)*[|[E*delta(H)]_x| + |[delta(E)*H]_x| + |[delta(E)*delta(H)]_x|]

(4)

Supposons maintenant que les valeurs les plus probables de E et H soient nulles, ce qui correspond à l’étude des fluctuations dans un espace vide de radiations :

delta(E(ronde)) = ((epsilon^3)/2)*[(delta(E))^2 + (delta(H))^2]

delta(G(ronde)_x) = ((epsilon^3)/c)*|[delta(E)*delta(H)]_x|

(5)

La seconde relation s’écrit :

delta(G(ronde)_x) = ((epsilon^3)/c)*[delta(E_y)*delta(H_z) - delta(E_z)*delta(H_y)]

Par raison de symétrie, on peut affecter de la même erreur les termes du second membre et comme delta(G(ronde)_x)=h/epsilon, on en déduit :

|delta(E(ronde)_y).delta(H_z)| >= 2*h*c/epsilon^4 (6)

et les relations analogues, qu’on en déduit par permutation circulaire. Remarquons d’ailleurs, que dans le cas qui nous occupe, le champ ne diffère du vide que par la présence d’un quantum au plus. On a alors :

delta(E(ronde)) = c*|delta(G(ronde))| ,

et la relation d’incertitude étant vérifiée pour delta(G(ronde)) l’est par suite aussi pour delta(E(ronde)). La notion de photon nous a donc conduit à la relation d’incertitude (6).

Heisenberg indique ensuite une expérience se rapportant à la seconde interprétation et que je vais reproduire ici en la simplifiant un peu. Pour mesurer E_y et H_z dans le cube epsilon^3 limité par des faces perpendiculaires aux axes, faisons passer un faisceau d’électrons dans ce volume, leurs vitesses avant l’entrée dans le cube étant parallèles à Ox. Le volume epsilon^3 est supposé suffisamment petit pour que les champs puissent y être considérés comme constants. Après la traversée de l’élément de volume, le faisceau est dévié de :

[e*(E_y + (p/m*c)*(H_z))*epsilon*m/p]/p,

p étant la quantité de mouvement des électrons le long de Ox. Par suite de la dispersion des électrons (due à l’existence d’une longueur d’onde de L. de Broglie), la précision des mesures de E_x et H_z est entachée d’erreurs données par :

delta(E_y) >= (h*p)/((epsilon^2)*e*m); delta(H_3) >= (h*c)/((epsilon^2)*e).

(7)

Mais ce n’est pas la seule cause d’erreur. Les électrons modifient par leur passage le champ électromagnétique dans le cube, donc la trajectoire des autres électrons, modification d’ailleurs imprévisible, puisque l’on ne sait pas où se trouvent les électrons dans le cube, d’où les erreurs :

delta(E_y) >= e/(epsilon^2); delta(H_3) >= (e*p)/((epsilon^2)*m*c).

(8)

Les erreurs étant indépendantes, on obtient l’erreur sur delta((E_y)^2) en ajoutant les carrés des limites précédentes, de même pour delta((H_z)^2) et en multipliant :

delta((E_y)^2).delta((H_z)^2) >= (1/(epsilon^8)*[(h^2)*(p^2)/(e^2)*(m^2) + (e^2)]*[(h^2)*(c^2)/(e^2) + (e^2)*(p^2)/(m^2)*(c^2)]

(9)

Cette expression dépend de p et l’on obtient sa valeur minima en y faisant p = o, d’où :

delta(E_y).delta(H_z) >= (h*c)/(epsilon^4)

(10)

c'est-à-dire le même résultat que précédemment, faisons tout de suite remarquer que cette limite s’obtient par le produit d'un terme dû à l'action électronique et d'un terme de dispersion.

Tout récemment, Jordan et Fock (1) ont proposé une autre expérience idéale qui, distinction essentielle comme nous allons le voir, utilise un électron isolé. Prenons par exemple la mesure de (E_y).

Nous lançons un électron de vitesse initiale connue dans la direction 0y et nous mesurons son augmentation de vitesse après parcours du segment epsilon autour du point O:

e*E_y = m*(delta(v_y)/delta(t))

Mais d'après la relation fondamentale de Heisenberg epsilon et delta(v_y) ne peuvent être connus simultanément qu’avec des erreurs reliées par :

m*delta(delta(v_y))*epsilon >= h

d'où

delta(E_y) >= (h/e)*(1/epsilon*delta(t))

(11)

et deux autres relations analogues pour E_x et E_z. De même, la considération du mouvement d’un électron dans un champ magnétique leur donne très simplement :

delta(H_z) >= ((h*c)/e)*(1/(epsilon^2))

(12)

Nous reviendrons plus loin sur ces relations prisés isolé- ment. En les multipliant, on a :

delta(E_y).delta(H_z) >= ((h^2)*(c^2)/(e^2))*(1/(epsilon^3)*(delta(t)))

(13)

(1) P. Jordan et V. Fock. Z. Physik., 66 (193o), p. 206-210 .

Jordan et Fock supposent enfin, que l'on prenne pour delta(t) un intervalle correspondant à epsilon/c , d’où :

delta(E_y).delta(H_z) >= ((h^2)*(c^2)/(e^2))*(1/(epsilon^4))

(14)

Si nous comparons cette relation à (12) nous voyons qu’elles diffèrent par le facteur (e^2)/(h*c), c’est-à-dire alpha/(2*Pi), alpha étant la constante de la structure fine de Sommerfeld, et Jordan et Fock terminent en émettant l’hypothèse que seule une théorie qui rendra compte de la nature et de la valeur de la constante de Sommerfeld, permettra de rendre compte de la discordance entre ces deux résultats.

Je crois qu’en réalité la question est plus simple et nous allons voir, que la discordance tient d’une part à l’emploi d’un électron isolé d’autre part à une hypothèse (implicite chez Jordan et Fock) sur la vitesse de l’électron. Si en effet, nous reprenons la théorie de l’expérience de Heisenberg, nous voyons que deux erreurs interviennent, la première de dispersion électronique, la seconde d’influences mutuelles des électrons. Dans le cas de l’expérience de Jordan et Fock, seule la première cause subsiste et comme elle est à l’origine de la condition (1) de Heisenberg, il est naturel de penser qu’on doive obtenir le même résultat et c’est bien ce que l’on vérifie.

En supprimant dans (9) les seconds termes des parenthèses, on obtient :

delta(E_y).delta(H_z) >= (1/(epsilon^4)*[((h^2)*p*c)/((e^2)*m)],

qu’on peut encore obtenir directement par multiplication des relations (7) et qui est identique à la formule (13) de Jordan et Fock si l’on pose :

p/(m*epsilon) = 1/(delta(t))

qui est évidemment vérifiée. Mais la formule ainsi obtenue est en 1/((epsilon^3)*(delta(t))) alors que la formule définitive de Heisenberg est en 1/(epsilon^4). Pour faciliter la comparaison, Jordan et Fock posent implicitement du reste) :

delta(t) = epsilon/c

Or delta(t) est le temps mis par l'électron observé pour parcourir le segment epsilon. C’est donc poser que la vitesse de l’électron est égale à la vitesse de la lumière. D’ailleurs, ils montrent que leurs formules (tirées de la théorie électromagnétique classique) s’appliquent encore lorsque la vitesse de l’électron est très voisine de celle de la lumière. Cette hypothèse n’est pas nécessaire, mais on est guidé pour la faire par la théorie de l’électron magnétique de Dirac, qui donne comme on le sait pour la vitesse de l’électron :

dx/dt = lim (epsilon -> 0, delta(t) -> 0) epsilon/(delta(t)) = -c*alpha,

où alpha est une matrice ayant +1 et —1 pour valeurs caractéristiques. Dans ces conditions, on peut remarquer qu’il est logique pour comparer l’expérience de Heisenberg et celle de Jordan et Fock de poser dans la formule (11) relative à la première expérience :

p = m*c.

On trouve alors :

delta(E_y).delta(H_z) >= ((h^2)*(c^2)/(e^2) + (e^2))*(1/(epsilon^4)).

Le second terme se montre négligeable devant le premier et on tombe sur une formule identique à celle de Jordan et Fock. Remarquons que le terme ainsi négligé provient justement des interactions entre électrons. Nous voyons ainsi d’où provient la différence entre les résultats de Heisenberg et de Jordan et Fock. C'est sur la vitesse des électrons utilisés, que porte la difficulté. La précision limite donnée par la méthode électronique pour le produit delta(E_y).delta(H_z) dépend de la vitesse des électrons utilisés, alors qu’évidemment par la méthode électromagnétique pure, celle-ci n’intervient pas.

Cette vitesse est comprise entre 0 et c. Si on la pose égale à zéro, la méthode de Heisenberg donne le même résultat que la méthode électromagnétique, tandis que la méthode de Jordan et Fock donne un résultat différent. Au contraire, pour v = c, les méthodes de Heisenberg et de Jordan et Fock concordent mais le résultat commun est différent de celui donné par la théorie électromagnétique pure.

Cette dernière théorie donne en effet une limite inférieure 863 fois plus petite que les expériences précitées. En rétablissant dans les formules de l'expérience de Heisenberg la même valeur de la vitesse des électrons que dans la théorie de Jordan et Fock, nous croyons-avoir évité le paradoxe qu’il y avait à voir une expérience avec un électron donner un résultat bien moins précis qu’une expérience avec de nombreux électrons.

Remarquons encore, que si nous tenons compte du facteur (8*Pi) que nous avons négligé précédemment dans les relations (6) et (10), on trouve que les trois méthodes donnent le même résultat pour une vitesse électronique voisine de 10^9, donc pas très éloignée de celle de la lumière. Ceci peut faire penser que les trois méthodes devraient donner le môme résultat en prenant c pour la vitesse des électrons et que s’il n’en est pas ainsi, cela tient à ce que les formules utilisées pour indiquer l’action du champ sur les électrons ne sont pas rigoureuses. Il n’en est pas moins vrai que les formules que nous possédons actuellement font entrer en jeu la charge élémentaire e seulement dans l’interaction du champ avec les électrons, nullement dans le champ sans charges libres, de telle sorte que si l’idée que nous présentons est correcte, e doit finalement disparaître dans le résultat des expériences électroniques, comme nous avons vu que cela arrivait dans l'expérience de Heisenberg avec v = o.

A ce propos on vérifierait facilement le caractère accidentel de cette disparition en remarquant qu’elle n’est pas invariante par une transformation de Lorentz.

Il est encore possible d’envisager la question sous un autre aspect : on peut en effet se demander si l’expérience de Jordan et Fock est théoriquement possible, s’il est possible de suivre un électron déterminé (1). Mais les données manquent actuellement pour discuter la question.

Jordan et Fock vont plus loin dans le travail que nous venons de citer. Portons en effet notre attention sur les relations isolées (11) et (12) de Jordan et Fock. On a par exemple :

delta(E_x) >= (h/e)*(1/(epsilon*delta(t)))

Si nous voulons préciser de plus en plus l’endroit et l’instant auxquels nous mesurons E_x, nous diminuons de plus en plus epsilon et delta(t). Dans ces conditions, delta(E_x) grandit de plus en plus et à la limite pour un point géométrique et un instant déterminé, delta(E_x) est infini. Toute définition expérimentale du champ électromagnétique est donc impossible et l’on sait qu’une des idées directrices de la théorie actuelle des quanta est de n’utiliser que des grandeurs qu’il est effectivement possible de mesurer (directement ou non).

A vrai dire une considération plus attentive des relations (11) et (12) de Jordan et Fock y montre quelque chose de peu satisfaisant; la charge e du corps d’épreuve y figure au dénominateur, de sorte que la précision sur la mesure de E serait d’autant plus grande que la charge du corps d’épreuve est plus grande, ce qui est évidemment absurde. Nous touchons là à ce qu’il y a d’erroné dans le raisonnement de ces auteurs :

  • (1) Voir à ce sujet les intéressantes remarques de Bridgman, Science, 71 (1930), p. 19.

C’est que lorsqu’on diminue indéfiniment epsilon, on n’a plus le droit de négliger la réaction du rayonnement sur l’électron, de sorte que la conclusion n’est plus valable. Finalement, nous en arrivons à penser, que nous n’obtiendrons la solution satisfaisante du problème, que lorsque nous aurons une formulation correcte des équations d’interaction entre électrons et rayonnement, et nous sommes conduits à nous fier exclusivement aux relations d’incertitude (6), qui procèdent de la conception électromagnétique pure de ces relations.

Nous n’insisterons donc pas davantage sur les moyens (1) que l’on pourrait proposer pour éviter des conclusions pessimistes telles que celles-ci : La notion de champ disparaîtrait au point de vue microscopique comme y disparaissent (à une échelle plus grande) les notions de densité ou de fonction H de Boltzmann. La physique actuelle est basée

  • (1) L'idée la plus simple et qui a été proposée par différents auteurs (Wataghin, Ruark, Ambarzumian et Iwanenko, etc...) est de supposer qu’il existe une longueur minima perceptible, qui sera la « longueur fondamentale de la théorie des quanta » h/m*c = 2.10^(-10) cm. ; le minimum de distance dans le temps perceptible sera en conséquence h/(m*c^2). Mais on voit aisément que cela ne simplifie pas beaucoup le problème. En portant les valeurs précédentes de epsilon et delta(t) dans (11) et (12), on trouve pour limite inférieure à l'erreur sur E_x, la valeur (m^2)*(c^3)/(e*h) = 10^13, absolument énorme par rapport aux forces interatomiques.

Il est peut-être curieux de remarquer que cette quantité (m^2)*(c^3)/(e*h) correspond à une différence de potentiel de m*c^2 répartie sur la distance h/m*c, donc en rapport direct avec le paradoxe bien connu de Klein. Mais une telle notion ne peut évidemment être mise en accord avec l’invariance relativiste et, comme celle-ci reste le guide le plus sûr dans toutes ces questions, l’idée que nous venons de présenter n’a pas grande chance de donner des résultats intéressants.

La physique actuelle est basée sur l’emploi de fonctions de point (1). Il faudrait pour le champ électromagnétique ne plus considérer que des fonctions de domaine ne pouvant se résoudre en fonctions de point. Comme nous le verrons au chapitre suivant, une étude plus attentive du parallélisme entre les propriétés de la matière et de la radiation, nous permettra d’éviter ces paradoxes.


  • 3. La théorie de la quantification des champs.

La conception précédente a son expression mathématique dans la théorie de la quantification des champs développée en dernier lieu par Heisenberg, et Pauli. Dans cette théorie, l’aspect ondulatoire est marquée par le fait, que l’état d’un système est indiqué par une amplitude de probabilité qui satisfait à une équation de propagation du type de Broglie-Schrödinger :

(H — E)*Phi = 0.

Quant à l’aspect corpusculaire, on le retrouve en soumet tant les différentes variables dont dépend Phi à des conditions supplémentaires de quantification. C’est ainsi que la fonction d’onde habituelle qui caractérise la matière, devra être soumise à une quantification telle que le nombre d’électrons qui occupent un état donné soit un nombre entier. On retrouve ainsi, à partir d’un principe général de quantification des ondes électroniques, l’existence d’électrons au sens classique, c'est-à-dire de corpuscules électrisés ayant une individualité.

Dans la théorie générale de quantification des champs, on cherche à opérer de même sur le champ en le soumettant à des conditions de quantification desquelles on déduira l’existence des photons.

  • (1) Lebesgue. Leçons sur l'intégration, 2e édition, p. 290.

On peut même aller plus loin, et indiquer une méthode de quantification générale indépendante de la nature du champ considéré, qui pourra cire par exemple le champ de gravitation. Comme nous aurons à nous en servir constamment, je crois utile de le rappeler le plus brièvement possible.

L’idée essentielle de toute la théorie est de se laisser guider le plus étroitement possible par la théorie bien connue de la mécanique quantique, pour le cas du point matériel.

Considérons un système continu défini par un certain nombre de fonctions d’espace et de temps Q alpha. Les équations différentielles auxquelles satisfont les Q alpha sont supposées dériver d’un principe de variation :

delta*sum(L(Q_alpha, d(Q_alpha)/dx_i, (Q_alpha)')*dv*dt = 0

où L est la fonction de Lagrange du système et où:

(Q_alpha)' = d(Q_alpha)/d(ct)

Posons (1):

L(barre) = sum(L*dv)

Si l’on considère alors le moment conjugué de Q alpha:

P_alpha = dL/d((Q_alpha)')

et l’on définit la fonction de Hamilton par :

H(P_alpha, Q_alpha, d(Q_alpha)/dx_i) = sum_alpha(P_alpha*(Q_alpha)') - L

et les équations de Hamilton s’écrivent :

(Q_alpha)'(x) = delta(H(barre))/delta(P_alpha(x)) ; (P_alpha)'(x) = - delta(H(barre))/d(Q_alpha(x)) ;

(1) Dans tout ce qui suit, on aura A(barre) = sum(A*dv).

où le symbole delta/delta(P_alpha)(x) désigne la dérivée fonctionnelle (1) par rapport à P a prise au point x. On montre ensuite que H(barre) (lorsqu’elle ne contient pas le temps explicitement) est une intégrale du mouvement, et qu’il en est de même de l’impulsion :

S_K = - sum(sum_alpha(d(Q_alpha)/dx_k)*P_alpha*dv, K = 1,2,3,...

Dans tout ceci nous n’avons pas introduit la notion de quanta.

Il faut maintenant trouver les relations de permutation entre les Q et les P. Pour cela, on généralise les relations bien connues de Heisenberg pour la théorie du point matériel et l’on trouve :

[Q_alpha(x), Q_beta(x')] = 0, [P_alpha(x), P_beta(x')] = 0 ; [P_alpha(x), Q_beta(x')] = [P_alpha(x), Q_beta(x')] = c*delta(alpha,beta)*delta(x,x') ;

où x et x' représentent deux points de l’espace. Le symbole (2)

[A,B] = (2*Pi*i/h)*(AB — BA).

delta(alpha,beta) est le symbole bien connu de Weierstrass, et delta(x, x') est la fonction singulière de Dirac défini par :

sum(sum(sum_V(f(x'_1,x'_2,x'_3)*delta(x, x')*dv' = f(x_1,x_2,x_3)

si le point (x_1,x_2,x_3) est dans V',

0 dans le cas contraire.

(1) Rappelons que cette dérivée fonctionnelle est définie par :

delta(H(barre))/delta(P_alpha(x)) = lim [H(barre)(P_alpha + delta(P_alpha)) - H(barre)(P_alpha)]/(sum(delta(P_alpha)*dv))

(2) Dans ce qui suit [A X B] représentera le produit vectoriel des vecteurs A et B.

La fonction delta(x_1 - x'_1) à une seule dimension est définie par les relations suivantes :

sum_a_b(f(x)*delta(x)*dx) = f(0)

si a*b < 0 ;

0 dans le cas contraire.

On peut montrer qu’il est possible de dériver, d’intégrer par parties, etc.., le symbole delta(x).

Au moyen de ces relations, on met les équations de Hamilton, sous la forme particulièrement commode :

c*(Q_alpha)' = [H(barre), Q_alpha] ; c*(P_alpha)' = [H(barre), P_alpha] ;

Ces relations permettent de montrer que H(barre) et S_K sont des intégrales du mouvement en mécanique quantique.

Pour les relations de permutation qui précèdent, on a raisonné à temps constant. Deux grandeurs P, Q se rapportant à des instants différents, même très voisins, sont permutables. Evidemment, de telles relations n’ont aucune raison à priori de rester invariantes par une transformation de Lorentz. Nous supposerons donc que notre fonction de Lagrange présente ce caractère, et nous allons prouver qu’il en sera de même pour les crochets en question. Le calcul, qui est très compliqué, s’opère par substitution directe. On trouve que les crochets sont des intégrales du mouvement.

Si donc, à l'instant t = 0, ils ont une certaine valeur, ils la conservent pour tout instant t > 0.


  • 4. Quelques opérateurs dérivant de l’opérateur Laplacien (1).

— Nous utiliserons fréquemment dans ce qui suit plusieurs opérateurs provenant de la linéarisation ou de l’inversion de l’opérateur laplacien classique :

delta = d^2/d(x^2) + d^2/d(y^2) + d^2/d(z^2)

  • (1) L. Landau et R. Peierls. Z. Physik, 62, (1930), p. 188.

Considérons pour cela une fonction Phi(x,y,z) définie par son expression en intégrale de Fourier :

Phi(x,y,z) = sum(phi(K_x, K_y, K_z)*exp(i((K_x)*x + (K_y)*y + (K_z)*z))*dK_x*dK_y*dK_z (15)

D’une façon générale, le résultat de l'opération delta^n (où n est un nombre entier ou moitié d'entier quelconque) sera défini par :

delta^n(Phi(x,y,z)) = (-1)^n*sum(((K_x)^2 + (K_y)^2 + (K_z)^2))^n)*phi(K_x, K_y, K_z)*exp(i((K_x)*x + (K_y)*y + (K_z)*z))*dK_x*dK_y*dK_z

Posons :

sqrt((K_x)^2 + (K_y)^2 + (K_z)^2)) = |K|

Nous noterons comme particulièrement importants pour ce qui va suivre les deux cas particuliers suivants :

sqrt(delta)*Phi(x,y,z) = i*sum(|K|*phi(K_x, K_y, K_z)*exp(i((K_x)*x + (K_y)*y + (K_z)*z))*dK_x*dK_y*dK_z (1/sqrt(delta))*Phi(x,y,z) = i*sum((phi(K_x, K_y, K_z)/|K|)*exp(i((K_x)*x + (K_y)*y + (K_z)*z))*dK_x*dK_y*dK_z

On peut remarquer par ailleurs que la définition des opérateurs précédents est indépendante de la décomposition en intégrale de Fourier. C'est seulement une représentation commode de ces opérateurs. D'après le théorème de Fourier, en effet :

phi(K_x, K_y, K_z) = sum(Phi(x',y',z')*exp(-i*((K_x)*x' + (K_y)*y' + (K_z)*z')*dx'*dy'*dz' ,

d’où en substituant dans (16) par exemple :

(1/sqrt(delta))*Phi(x,y,z) = -i*sum(sum(Phi(x',y',z')/|K|)*exp(i*((K_x)*(x-x') + (K_y)*(y-y') + (K_z)*(z-z')) *dx'*dy'*dz'*dK_x*dK_y*dK_z

et en effectuant la seconde intégration :

(1/sqrt(delta))*Phi(x,y,z) = -(i/(2*Pi^2))*sum(Phi(x',y',z')/((x-x')^2 + (y-y')^2 + (z-z')^2)*dx'*dy'*dz' ,

qui rentre dans le cadre des représentations intégrales des opérateurs linéaires. Cette expression se généralise facile ment au cas d’un opérateur delta^n quelconque. il est intéressant de remarquer sur (17), que ces opérateurs sont invariants vis-à-vis du groupe des rotations.

Ces opérateurs se prêtent à de nombreuses combinaisons avec les opérateurs rotationnel et divergence. Nous allons examiner rapidement les principales d’entre elles.

Considérons d’abord l’expression :

C = (A/(sqrt(delta)))*B - A*(B/(sqrt(delta)) = i*sum(sum(exp(i*(vecteur(K-K').vecteur(x))/|K| [a(K)*b(-K') - a(-K')*b(K)]*dK_x*dK_y*dK_z*dK_x'*dK_y'*dK_z'

Formons maintenant :

C(barre) = sum(C*dx*dy*dz)

en remarquant que :

sum(exp(i((vecteur(K)-vecteur(K')).vecteur(x))*dx*dy*dz = delta(vecteur(K) - vecteur(K'))

on obtient pour C(barre) :

C(barre) = i*sum((a(K)*b(-K) - a(-K)*b(K))/|K|)*dK_x*dK_y*dK_z

intégrale qui est nulle, les éléments correspondant à (K_x, K_y , K_z) et (—K_x , —K_y, —K_z) étant opposés.

L’intégrale spatiale de C étant nulle, il s'ensuit que A/(sqrt(delta)))*B et A*(B/(sqrt(delta) ne peuvent différer que d'une divergence. Dans tout ce qui suit, nous négligerons cette divergence, sans influence sur les résultats qui ne concernent jamais que des intégrales sur l’espace et nous écrirons indifféremment A/(sqrt(delta)))*B ou A*(B/(sqrt(delta) ou encore (A*B)/(sqrt(delta)). Il en est naturellement de même pour un opérateur delta^n quelconque.

Considérons maintenant l’opérateur rot appliqué au vecteur (A_x, A_y, A_z) :

A_x = sum(a_x*(k_x, k_y, k_z)*exp(i.(vecteur(k).vecteur(x))*dk_x*dk_y*dk_z ,

on a, pour la première composante du rotationnel par exemple :

rot_x(A) = i*sum(k_y*a_z - k_z*a_y)*exp(i.(vecteur(k).vecteur(x))*dk_x*dk_y*dk_z.

De même pour la divergence de A :

div A = i*sum(k_x*a_x + k_y*a_y + k_z*a_z)*exp(i.(vecteur(k).vecteur(x))*dk_x*dk_y*dk_z

De ces expressions, il suit immédiatement que les opérations rot et div sont permutables avec les opérateurs A. On a par exemple :

rot_x(A)/(sqrt(delta)) = sum((k_y*a_z - k_z*a_y)/|k|)*exp(i.(vecteur(k).vecteur(x))*dk_x*dk_y*dk_z

Nous reviendrons plus loin sur la combinaison particulière rot/(sqrt(delta)).

Une autre application intéressante de ces opérateurs consiste dans l’inversion des formules donnant les champs en fonction des potentiels. Partons de :

E = — grad V — A' ; H = rot A,

si l’on remarque que :

laplacien = grad div — rot rot,

et que div H = 0, on a, en s’imposant la condition supplémentaire :

div A = 0,

qui achève de déterminer le potentiel vecteur :

vecteur(A) = - rot(H)/laplacien ; V = -div(E)/laplacien ;

Enfin l’on peut remarquer que si ces opérateurs sous la forme que nous leur avons donnée ((16) par exemple), sont particulièrement adaptés à la théorie électromagnétique, cela tient à ce que dans cette théorie, on décompose toujours les champs en ondes planes et cette décomposition correspond justement à l’expression (15). Les opérateurs précédents correspondent donc à des opérations simples effectuées sur chacune des ondes planes, après quoi on doit en faire la composition.


CHAPITRE II

Théorie quantique de l’électromagnétisme pur.


  • 1. Le rayonnement du corps noir avec l’ancienne quantification.

— C’est au cours de l’étude du champ électromagnétique pur, du rayonnement du corps noir, qu’a pris naissance la théorie des quanta. En réalité, Planck, dans sa déduction primitive de la loi qui porte son nom considérait un oscillateur matériel harmonique qui était supposé ne pouvoir émettre ou absorber d’énergie que par quanta n*h*nu ; du calcul de l’énergie moyenne de cet oscillateur, il passait ensuite par application du théorème d’équipartition au calcul de l'énergie moyenne présente dans une portion d'espace vide et due au rayonnement en question.

Quelques années plus tard Debye (1), en s’appuyant sur des calculs bien connus de Jeans montra qu’il était possible de se passer de toute hypothèse sur les oscillateurs matériels, en reportant l’hypothèse des quanta dans le rayonnement môme, en dehors de tout phénomène d’émission ou d’absorption.

Considérons le rayonnement noir présent dans une enceinte cubique d’arête L et de côtés parallèles aux trois axes de coordonnées x,y,z. 11 est possible de le décomposer en une somme de vibrations harmoniques correspondant chacune à un mode de résonance propre de l’enceinte.

Soient vecteur(e)(e_x, e_y, e_z) et vecteur(h)(h_x, h_y , h_z) les vecteurs électrique et magnétique correspondant à une de ces vibrations propres, l’énergie correspondante est :

(1/4)*((L/2)^3)*((e_x)^2 + (e_y)^2 + (e_z)^2 + (h_x)^2 + (h_y)^2 + (h_z)^2) = (1/2)*((L/2)^3)*((e_x)^2 + (e_y)^2 + (e_z)^2)

Mais e_x, e_y, e_z ne sont pas linéairement indépendants. Les équations de Maxwell imposent en effet qu’il existe un vecteur k (k_1, k_2, k_3) directement lié aux nombres de noeuds présentés par la vibration propre dans chaque direction et tel que :

(k_1)*(e_x) + (k_2)*(e_y) + (k_3)*(e_z) = 0

  • (1) Debye, Ann. der Physik, 33 (1910) p. 1429; Jeans, Phil. Mag. 10 (1905), p. 91.

Le vecteur e est donc situé (1) dans un plan perpendiculaire à la direction (k_1, k_2, k_3) et il est possible de choisir dans ce plan deux directions perpendiculaires ksi, eta ainsi que les unités de manière que l’énergie de la vibration propre soit de la forme :

(1/2)(((eta)^2) + 4*(Pi^2)*(nu^2)*(ksi^2))

(1)

Elle a donc la forme de l’énergie d’un oscillateur harmonique de Planck et ceci conduit Debye à transposer l’hypothèse de Planck pour les vibrations électromagnétiques.

Chaque vibration propre sera dotée d’un certain nombre de quanta et un calcul entièrement analogue à celui de Planck nous conduit à la formule correcte de la répartition de l’énergie dans le rayonnement du corps noir. De plus, on est tout naturellement conduit à rapprocher cette quantification de la théorie de la structure discontinue du rayonnement qu’Einstein avait proposée quelques années auparavant. Il semble que cette quantification des vibrations propres fournisse la division du rayonnement en « corpuscules » d’énergie h*nu.

Pour retrouver la loi de Planck, il faut appliquer aux photons la statistique de Bose-Einstein. Mais il y a plus, il est possible de retrouver également la loi de Planck par application aux vibrations électromagnétiques de la statistique de Bose-Einstein, et de la sorte, il est possible de traiter la quantification des vibrations propres et des photons parallèlement de la façon suivante (2) : on fait correspondre les cellules de division de l’espace des phases aux vibrations propres et aux photons correspondant au même intervalle de fréquence (nu, nu + d*nu), de manière que les directions d’une vibration propre (du vecteur k) et du quantum de lumière tombent à l’intérieur du môme domaine angulaire infinitésimal.

  • (1) Cette relation implique évidemment le caractère transversal des vibrations électromagnétiques.
  • (2) M. Born, W. Heisenberg et P. Jordan. Z. Physik, 35 (1926), p. 557.

Ainsi le nombre quantique de l'oscillateur de Debye sera égal au nombre de quanta de lumière appartenant à la même cellule (1). Et la statistique de Bose-Einstein appliquée indifféremment aux deux conceptions du rayonnement amène à la loi de Planck.


  • 2. Introduction de la nouvelle quantification.

Jusqu’à présent, avec la théorie quantique classique, nous avons attribué à l’oscillateur harmonique la fréquence n*h*nu. Qu’y a-t-il eu de changé avec l’apparition de la nouvelle mécanique ondulatoire? Ici encore il est possible de décomposer la fonction de Hamilton du rayonnement en une somme de fonctions de Hamilton correspondant à des oscillateurs harmoniques indépendants. On sait que pour un oscillateur harmonique, l’état dans lequel il se trouve à tout moment est indiqué par l’équation :

(1/2)*(-(h^2)/(4*(Pi^2))*(d^2/d(ksi)) + 4*(Pi^2)*(nu^2)*(ksi^2))*(psi(ksi)) = 0 (2)

qu’on obtient à partir de (1) en y remplaçant eta par h/(2*Pi*i)*(d/d(ksi)) et en considérant le résultat comme un opérateur à appliquer à la fonction psi(ksi), qui par le carré de son module |psi(ksi)|^2 multiplié par d(ksi), indique la probabilité de trouver le point vibrant à une abscisse comprise entre ksi et ksi + d(ksi).

  • (1) Cette conception est en rapport étroit avec la notion de « molécules de quanta » qui avait été présentée par divers auteurs: Wolfke. Physik Zeits., 22 (1921), p. 375; Bothe Z. Phys, 20 (1923), p. 145 ; 23 (1924) p. 214 ; 41 (1927), p. 345 ; L. de Broglie. J. Phys., 31 (1922), p. 422; Thèse (1924), p. 95 - Voir également Born et Jordan. Elementare Quantenmechanik, pp. 367-400; Uhlenbeck. Over statistische Methoden in de Theorie der Quanta (1927), p. 74 ; L. Brillouin, Les statistiques quantiques (1930).

On sait que cette fonction s'exprime simplement au moyen des polynômes d’Hermite. Quand à l'énergie, elle est donnée maintenant par :

E_k = (n_k + 1/2)*h*nu_k (3)

où n_k prend toutes les valeurs entières depuis n = 0. L’introduction (1) de ce facteur (1/2) constitue un élément important de succès pour la nouvelle mécanique quantique. Elle expliquait ainsi simplement les "nombres quantiques fractionnaires" que l’étude des spectres de bandes avait conduit à introduire. D’ailleurs, depuis, ce facteur a été justifié par de nombreuses autres considérations : c’est ainsi que dans la théorie des réseaux cristallins, on peut retrouver les mêmes relations. Donc même au zéro absolu, chacun des oscillateurs élémentaires est doté d’une « énergie au zéro absolu » (1/2)*h*nu et cette prédiction théorique est en excellent accord avec l’expérience (2).

Mais elle est plus difficile à admettre pour le cas du rayonnement noir. Dans ce cas, en effet, au zéro absolu, tous les nombres quantiques n_k sont nuls ; les fonctions psi(ksi) sont de la forme :

psi(ksi) = C*exp[(-2*(Pi^2)*nu/h)*(ksi^2)]

et comme d’autre part il y a une infinité d'oscillateurs électromagnétiques et que la radiation de fréquence comprise entre nu et nu + d(nu) apporte à la densité d’énergie la contribution :

(8*Pi*(nu^2)/(c^3))*d(nu), h*nu/2,

  • (1) On sait que l’introduction de ce facteur dépend de la parité du nombre de dimensions de l’oscillateur.
  • (2) James, Waller, Hartree. Proc. Roy. Soc. (A), 118 (1928), p. 334.

il s’ensuit que la densité d’énergie du rayonnement au zero absolu est infinie.

A vrai dire, ce terme supplémentaire se comporte d une manière bien particulière et qui ne gène pas les applications.

En effet, il est purement additif, de sorte que, comme seules les différences d’énergie E_p — E_k interviennent dans les observations, il s’élimine ainsi et tous les résultats de l'ancienne théorie (avec n*h*nu) sont applicables (1). Mais l’existence de ce rayonnement au zéro absolu qu’on ne peut mettre expérimentalement en évidence d'aucune manière est bien difficile à admettre. On a peine à croire à son existence physique. D’autre part, quoique non observable, il intervient dans la démonstration que M. Born, W. Heisenberg et P. Jordan ont donné de la formule des fluctuations d’Einstein dont nous parlerons bien plus longuement au chapitre suivant. Sa suppression simple dans cette démonstration aboutit à un résultat erroné.


  • 3. Tentatives de transformation de la théorie.

— Plusieurs essais ont donc été faits pour remédier à cette défectuosité de la théorie. Ce sont P. Jordan et W. Pauli qui ont les premiers attiré l’attention sur cette difficulté (2). Ils se contentent de remarquer qu’il doit être possible de modifier les équations de l’oscillateur de manière à supprimer le « mauvais terme ». Nous noterons seulement la forme des nouvelles variables qu’ils utilisent :

X = (1/(2*sqrt(Pi*nu)))*(eta) - i*(sqrt(Pi*nu))*(ksi)

  • (1) 11 est intéressant de remarquer que cette élimination est possible du fait que tous les photons ont la vitesse c. Sinon,

l’élimination pourrait être possible pour un système de coordonnées, elle ne le serait plus pour tout autre système, par suite de la transformation de Lorentz. Ceci précise la différence de la question que nous étudions ici et de la question de l’énergie électrostatique propre infinie de l’électron.

  • (2) P. Jordan et W. Pauli. Z. Physik., 47 (1928), p. 151.

X+ = (1/2*sqrt(Pi*nu))*(eta) + i*(sqrt(Pi*nu))*(ksi)

donc imaginaires. Un tel procédé est au fond celui qui est utilisé par Dirac dans son livre bien connu (f) ; on prendrait pour définition de l’énergie de l’oscillateur non plus (1/2)*((eta^2) + 4*(Pi^2)*(nu^2)*(ksi^2) mais :

(1/2)*(eta + 2*Pi*nu*i*ksi)*(eta - 2*Pi*nu*i*ksi) (4)

Mais de tels changements sont seulement relatifs aux oscillateurs et l’on ne voit nullement pourquoi on écrirait différemment l’énergie d’un oscillateur électromagnétique et l’énergie d’un oscillateur matériel. De plus, ces changements n’ont pas d’expression simple en termes de champ. On ne voit pas comment modifier la fonction de Hamilton du rayonnement de manière à aboutir à une expression telle que (4). Quelque chose d’analogue a été indiqué par Möglich (2). En partant des relations d’échange entre et on trouve que :

X*X+ - X+*X = 1.

Comme d’autre part avec ces notations, l’énergie s’écrit :

(1/2)*h*nu*X*X+ + h*nu/2 ,

on voit qu’il suffit de prendre par définition pour l’expression de l’énergie :

(1/2)*h*nu*X+*X ,

  • (1) P. A. M. Dirac. Principles of quantumdynamics, Oxford (1930), en particulier, p. 87. Voir aussi : H. Weyl. Gruppentheorie

und Quantenmechanik, 2e édition, p. 219.

  • (2) F. Mœglich. Ann. der Physik, 2 (1929), p. 676.

ce qui revient à échanger l’ordre de certains facteurs dans l’expression de l'énergie électromagnétique écrite en fonction des coefficients du développement de Fourier et de leurs moments conjugués. Mais il est facile de voir encore que la transposition de ce calcul en langage de champ n’est pas possible. On ne peut plus exprimer l’énergie en fonction de E et de H, mais seulement au moyen des amplitudes des vibrations propres. Ce point de vue est évidemment peu satisfaisant. Nous reviendrons plus loin sur le travail de Möglich qui a montré qu’il était possible de cette façon d’obtenir une déduction correcte de la formule d’Einstein sans énergie au zéro absolu. Enfin, L. Landau et R. Peierls (1) ont donné une théorie assez voisine de celle que nous allons indiquer ; ils se placent dans l’espace de configuration, ils partent des équations de Maxwell et supposent que les champs ne sont pas forcément réels. Ceci les conduit à prendre pour nombre de quanta correspondant à une onde monochromatique :

(1/(2*h*nu))*sum(M*M'*dV) ,

où M et M' sont deux variables conjuguées décrivant le champ et dont au reste ils ne précisent pas les relations avec les variables habituelles de champ. D’ailleurs le but de ce travail n’était pas l’étude de la difficulté dont nous nous occupons actuellement, mais la formation inductive des équations de l’électrodynamique avec présence de charges, en se plaçant dans l’espace de configuration.

Le trait commun de tous ces essais est donc d’introduire à un moment donné des variables complexes et comme nous le verrons il semble bien difficile d’éviter autrement l’apparition du terme supplémentaire. Une théorie correcte doit donc probablement l’introduire immédiatement dans la définition des grandeurs de champ, et doit aussi permettre de retrouver la loi des fluctuations d’Einstein.

  • (1) L. Landau et R. Peierls. Z. Physik, 62 (1930), p. 188.


  • 4. Bases d’une nouvelle théorie. Le schéma hamiltonien.

Nous avons exposé dans un travail paru récemment (1) comment on peut être amené, guidé continuellement par le principe de correspondance, à édifier un tel formalisme. Cela me permettra d’exposer cette théorie d’une manière plus axiomatique.

Nous avons donc été amenés à considérer que le champ électromagnétique pouvait avec avantage être décrit au moyen de grandeurs complexes analogues aux fonctions d’onde caractérisant la matière. Pour le moment, nous ne considérons pas les rapports que ces nouvelles grandeurs peuvent éventuellement avoir avec les champs électrique et magnétique E et H qui définissent habituellement l’état électromagnétique d’une portion de l’espace. Ces nouvelles grandeurs F_alpha, fonctions des 4 coordonnées d’espace et de temps x, y, z, t, seront au nombre de trois et nous considérerons toujours en même temps les grandeurs adjointes (2) F_alpha+, tout comme lorsque l’on veut mettre les équations de Dirac sous forme lagrangienne, on considère à côté des fonctions d’onde psi_alpha les adjointes psi_alpha+.

Par définition, notre système sera caractérisé par la fonction de Lagrange L donnée par :

  • (1) L. Rosenfeld et J. Solomon. , J. de Phys., p. 189 (1981) ; Naturwissenschaften, 19 (1981), p. 876.
  • (2) Rappelons que dans la notation sous forme de matrices, l’élément Aij+ de la matrice A+ adjointe de la matrice A d’élément Aij, est défini par Aij+ = Aji' (où l’astérisque indique que l’on passe à la quantité conjuguée complexe); dans le cas général où A désigne un opérateur linéaire, son adjoint A+ est défini par la condition que :

sum(u*(A+u)(étoile)*dx*dy*dz = sum(A*u)*u(étoile)*dx*dy*dz

quelle que soit la fonction u(x, y, z). Un opérateur hermitien est identique à son adjoint.


2*L = (F_alpha)'*(F_alpha+/sqrt(delta)) — F_alpha*F_alpha+ (5)

Dans cette relation, la sommation est sous-entendue comme elle le sera, sauf indication contraire, dans toutes les relations suivantes) par rapport à l’indice muet alpha ; F' est définie par :

(F_alpha)' = (1/c)*(d(F_alpha)/dt) (6)

et 1/sqrt(delta) est l’opérateur défini p. 22. Sans nous attarder à écrire les équations de Lagrange, passons de suite à la fonction de Hamilton. Le moment conjugué de F_alpha s’écrit :

P_alpha = dL/d(F_alpha)' = (1/2)*(F_alpha+/sqrt(delta))

On remarquera que le moment conjugué de F_alpha+ est nul si l’on part de (5), mais pour éviter cette anomalie apparente, il suffit de remarquer que :

(F_alpha)'*(F_alpha+/sqrt(delta)) = -F_alpha(F_alpha+/sqrt(delta)) + d/dt(F_alpha(F_alpha+'/sqrt(delta)) = -(1/sqrt(delta))*(F_alpha)*(F_alpha+') + une divergence

pour voir (1) que le moment conjugué de F_alpha' est (-1/2)*(F_alpha)/(sqrt(delta)).

Mais la considération de ce moment conjugué sera inutile par la suite.

  • (1) Nous avons vu que l’on peut définir P_alpha , non par (7) mais par delta(L(barre))/delta(F_alpha') et sous cette forme, la proposition indiquée ci-dessus est évidente.

Des relations (5) et (7) on déduit l’expression de la fonction de Hamilton :

H = F_alpha'*P_alpha - L = (1/2)*F_alpha*F_alpha+ (8)

Il est possible de tirer de là directement les équations de Hamilton, mais le plus simple est de passer par l’intermédiaire des relations d’échange que nous allons écrire maintenant.

D’ailleurs, comme nous sommes en présence d’un schéma canonique notre théorie rentre dans le cadre de la théorie générale des champs dont nous avons déjà indiqué les traits principaux (1), et ces relations s’écrivent simplement :

[P_alpha(Q), F_beta(Q')] = c*delta(alpha,beta)*delta(Q-Q') [P_alpha(Q), P_beta(Q')] = 0, [F_alpha(Q), F_beta(Q')] = 0

(9)

Dans ces relations, Q et Q' représentent deux points de l'espace, et les grandeurs de champ qui y interviennent sont considérées au même instant (2) t. Nous avons vu alors, avec Heisenberg et Pauli, que ces relations, supposées vérifiées à un instant t = o le seront pour tout instant t > o, se propageront donc au cours du temps. En y remplaçant P_alpha par son expression (7), on obtient encore :

[(1/2)*(F_alpha+(Q)/sqrt(delta), F_beta(Q')] = c*delta(alpha, beta)*delta(Q - Q') (10) [F_alpha+(Q), F_beta+(Q')] = 0, [F_alpha(Q), F_beta(Q')] = 0 (11)

la première relation pouvant encore s’écrire, en remarquant que le symbole n’opère que sur le point Q :

  • (1) P. 19 et suivantes.
  • (2) Les grandeurs de champ, même relatives au même point de l’espace, mais correspondant à deux instants différents, sont permutables.

[F_alpha+(Q), F_beta(Q')] = 2*c*delta(alpha, beta)*sqrt(delta_Q)*delta(Q - Q') (12)

Il est maintenant très simple de former les équations de Hamilton du système. On, sait qu’elles sont données par :

c*F_alpha' = [H(barre), P_alpha] ; c*P_alpha' = -[H(barre), F_alpha] (13)

où H(barre) est définie par

H(barre) = sum(H*dv), dv = dx*dy*dz (14)

l’intégration étant étendue à tout l’espace compris dans le système. D’après (13) et (8), en utilisant les relations de permutation (11) et (12), on obtient pour équations de Hamilton du système :

F_alpha' = sqrt(delta)*F_alpha (15) F_alpha+' = - sqrt(delta)*F_alpha+ (16)

(la variation de signe dans les deux équations provenant de ce que l’opérateur sqrt(delta) est imaginaire). Avant d’aller plus loin, remarquons qu’on en déduit immédiatement :

F_alpha = delta(F_alpha) ; F_alpha+ = delta(F_alpha+) (16 bis)

très analogues aux équations de propagation de la théorie de Maxwell. A ces équations (10) et (16), nous adjoindrons une relation supplémentaire, que nous appellerons dans la suite condition accessoire :

div F = div F+ = 0. (17)

Cette condition serait d’ailleurs, si on la considérait comme une condition en nombres q, comme le montre la formule :

[div(F(Q)),(F_k+(Q))/sqrt(delta)] = - c*grad_k*delta(Q - Q') ,

incompatible avec les relations de permutation (11) et (12).

Mais on peut convenir de considérer cette relation comme une condition accessoire, en nombres c ; elle correspond alors à un choix particulier des conditions initiales. Montrons que ce choix une fois fait au temps t = o, elle sera vérifiée en raison des équations de Hamilton pour t > o. On a en effet :

d/dt(div F) = div F' = div(sqrt(delta)*F) = sqrt(delta)*(div F) = o.


  • 5. Impulsion électromagnétique.

Dans notre schéma Hamiltonien, la quantité de mouvement est définie d’une façon générale par :

c*S_k = - sum(d(F_alpha)/d(x_k)*P_alpha*dv = (-1/2)*sum(d(F_alpha)/d(x_k))*(F_alpha+/(sqrt(delta)))*dv (k = 1,2,3)

(18)

qu’on peut écrire encore par une suite d’intégrations par parties, et en utilisant, ce qui est essentiel, la condition accessoire :

c*S_k = (-1/4)*sum([(d(F_alpha)/d(x_k))*(F_alpha+/(sqrt(delta))) - (F_alpha)*(1/(sqrt(delta))*(d(F_alpha+)/d(x_k))]*dv = (-1/4)*sum([rot(k*alpha)(F)*(F_alpha+/(sqrt(delta))) - (F_alpha)(rot(k*alpha)(F+)/(sqrt(delta))]*dv ,

(19)

où :

rot(k*alpha)(F) = (d(F_alpha)/d(x_k)) - (d(F_k)/d(x_alpha))

L’expression (19) sera donc dans notre théorie l’équivalent du vecteur de Poynting.

On peut retrouver la définition (14) de l’impulsion au moyen d’une méthode qui a été indiquée par Heisenberg et Pauli (1) et qui revient à utiliser les propriétés d’invariance de la fonction hamiltonienne vis-à-vis de certaines transformations. S’il en est ainsi, l’opérateur correspondant à cette transformation est permutable avec H. Si, suivant la terminologie de Dirac, on envisage maintenant cet opérateur comme une variable dynamique, il s’ensuit qu’elle est constante au cours du temps et l’on a ainsi une intégrale du mouvement.

Il est évident que H doit rester invariante si l’on effectue une translation d’ensemble du système. Considérons la translation x_k -> x_k + delta(x_k), F_alpha devient :

F_alpha - (d(F_alpha)/d(x_k))*delta(x_k)

Soit maintenant G une fonctionnelle des F, elle est transformée en :

G - sum((delta(G)/delta(F_alpha))*(d(F_alpha)/d(x_k))*delta(x_k))*dv = [1 - delta(x_k)*sum((d(F_alpha)/d(x_k))*(delta/delta(F_alpha))*dv]*G

Nous voyons ainsi qu’à la translation delta(x_k) correspond l’opérateur :

1 - delta(x_k)*sum(dv*(d(F_alpha)/d(x_k))*(delta/delta(F_alpha))

et d’après ce que nous avons dit plus haut, il doit lui correspondre une variable dynamique constante dans le temps. Comme à l’opérateur delta/delta(F_alpha) correspond la variable ((2*Pi*i)/(h*c))*P_alpha on obtient pour intégrale du mouvement :

  • (1) W. Heisenberg et W. Pauli. Z. Physik, (1930), p. 68

sum((d(F_alpha)/d(x_k))*P_alpha*dv) = constante

c’est-à-dire (14).

Nous vérifierons plus loin que l’assimilation de H à l’énergie et des trois grandeurs S* aux trois composantes du vecteur de Poynting est bien en accord avec le principe de correspondance.


  • 6. Quantification des champs et photons.

— Après avoir ainsi étudié le champ électromagnétique dans son ensemble, nous allons entrer plus dans le détail et voir comment les conditions de quantification précédentes sont équivalentes à la théorie des photons.

Pour cela, nous développerons les F et F+ en séries de fonctions orthogonales w_s , w_s+, correspondant à des ondes planes. Celles-ci ne sont pas des fonctions propres des F (nous reviendrons là-dessus plus loin), mais plutôt des fonctions propres de l’énergie, avec pour condition aux limites simplement une condition cyclique. Ici, il s’agit simplement d’une condition géométrique (1), sans signification physique et dont le seul but est de faire apparaître un ensemble dénombrable de fonctions propres. Soit L une longueur don née, les w_s et w_s' devront avoir respectivement les mêmes valeurs aux points (x, y, z) et (x + n_1*L, y + n_2*L, z + n_3*L où n_l , n_2 , n_3 sont trois entiers arbitraires. On fait tendre la période L vers l’infini à la fin du calcul. Ces fonctions propres, orthogonales et normalisées sont données par :

(1) On aura une idée simple de cette condition (avec une dimension de moins) en imaginant que l’on étudie le champ dans un espace ayant la connexion d’un tore. Il est alors nécessaire d’introduire une telle périodicité. On peut remarquer d’autre part que cette condition n’utilisant pas la notion d’onde stationnaire est bien mieux en accord avec la correspondance entre photon et onde lumineuse monochromatique plane,

w_s = L^(-3/2)*exp((i*Pi)/L)*((k_1)(s)*x) + ((k_2)(s)*y) + ((k_3)(s)*z) = L^(-3/2)*exp((i*Pi)/L)(vecteur(k)(s).vecteur(r))

w_s(étoile) = L^(-3/2)*exp(-(i*Pi)/L)*((k_1)(s)*x) + ((k_2)(s)*y) + ((k_3)(s)*z) = L^(-3/2)*exp(-(i*Pi)/L)(vecteur(k)(s).vecteur(r))

(20)

où (vecteur(k)(s).vecteur(r)) représente le produit scalaire du vecteur k(s) (k_1(s), k_2(s), k_3(s)) et du vecteur r(x, y, z), k(s) est le vecteur nodal d’ordre s, dont les composantes (k_1(s), k_2(s), k_3(s)) sont en rapport direct avec le nombre de nœuds présentés par la vibration correspondante dans les directions x, y, z. k(s) est relié à la fréquence correspondante par :

nu(s) = (c/2*L)*(k(s))

(21)

où :

(k(s)) = sqrt(((k_1)(s)^2) + ((k_2)(s)^2) + ((k_3)(s)^2)))

est la longueur du vecteur k(s).

Notons immédiatement que l’on a :

(w_s)/(sqrt(delta)) = (w_s)/[(2*Pi*i*nu(s))/c]

(w_s)(étoile)/(sqrt(delta)) = - w(s)(étoile)/[(2*Pi*i*nu(s))/c]

(22)

Exprimés dans ce système de fonctions propres, les F_alpha et F_alpha+ s’écrivent donc :

F_alpha = sum_s(f_alpha(s)*w(s)) ,

F_alpha+ = sum_s(f_alpha+(s)*w(s)(étoile))

(23)

Dans ce développement, conformément aux règles générales de quantification, les w_s et w_s(étoile) sont considérés comme des nombres c, les f_alpha(s) et f_alpha+(s) (quantités complexes), comme des nombres q. Les relations de permutation de ces dernières grandeurs s’obtiennent d’ailleurs aisément en introduisant les développements (23) dans les conditions de quantification (12), puis multipliant par une fonction propre quelconque w_s et intégrant. En tenant compte de (22), on obtient :

[(f_alpha+)(s),(f_beta)(s)] = 4*Pi*i*delta(beta,alpha)(nu(s)) ,

[(f_alpha+)(s),(f_beta+)(s)] = 0 ,

[(f_alpha)(s),(f_beta)(s)] = 0 ;

En introduisant (23) dans l’expression de l’énergie, puis intégrant et tenant compte des relations d’orthogonalité des w et w(étoile), on obtient pour H(barre) :

H(barre) = (1/2)*Sigma(s)*Sigma(alpha)[((f_alpha)(s))*((f_alpha+)(s))]

(25)

Mais les f_alpha(s) et f_alpha+(s) ne sont pas encore les grandeurs auxquelles nous allons directement rattacher le nombre de photons dans l’état (s).

Il nous faut auparavant faire une rotation qui amène l’axe des z sur la direction vecteur(k(s)). Cette rotation, variable avec s, sera définie par une matrice D(alpha,lambda)(s) pour laquelle on peut donner le tableau suivant (1).

(1) On peut former ce tableau de la manière suivante : il est d’abord évident que la dernière colonne est formée par les cosinus directeurs de la direction k(s). Pour obtenir les six autres coefficients, on ne possède que les relations d’orthogonalité. Il s’ensuit qu’un de ces coefficients est arbitraire : cela signifie qu’une rotation arbitraire est possible dans le plan perpendiculaire à k(s). Prenons par exemple D(3,1)(s) = 0. Les relations d’orthogonalité déterminent alors les valeurs des cinq autres coefficients qui sont indiquées ci-dessus.

[TABLEAU]

  • alpha=1, lambda=1: K_2(s)/[sqrt[(K_1(s)^2) + (K_2(s)^2)]]
  • alpha=1, lambda=2: K_1(s)*K_3(s)/|K(s)|*[sqrt[(K_1(s)^2) + (K_2(s)^2)]]
  • alpha=1, lambda=3: K_1(s)/|K(s)|
  • alpha=2, lambda=1: -K_1(s)/[sqrt[(K_1(s)^2) + (K_2(s)^2)]]
  • alpha=2, lambda=2: K_2(s)*K_3(s)/|K(s)|*[sqrt[(K_1(s)^2) + (K_2(s)^2)]]
  • alpha=2, lambda=3: K_2(s)/|K(s)|
  • alpha=3, lambda=1: 0.
  • alpha=3, lambda=2: -[sqrt[(K_1(s)^2) + (K_2(s)^2)]]/|K(s)|
  • alpha=3, lambda=3: K_3(s)/|K(s)|

(26)

Cette matrice est orthogonale unitaire, c’est-à-dire que l’on a :

Sigma(lambda)*D(alpha,lambda)(s)*D(beta,lambda)(s) = delta(alpha,beta)

(27)

relation qui nous sera utile dans la suite. Dans cette matrice, seule la dernière colonne est la même pour les différents tableaux possibles. Les deux premières colonnes sont susceptibles d’un plus large arbitraire, ce qui correspond comme nous allons le voir à un fait physique bien connu. Dans cette rotation, les f_alpha(s) et f_alpha+(s) se transforment en nouveaux nombres q, b_lambda(s) et b_lambda+(s) par :

f_alpha(s) = Sigma(lambda)*D(alpha,lambda)(s)*b(lambda)(s) ,

f_alpha+(s) = Sigma(lambda)*D(alpha,lambda)(s)*b(lambda)+(s)

(28)

Ces nouvelles grandeurs sont maintenant susceptibles d’une interprétation physique simple. En effet, du tableau (26), nous déduisons que b_3(s) et b_3+(s) correspondent à la direction vecteur(k(s)), tandis que (b_1(s), b_1+(s)) et (b_2(s), b_2+(s)) correspondent au plan perpendiculaire, c’est-à-dire au plan de l’onde.

Ces deux couples de grandeurs correspondent aux deux vibrations rectilignes polarisées à angle droit en lesquelles on peut décomposer toute vibration lumineuse. Le fait qu’il existe un certain arbitraire dans le choix des deux premières colonnes du tableau (26) répond au fait que ces deux vibrations sont arbitraires. Quelle est maintenant le rôle de la troisième composante (b_3(s), b_3+(s)) ? Elle correspond à la direction de propagation de l’onde et c’est une vibration harmonique de môme fréquence que les deux vibrations précédentes. On peut donc parler si l’on veut d’une « vibration lumineuse longitudinale », et d’un « photon longitudinal ». Dans les termes de la théorie classique, elle correspond au champ électrostatique habituel. Le rôle si particulier de ce champ (que nous aurons l'occasion de retrouver bien plus complète ment un peu plus loin) apparaît ici d’une façon particulière ment nette (1). D’ailleurs, dans le cas du vide qui nous occupe ici, nous allons voir que comme il était logique de s’y attendre par comparaison avec la théorie classique, ces photons longitudinaux sont absents. Partons en effet de la condition accessoire (17). En y introduisant le développement (23), elle s’écrit :

Sigma(s)(k_alpha(s).f_alpha(s))*w(s) = 0,

puis en y remplaçant les f_alpha(s) par leur développement (28) et en remarquant que :

(k_alpha(s).f_alpha(s)) = Sigma(lambda)*D(alpha,lambda)(s)(k(alpha)(s).b(lambda)(s)) = b_3(s)

elle s’écrit :

Sigma(b_3(s))*(w(s)) = 0.

puis en multipliant par w_s(étoile) et intégrant, on trouve que :

b_3(s) = 0.

  • (1) On obtenait d’ailleurs la même décomposition dans la théorie de Heisenberg et Pauli.

On démontrerait de même que :

b_3+(s) = 0.

Quant aux relations de permutation que vérifient les b et b+, on trouve aisément, en utilisant (27) qu’elles sont identiques aux relations vérifiées par les f et f+ et en particulier :

[b_alpha+(s), b_alpha(s)] = 4*Pi*i*nu(s)

(29)

Comme d’autre part la rotation ||D(alpha,lambda)(s)|| est unitaire, l’expression (25) de H(barre) reste la même avec les b et b+ pour nouvelles variables. Donc :

H(barre) = (1/2)*Sigma(s)*Sigma(alpha)*b(alpha,s)*b(alpha+,s)

(30)

Nous pouvons maintenant passer à l’introduction du nombre des photons. La forme des relations (29) suggère le changement de variables canoniques :

b(alpha,s) = sqrt(2*h*nu(s))*M(s,alpha)^(1/2)*exp((2*Pi*i/h)*theta(alpha,s))

b(alpha+,s) = sqrt(2*h*nu(s))*exp((-2*Pi*i/h)*theta(alpha,s))*M(s,alpha)^(1/2)

(31)

Dans ces relations, les M et les theta sont deux séries de variables canoniquement conjuguées :

M(s,alpha)*theta(beta,t) - theta(beta,t)*M(s,alpha) = delta(t)*delta(alpha,beta) ,

theta(alpha,s)*theta(beta,t) - theta(beta,t)*theta(alpha,s) = 0 ,

M(s,alpha)*M(t,beta) - M(t,beta)*M(s,alpha) = 0.

On sait que cela revient à considérer theta(alpha,s) comme la variable quantique correspondant à d/dM(s,alpha) et, en introduisant les expressions (31) dans les conditions de quantification (29), nous trouvons que les valeurs caractéristiques de M(S,alpha) sont :

M(s,alpha) = 0, 1, 2,...

donc tous les nombres entiers. Notre théorie nous donne donc une quantification correcte du champ électromagnétique : le nombre de photons correspondant à l’état (s,alpha) est bien un nombre entier. Si maintenant nous introduisons les expressions (31) dans l’expression (30) de l’énergie totale du champ, nous obtenons :

H(barre) = sum_s(sum_alpha(M(s,alpha)*h*nu(s)) (32)

c’est-à-dire en mettant en évidence les deux vibrations rectilignes de fréquence nu(s):

H(barre) = sum_s(M(s,1) + M(s,2))*h*nu(s) (33)

et nous avons obtenu ainsi une décomposition correcte de l’énergie du champ électromagnétique pur en photons h*nu(s) sans énergie au zéro absolu. On pourra remarquer que tout le raisonnement précédent semble, à l’opposé du raisonnement classique, ne pas utiliser la notion d’oscillateur. En réalité, il n’en est rien et la forme des équations (16 bis) et des fonctions caractéristiques (20) est suffisamment significative à cet égard.


  • 7. Relations entre les grandeurs F et les champs électrique et magnétique.

— Nous allons examiner maintenant quels sont les rapports entre nos nouvelles grandeurs F et les champs électrique E et magnétique H habituels. Dans ce qui suit, ces derniers champs seront mesurés en unités rationnelles d’Heaviside-Lorentz, ce qui achèvera de nous donner la définition numérique des F.

L'idée la plus simple est de supposer une relation linéaire entre F, E et H. Soit donc :

F = alpha*E + beta*H F+ = alpha+*E + beta+*H

(34)

où alpha et beta sont deux opérateurs à déterminer, alpha+ et beta+ leurs adjoints (E et H sont supposés être des grandeurs hermitiennes). D’autre part nous voulons que les équations de Hamilton :

F' = sqrt(delta)*F (15 bis) F'+ = —sqrt(delta)*F+ (16 bis)

soient identiques aux équations de Maxwell :

E' = rot(H) H' = —rot(E).

(35)

Si donc on porte (34) dans (15 bis) et (16 bis) puis que l'on y introduit les valeurs (35) de E' et H', on doit obtenir des identités. Donc on a identiquement :

alpha*rot(H) = sqrt(delta)*beta*H (36)

-beta*rot(E) = sqrt(delta)*alpha*E (37)

et les équations adjointes. La façon la plus simple de résoudre ces équations est de poser :

alpha=1, beta=rot/sqrt(delta) (38)

c’est-à-dire, en mettant en évidence le caractère imaginaire de l’opérateur sqrt(delta) :

F = E + i*(rot/(i*sqrt(delta)))*H

F = E - i*(rot/(i*sqrt(delta)))*H.

(39)

Nous allons vérifier que toute la théorie que nous avons développée jusqu’ici, jointe aux expressions (39) est bien conforme au principe de correspondance (1). Tout d’abord, quelle est la signification physique (2) des grandeurs F? Comme nous l’avons vu au paragraphe précédent, elles est difficile à indiquer au moyen des grandeurs E, H. Si l’on se borne à considérer une onde plane, pour un choix convenable du système de coordonnées, F_1 par exemple sera égal à E_x + i*H_y , F_1+ à E_x - i*H_y , etc..., et on obtient l’expression générale de F et F+ en faisant la somme de ces expressions pour toutes les ondes planes; autrement dit, les expressions précédentes de F et F+ mêlent étroitement les vecteurs E et H et aucune décomposition géométrique simple n’est possible.

L’inversion des formules (39) est facile : on a :

E = (1/2)*(F + F+) ,

H = (rot/(i*sqrt(delta)))*((F - F+)/(2*i))

(40)

Nous sommes déjà surs de retrouver exactement les équations de Maxwell d’après le choix que nous avons fait de l’expression des F et on vérifie facilement qu’on les obtient à partir des équations de Hamilton par addition et soustraction. Quant à la condition accessoire, elle s’écrit évidemment : div(E) — div(H) = 0.

  • (1) Il va sans dire que si l’on prend en considération la transformation : F —> exp(i*lambda)*F, F+ -> exp(-i*lambda)*F+ qui laisse H invariante, il est nécessaire de changer la forme des opérateurs alpha et beta. Ceci nous montre que la décomposition (39) n’est possible d’une façon univoque que sous certaines conditions.
  • (2) Comme nous l’a fait remarquer M. le Prof. Pauli la forme de ces expressions est contenue implicitement dans le début du travail de Landau et Peierls. Z. Physik, 62 (1980), p. 188.

Passons maintenant aux conditions de permutation. Si l’on remarque que, A désignant le potentiel vecteur défini univoquement par la condition supplémentaire :

div A = 0, (41)

on a :

A = — rot(H)/(delta) = (1/2)*(F—F+)/(sqrt(delta)) (42)

on trouve aisément que les conditions (11) et (12) s’écrivent :

  • (1) W. Heisenberg et W. Pauli, J. Physik, 56 (1929), p. 26,
  • (2) P. Jordan et W. Pauli. Z. Physik, 47 (1928), p. 151 ; W. Heisenberg et W. Pauli. Z. Physik, 56 (1929), p. 33.

[E_x, A_x] = c*delta(Q - Q') [E_x, E_y] = 0, [A_x, A_y] = 0,

(43)

c’est-à-dire exactement les relations d’échange obtenues par Heisenberg et Pauli (1) à partir de l'hamiltonien classique, en prenant pour variables les potentiels (vecteur et scalaire). Il est satisfaisant de trouver cette concordance parce que, d’une part comme nous l’avons vu au chapitre premier, elles mettent en accord l'hamiltonien classique avec la notion de quanta de lumière, et que d’autre part ce sont ces mêmes relations qui ont été trouvées par Jordan et Pauli (2) au cours de leurs recherches sur la formulation d’une quantification invariante au point de vue relativiste des champs électromagnétiques sans charges libres. Ils ont étudié en effet les relations d’échange que l’on obtient pour les champs à partir de leur décomposition en composantes de Fourier et de relations simples d’échange entre ces composantes, relations qui sont à la base de la théorie de la dispersion. Si e_s(1), e_s(2), h_s(1) , h_s(2), représentent les amplitudes des champs électrique et magnétique liés respectivement aux deux vibrations polarisées rectilignes, et si s,t sont les numéros d’ordre des deux vibrations de fréquences nu(s) et nu(t), ces relations s’écrivent :

e(s,1)*e(t,2) - e(t,2)*e(s,1) = 0 , h(s,1)*h(t,2) - h(t,2)*h(s,1) = 0 ; e(s,1)*h(t,2) - h(t,2)*e(s,1) = 0 , h(s,1)*e(t,2) - e(t,2)*h(s,1) = 0 ; e(s,1)*h(t,1) - h(t,1)*e(s,1) = delta(s,t)*(h*c)/(2*Pi*i) , e(s,2)*h(t,2) - h(t,2)*e(s,2) = delta(s,t)*(h*c)/(2*Pi*i).

En introduisant ces relations dans l’expression des différents crochets tels que [E*, A v ] on obtient des expressions qui, si l’on raisonne à temps constant, comme il est possible de le faire puisque, d’après la théorie générale, les crochets sont des intégrales du mouvement, coïncident avec les expressions (43).

Jusqu’à présent, notre théorie n’a rien donné de plus que la théorie d’Heisenberg et Pauli. Où elle va en différer, c’est justement dans l’expression de la densité d’énergie, différence qui rend compte de la disparition du rayonnement de l’énergie au zéro absolu. Cette densité d’énergie s’écrit en effet :

(1/2)*F_alpha*F_alpha+ = (1/2)*sum_alpha[(E_alpha)^2 + ((rot_alpha)/(i*sqrt(delta))*H)^2 + (h/2*Pi)*[(rot_alpha)/(i*sqrt(delta))*H), (E_alpha)]]

c’est-à-dire, à une divergence près, que l’on peut toujours négliger (1) :

(1/2)*F_alpha*F_alpha+ = (1/2)*(E^2 + H^2) + (h/2*Pi)*sum_alpha[(1/2)*((rot_alpha)/(i*sqrt(delta))*H, E_alpha] = (1/2)*(E^2 + H^2) - (h/4*Pi*i)*sqrt(delta)*sum_alpha[(A_alpha), (E_alpha)]

(44)

(1) En réalité, on devrait comparer seulement l’expression classique (1/2)*sum(E^2 + H^2)*dV et la nouvelle expression (1/2)*sum(F_alpha*F_alpha+*dV) de l’énergie totale. Lorsque l’on passe de ces expressions à la densité d’énergie, il s’ajoute toujours, aussi bien dans la théorie classique que dans notre nouvelle théorie une divergence arbitraire, ne donnant aucune contribution à l’énergie totale.

D’ailleurs, comme nous l’avons vu p. 20, elle n’intervient pas.

Lorsque h = 0, c’est-à-dire lorsque la théorie classique est valable, que la division du rayonnement en photons est négligée, toutes les grandeurs en présence sont çommutables, les crochets du second membre disparaissent et nous voyons que l’hamiltonien que nous avons utilisé jusqu ici se réduit à la densité classique d’énergie électromagnétique. Si l’on revient au domaine de la théorie des quanta, les crochets ne peuvent plus être négligés, On voit même facilement qu’ils sont infinis. En effet, ces expressions ne sont pas tout à fait les crochets habituels qui se rapportent à deux points différents de l’espace. Ici, À a et E a sont supposés mesurés au même point, celui où l’on mesure la densité d’énergie électromagnétique. Or on à pour les crochets proprement dits :

[(A_alpha), (E_alpha)] = -c*delta(Q - Q').

(43 bis)

Comme ici Q et Q' sont confondus, le crochet est infini et cette quantité infiniment grande correspond à l’énergie au zéro absolu qu’il faut retrancher de la densité d’énergie classique pour retrouver l’expression correcte (8). On retrouve ainsi le résultat évident depuis longtemps que la difficulté de l’énergie au zéro absolu est étroitement liée à la quantification du rayonnement et disparaît lorsque celle-ci n’est plus envisagée,

Quant au vecteur impulsion (18), il est un peu plus délicat d’en établir la correspondance avec le vecteur de Poynting. Partons de :

rot(F) = rot(E) — sqrt(delta)*(H), rot(F+) = rot(E) + sqrt(delta)*(H).

(1, suite) davantage dans la définition des moments conjugués, donc des équations de Hamilton, G est ce qui nous permet de la négliger ici.

En substituant dans (19), on a, pour la première composante par exemple :

(-1/4)*sum[(rot(1,alpha)*F*(F_alpha+)/sqrt(delta) - (F_alpha)*(rot(1,alpha)/sqrt(delta))*F+]*dV = (-1/4)*sum[H_2*E_3 + E_3*H_2 - H_3*E_2 - E_2*H_3]*dV + (1/4)*sum[(rot_3(E).rot_2(H))/delta + (rot_2(H).rot_3(E))/delta - (rot_3(H).rot_2(E))/delta - (rot_2(E).rot_3(H))/delta]*dV ,

En intégrant par parties la seconde moitié du deuxième membre et en remarquant que

-(rot H)/(delta) = vecteur(A) ;

cette seconde partie se transforme en :

(-1/4)*sum[-(A_3)*(rot_2(E)) - (rot_2(E))*(A_3) + (rot_3(E))*(A_2) + (A_2)*(rot_3(E))]*dV = (-1/4)*sum[-(rot_3(A))*(E_2) - (E_2)*(rot_3(A)) + (rot_2(A))*(E_3) + (E_3)*(rot_2(A)) + 2*(A_1)*(div(E))]*dV

en utilisant la relation

div A = 0.

Finalement :

c*(S_1) = (-1/2)*sum[(H_2)*(E_3) + (E_3)*(H_2) - (H_3)*(E_2) - (E_2)*(H_3)]*dV

D’autre part, on déduit des relations de permutation (43) que :

[(E_3),(H_2)] = -c*d(delta(Q - Q'))/d(x_1) , [(E_2),(H_3)] = +c*d(delta(Q - Q'))/d(x_1)

Par suite :

c*(S_1) = (1/2)*sum[2*((H_3)*(E_2) - (H_2)*(E_3) + (h/2*Pi*i)*[(E_3),(H_2)] - (h/2*Pi*i)*[(E_2),(H_3)]]*dV

On reconnaît dans la première partie de l’intégrale, l’expression classique du vecteur de Poynting. La seconde partie disparaît lorsque les grandeurs E et H sont commutables.

Elle correspond au flux du rayonnement au zéro absolu et est naturellement infinie comme pour l’expression, de l’énergie (44)


  • 8. Quelques conséquences de la nouvelle théorie.

— En résumé, nous voyons que notre théorie diffère peu du schéma utilisé jusqu’ici : mêmes équations de Maxwell, mômes relations de permutation, densité d’énergie ne différant de l’ancienne expression que par un terme tendant vers zéro avec h et qui rend juste compte de la. question de l’énergie du rayonnement au zéro absolu. Mais nous allons main tenant envisager d’autres différences qui tiennent d’une part, à une question formelle : abandon des potentiels comme grandeurs caractérisant le champ et d’autre part, au fait que nos nouvelles grandeurs de champ sont des quantités complexes. Envisageons successivement ces deux questions.

Dans la théorie de Heisenberg et Pauli, les variables sont les trois composantes du potentiel vecteur et le potentiel scalaire. Les moments correspondants sont pour les trois composantes du potentiel vecteur les trois composantes du champ électrique, tandis que du fait de la forme particulière de la fonction de Lagrange, on constate que le moment conjugué du potentiel scalaire est identiquement nul. Ceci constitue une grosse difficulté formelle pour le développement de la théorie et plusieurs méthodes ont été proposées, soit pour l’éviter (1), soit pour l’utiliser (2). Mais il semble bien d’après les applications qui en ont été faites qu’aucune de ces méthodes n’est simple et les calculs qu’elles demandent sont en général fort compliqués.

  • (1) W. Heisenberg et W. Pauli. Physik, 56 (1929), p. 1 ; L. Rosenfeld. Z. Physik, 58 (1929), p. 540; E. Fermi, Rendiconti Lincei, 9, (1929), p. 881.
  • (2) W. Heisenberg et W. Pauli. Z. Physik, 59 (1960), p. 168: L. Rosenfeld. Ann. der Physik, 5 (1930), p. 113.

Cette difficulté n’a rien d’accidentel et tient justement à ce que les champs qui sont les grandeurs physiques importantes ne déterminent pas univoquement les potentiels. Pour achever leur détermination, il faut se donner en effet une condition supplémentaire, parfaitement arbitraire du reste, et l’on utilise en général (1) dans la théorie électromagnétique classique, la relation de Lorentz :

div A + dV/dt = 0, (45)

mais ceci n’est nullement obligatoire et les équations de la mécanique quantique restent invariantes lorsque l’on transforme les potentiels sans que les champs correspondants soient modifiés. Les transformations en question forment un groupe, appelé par Weyl groupe de 1’ « Eichinvarianz » et défini par les relations suivantes :

A_alpha -> A_alpha + d(ki)/d(x_alpha) (alpha = 1,2,3,4, A_4 = V) (46)

où ki est une fonction arbitraire des quatre variables d’espace et de temps. A ce groupe correspond la transformation infinitésimale :

A_alpha -> A_alpha + delta*(d(ki)/d(x_alpha)) ,

et on peut montrer que le fait que le moment conjugué du potentiel scalaire est identiquement nul est une conséquence directe de ce que la fonction de Lagrange, formée au moyen des potentiels, admet le groupe de 1’ « Eichinvarianz ». Enfin aux quatre variables correspondent quatre équations canoniques : les trois équations de Maxwell et la condition de divergence.

(1) Il est souvent commode d’utiliser cet arbitraire pour annuler identiquement le potentiel scalaire.

Comparons maintenant ces résultats à ceux de notre théorie. Comme nous avons trois variables (complexes), nous n’avons que trois équations canoniques : les équations de Maxwell. Notre schéma ne nous fournit pas la condition de divergence qu’il faut adjoindre aux trois précédentes comme condition supplémentaire. Ce manque de symétrie dans la théorie (1) est compensé par un gros avantage : le groupe de l’"Eichinvarianz" ne joue aucun rôle dans notre théorie.

La notion de potentiel n’intervient nulle part dans l'exposé logique de celle-ci et en conséquence aucune difficulté de calcul ne peut en résulter.

Passons maintenant à l’étude des conséquences que com porte le fait pour les nouvelles grandeurs de champ d’être complexes. On sait qu’en mécanique quantique une grandeur complexe n’est pas observable. Il en est donc ainsi de nos grandeurs F_alpha comme des fonctions d’onde psi_alpha de la matière. Ceci se voit facilement sur l’expression (39) des F.

Comme E et (rot/sqrt(delta))*(H) d’après les conditions d’échanges (43) ne sont pas permutables, il est impossible de les ramener simultanément à leurs axes principaux et, s’il est possible de mesurer séparément d’après la théorie antérieure, E et H, il est impossible ( 2 ) de mesurer F.

(1) Ce manque de symétrie par rapport à la théorie d’Heisenberg et Pauli est d'ailleurs purement apparent. En effet, dans la deuxième méthode de ces auteurs, on est conduit à poser identiquement nul le potentiel scalaire. Alors, le schéma hamiltonien fournit seulement les équations de Maxwell et il faut imposer comme dans notre théorie la condition de divergence comme condition supplémentaire en montrant qu’elle se propage avec le temps en vertu des équations de Maxwell.

(2) Il importe d’être prudent dans de tels raisonnements : c’est ainsi que pour un électron libre, l’énergie W = (p^2/2*m) + V(x,y,z) où p est le moment et V l’énergie potentielle. Comme il est impossible de mesurer en même temps p et x, y, z, on pourrait en déduire qu’il est impossible de mesurer W. Ceci montre en réalité que la décomposition précédente est impossible en

On pourrait songer à éviter ainsi les paradoxes dont nous avons parlé au chapitre premier sur la mesure de E et de H en convenant que seuls les F doivent intervenir dans les équations de la mécanique quantique et ont seuls un sens physique alors que les grandeurs réelles E et H que les relations (40) permettent de former à partir des F ont seulement un sens mathématique et sont dépourvus de contenu physique.

Considérons par exemple :

E_alpha = (1/2)(F_alpha + F_alpha+) (47)

Comme F_alpha et F_alpha+ ne sont pas permutables, il s'ensuit que E n’est pas observable. Le parallélisme avec la matière peut se poursuivre bien plus loin. C’est ainsi que comme pour les psi, il est impossible de construire avec les F des fonctionnelles sum[F_alpha] définissant le champ. Cela tient à ce que les F_alpha comme les F_alpha+ sont des grandeurs complexes et que seuls existent les problèmes de valeurs propres réelles. En effet, une amplitude de probabilité se rapporte à des mesures possibles et indique combien de fois au cours d’un grand nombre de mesures on trouve telle ou telle répartition du champ. Comme les grandeurs de champ ne sont pas mesurables, il est évident que l’indication d’une telle probabilité n’a aucun sens.

(2, suite) mécanique quantique (Cf. March. Die Grundlagen der Quantenmechanik), mais le fait que les deux parties E et ((rot)/(i*sqrt(delta)))*(H) sont distinguées par la présence du facteur i montre que l'argument reste probant ici.

Ainsi, en quelque sorte, il faut renoncer à une description en termes de champ des phénomènes électromagnétiques puisqu’il nous est impossible de former au moyen des grandeurs de champ une expression qui indique la probabilité pour que ces grandeurs soient représentées par telles ou telles fonctions. Il y a là quelque chose de très important sur quoi on nous permettra de nous arrêter. C’est qu’en effet, le fait que nous sommes obligés de prendre des valeurs complexes pour représenter le champ électromagnétique tient au fond à ce que l’on est conduit à mettre l’énergie classique (1) de l’oscillateur électromagnétique (p^2) + (q^2) sous la forme (p + i*q)*(p — i*q) de manière à supprimer l’énergie au zéro absolu. Ces deux questions sont donc intimement liées. La question de l’énergie au zéro absolu semble donc être plus qu’une difficulté formelle de la théorie; si l’on cherche à la faire disparaître par la voie que nous avons suivie (et l’on ne voit guère dans le cadre des théories actuelles comment il est possible d’y arriver d’une autre façon) cela entraîne un renoncement en quelque manière à la description en grandeurs spatio-temporelles du champ électromagnétique. Certes, le renoncement n’est pas total : la notion de grandeurs de champ garde sa signification, mais il est impossible de former directement avec elle des amplitudes de probabilité. Il y a là une sérieuse différence avec les résultats de Möglich (2) qui se rapportaient à l’hamiltonien classique du rayonnement. En changeant dans son expression au moyen des composantes de Fourier des champs l’ordre de certains facteurs, il est possible de faire disparaître l’énergie au zéro absolu mais il est alors impossible d’exprimer l’énergie du champ en fonction de grandeurs de champ ; elle est définie seulement en fonction des composantes du développement de Fourier envisagé.

  • (1) P. A. M. Dirac. Principles of quantum mechanics, p. 86.
  • (2) F. Mœglich, Ann. der Physik, 2, 1929, p. 676.

Puisqu’il est impossible de former une fonctionnelle au moyen des F, notre amplitude de probabilité sera définie au moyen des nombres M(r,lamda) qui indiquent le nombre de photons situés dans la case (r,lambda). Ce sera donc une fonction d’une infinité de variables M(r,lamda) (donc au fond une fonctionnelle), de même qu’une fonction d’une infinité de variables N(s) se rapportant aux électrons :

Phi(N(S);M(r,lamda)) ,

et il y a symétrie complète entre les deux espèces de particules.

Il sera d’ailleurs possible de passer à l’espace de configuration, la seule forme d’amplitude de probabilité qu’il soit impossible de former est celle relative aux grandeurs de champ elles-mêmes.

On peut retrouver aisément par ces considérations le fait que notre théorie implique la disparition de l’énergie au zéro absolu. Définissons le champ par les variables b(alpha,s), b(alpha+,s) qui satisfont comme nous l’avons vu à la condition d’échange :

[b(alpha+,s), b(alpha,s)] = 2*h*nu(S) (29 bis)

On en déduit (1) que l’opérateur correspondant à b(alpha+,s) n’est autre que :

(h*nu(S))/(Pi*i)*(d/d(b(alpha,s))) (48)

D’autre part, le champ sera représenté par une amplitude de probabilité Phi(b_1(s),b_2(s),...,b_1(t),b_2(t),...) qui indiquera la probabilité de trouver pour les b_alpha(t) une valeur déterminée. Cette amplitude satisfait à la généralisation de l’équation de de Broglie-Schrödinger pour l’électrodynamique du vide, généralisation qui s’écrit évidemment :

(H(barre) - W)*(Phi(b_alpha(t)) = ((1/2)*Sigma(s,alpha)*b_alpha(s)*b_alpha+(t) - W)*(Phi(b_alpha(t))) = ((h/2*Pi*i)(Sigma(nu(s))*(b_alpha(s)*d/d*b_alpha(s) - W)*(Phi(b_alpha(t))) = 0

(49)

  • (1) Voir H. Weyl. Gruppentheorie und Quantenmechanik, 2ème édition, p. 248; P. Jordan et E. Wigner. Z. Physik, 47, 1928,

p. 631, particulièrement p. 649.

La forme de cette équation indique la possibilité de séparer les variables. Elle se décompose donc en une infinité d’équations de la forme :

((h*nu(s))/(2*Pi*i))*(b(alpha,s))*(d(phi(b(alpha,s))))/(d(b(alpha,s))) = W(alpha,s)*phi(b(alpha,s))

(50)

avec :

Phi(b(alpha,t)) = Pi(s,alpha)[(phi(b(alpha,s)))]

W = Sigma(s,alpha)[W(alpha,s)]

L’équation (47) s’intègre par :

phi(b(alpha,s)) = C(alpha,s)(b(alpha,s))*[2*Pi*i*(W(alpha,s))/(h*nu(s))]

où C(alpha,s) est une constante de normalisation. Pour trouver les valeurs propres de W(alpha,s), il faut remarquer que b(alpha,s) est un nombre complexe.

b(alpha,s) = sqrt(2*h*nu(s))*M(s,alpha)^(1/2)*exp((2*Pi*i/h)*theta(alpha,s)) (31 bis)

donc :

phi(b(alpha,s)) = [(2*h*nu(s))*M(s,alpha)]^[2*Pi*i*(W(alpha,s))/(h*nu(s))]*exp[-4*(Pi^2)*(W(alpha,s)/(h^2*nu(s)))*theta(alpha,s)]

(51)

Le second facteur de (48) est évidemment uniforme. Quand au premier, pour qu’il soit une fonction uniforme de M(s,alpha), il faut que :

W(alpha,s) = n*h*nu(s)

où n est un entier arbitraire. Nous retrouvons donc la quantification sans énergie au zéro absolu (1).


  • 9. Transformation de Lorentz.

— Pour étudier comment se transforment les grandeurs H et S lorsque l’on effectue une transformation de Lorentz, la façon la plus commode est de commencer par définir le tenseur de Maxwell. Nous connaissons déjà de lui les quatre composantes temporelles : l’énergie et les trois composantes du vecteur de Poynting. Quelles sont les conditions que doivent remplir les autres composantes? Il faut naturellement qu’elles forment avec les quatre précédentes un tenseur, puis que pour h = 0, on retrouve les tensions de Maxwell habituelles, enfin que l’on ait un théorème de conservation :

d(S(i,k))/d(x_k) = 0.

On peut mettre les équations de Hamilton (15) sous la forme :

dF/d(c*t) = sqrt(delta)*F = -rot(rot(F)/sqrt(delta)) ,

ou, plus explicitement, et posant i*c*t = l,

d/dy(rot_3(F)/sqrt(delta)) - d/dz(rot_2(F)/sqrt(delta)) + d(i*(F_1))/dl = 0 , -d/dx(rot_3(F)/sqrt(delta)) + d/dz(rot_1(F)/sqrt(delta)) + d(i*(F_2))/dl = 0 , d/dx(rot_2(F)/sqrt(delta)) - d/dy(rot_1(F)/sqrt(delta)) + d(i*(F_3))/dl = 0 , d/dx(i*(F_1)) + d/dy(i*(F_2)) + d/dz(i*(F_3)) = 0 ,

(1) On ne peut continuer bien loin dans cette direction, car les phi(b(alpha,s)) ainsi déterminées sont impossibles à normaliser, l’intégrale correspondante divergeant. Il en est d’ailleurs de même dans les problèmes de choc par exemple et d’une manière générale lorsque d’après les conditions physiques du problème il doit y avoir une densité finie d’électrons à l’infini.

Ce système d’équations nous montre, en tenant compte de ce que, comme nous le verrons au chapitre IV, les seconds membres correspondent dans le cas de la matière au quadrivecteur courant-charge que l’on peut considérer les six quantités :

M(x,l) = i*(F_1) , M(y,l) = i*(F_2) , M(z,l) = i*(F_3) , M(y,z) = rot_1(F)/sqrt(delta) , M(z,x) = rot_2(F)/sqrt(delta) , M(x,y) = rot_3(F)/sqrt(delta) (52)

comme formant un vecteur M à six composantes, correspondant au vecteur de champ de la théorie classique (1). A côté de ce vecteur (2), nous définirons le vecteur adjoint M+.

M(x,l)+ = -i*(F_1)+ , M(y,l)+ = -i*(F_2)+ , M(z,l)+ = -i*(F_3) , -M(y,z)+ = rot_1(F)+/sqrt(delta) , -M(z,x)+ = rot_2(F)+/sqrt(delta) , -M(x,y)+ = rot_3(F)+/sqrt(delta) (52 bis)

On sait qu’alors les quantités MM+, (MM(tilde)+) sont invariantes dans la transformation de Lorentz (3). On peut montrer tout comme dans la théorie classique que les équations d’Hamilton (15) sont invariantes dans une telle transformation, comme on devait s’y attendre puisque comme nous l’avons vu, elles sont identiques aux équations de Maxwell.

Les relations (49) et (49 bis) permettent d’étudier comment se transforment les F au cours d’une transformation de Lorentz. C’est ainsi que pour une translation parallèle à l’axe Ox et de vitesse beta*c, on a :

M(x,l) = M(x',l') , M(y,l) = (M(y',l') - i*beta*M(x',y'))/(sqrt(1-(beta^2))) , M(z,l) = (M(z',l') + i*beta*M(z',x'))/(sqrt(1-(beta^2))) ,

M(y,z) = M(y',z') , M(z,x) = (M(z',x') - i*beta*M(z',l'))/(sqrt(1-(beta^2))) , M(x,y) = (M(x,y) + i*beta*M(y',l'))/(sqrt(1-(beta^2))) ,

  • (1) M. v. Laue. La théorie de la relativité, édition française,

t. I, pp. 116 et suivantes.

  • (2) L’introduction du vecteur adjoint est nécessaire si l’on veut obtenir des expressions hermitiennes.
  • (3) M est le vecteur associé défini par M(l,m)(tilde) = M(n,p) , où les indices lmnp sont tous différents et tels que la disposition lmnp se déduise de xyzl par un nombre pair de permutations.

En résumé, nous voyons que les F se transforment comme le champ électrique et les (rot(F))/(sqrt(delta)) comme le champ magnétique.

On est alors tout naturellement amené à poser pour expression du tenseur de Maxwell :

2T = M X M+.

On vérifie facilement que cette expression est conforme aux conditions requises. Nous noterons simplement que H(barre) et S1, S2 , S3 constituent un quadrivecteur d’univers. Par suite H(barre) se transforme comme la quatrième composante d’un quadrivecteur d’univers.

Quant à l’invariance de la fonction de Lagrange vis-à-vis des transformations de Lorentz, elle se déduit du fait que les équations d’Hamilton que l’on peut en tirer satisfont à cette condition. L’expression :

sum(L*dv*dt)

est donc un invariant intégral du groupe considéré.


  • 10. Une autre représentation des grandeurs de champ.

— L’étude précédente nous conduit à indiquer une autre façon d’écrire les relations (23) et (28), qui rendra peut-être plus aisée la compréhension de la signification géométrique des opérateurs qui ont été introduits dans ce chapitre, Définissons un vecteur unité eta(S,lambda) de composantes eta_alpha(S,lambda) par la relation :

eta_alpha(S,lambda) = D(alpha,lambda)(S), lambda = 1,2, alpha = 1,2,3 (53)

Nous aurons donc :

vecteur(F) = vecteur(eta(S,lambda))*b(lambda,S)*omega(S)

Considérons par exemple la première composante de rot(F) :

-(rot_1)(eta(S,lambda)*b(lambda,S)*w(S)) = -(d/d(x_2))((eta_3)(S,lambda)*b(lambda,S)*w(S)) , +(d/d(x_3))((eta_2)(S,lambda)*b(lambda,S)*w(S)) = -((eta_3)(S,lambda)*b(lambda,S)*(Pi*i/L)*(k_2)(S)*w(S)) +((eta_2)(S,lambda)*b(lambda,S)*(Pi*i/L)*(k_3)(S)*w(S))

Si donc nous considérons le vecteur unité ki(S,lambda) de composantes ki_alpha(S,lambda) perpendiculaire à eta(S,lambda) et défini par :

ki(S,lambda) = [(eta)(S,lambda)*(vecteur)(k(S))/|k(S)|]

(54)

nous en tirons que :

-(rot_1)(F) = (Pi*i/L)*(ki_1)(S,lambda)*b(lambda,S)*|k(S)|*w(S)

et finalement :

-(rot/(sqrt(delta)))(E) = ki(S,lambda)*b(lambda,S)*w(S)

Les deux grandeurs F et (rot/sqrt(delta))(F) sont donc représentées par les deux développements suivants dont on notera la grande analogie :

vecteur(F) = (eta)(S,lambda)*b(lambda,S)*w(S)

On peut tirer de ces relations quelques conséquences intéressantes. La relation (53) nous montre que l'on obtient les trois composantes du vecteur eta(S,lambda) en prenant la première ou la deuxième colonne (suivant la valeur de lambda) du tableau (26).

Ceci montre que eta(S,lambda) est dans le plan perpendiculaire au vecteur k(S) . Comme ki(S,lambda) est perpendiculaire à la fois à eta(S,lambda) et à k(S), il suit de là que les deux vecteurs eta(S,lambda) et ki(S,lambda) correspondent aux deux directions privilégiées du plan d’onde que nous avons indiquées précédemment. D’autre part les développements (55) montrent bien quelle est la nature de la relation entre F et (rot/sqrt(delta))(F). Pour passer de l’un à l’autre, il faut pour chaque onde plane faire subir (toujours dans le même sens) une rotation de Pi/2 au vecteur eta(S,lambda) puis prendre son opposé. 11 n’existe pas de relation simple analogue entre les vecteurs totaux F et (rot/sqrt(delta))(F).

Comparons maintenant ces relations à (40). On voit immédiatement que les composantes de E sont dirigées suivant le vecteur eta(S,lambda), tandis que les composantes de H sont dirigées suivant les vecteurs ki(S,lambda). Ceci fournit donc une nouvelle justification de l'assimilation que nous avons faite au paragraphe 6 des deux premières composantes des b(lambda,S) avec les deux vibrations rectilignes. Enfin nous voyons que ce qui précède est bien en accord avec les lois de transformation des F et (rot/sqrt(delta))(F) lors d’une transformation de Lorentz. Au moyen de ces développements, il est possible de mettre le tenseur de Maxwell sous une forme particulièrement commode. Posons :

-(beta)(44)(r,lambda,s,mu) = w = (1/4)*sum_lambda[(eta(alpha,lambda))*((eta)(alpha,s,mu)) + ki(alpha,r,mu)*ki(alpha,r,lambda)]

(beta)(i,j)(r,lambda,s,mu) = delta(i,j)*w - (1/4)*[(eta(i,r,lambda))*(eta(j,s,mu)) + ki(i,r,lambda)*ki(j,r,lambda)] -(1/4)[(eta(i,s,mu))*((eta)(j,r,lambda)) + ki(i,s,mu)*ki(j,r,lambda)]

(beta)(i,4)(r,lambda,s,mu) = (beta)(4,i)(r,lambda,s,lambda) = (i/4)*[[(eta)(r,lambda)*(ki)(s,mu)]_j + [(eta)(s,mu)*(ki)(r,lambda)]_j] i,j = 1,2,3,...

Au moyen du tenseur beta(i,j)(r,lambda)(S,mu) ainsi défini, le tenseur de Maxwell s’écrit :

T(i,j) = Sigma(r,lambda,s,mu)((beta)(i,j)(r,lambda,s,mu))*b(lambda,r)*b(mu+,S)*w(r)*w(s)(étoile) ,

forme qui nous sera très utile au chapitre suivant.


CHAPITRE III

Fluctuations du rayonnement du corps noir.


  • 1. La théorie des fluctuations du rayonnement noir avant la nouvelle mécanique quantique.

— En 1912, Einstein (1) a tiré une conséquence remarquable de la formule de Planck. Celle-ci peut s’écrire de la façon suivante : l’énergie moyenne W(nu)(barre) de la radiation de fréquence comprise entre nu et nu + d(nu) contenue dans le volume v est donnée par :

W(nu)(barre) = v*((8*Pi*(nu^2))/(c^3))*[(h*nu*d(nu))/exp((h*nu)/(k*T))-1]

Or une démonstration thermodynamique pure (c'est-à-dire indépendante de tout modèle, ondulatoire ou corpusculaire du rayonnement) indique entre le carré moyen (delta(nu)^2)(barre) de la fluctuation de l’énergie et l’énergie moyenne la relation :

(delta(nu)^2)(barre) = k*(T^2)*(d(W(nu)(barre))/dT)

d’où l’on déduit la formule d’Einstein (2) :

  • (1) A. Einstein. La théorie du rayonnement et des quanta (Congrès Solvay, 1912, p. 419).
  • (2) Nous l'utiliserons également sous la forme suivante : soit z v le nombre de degrés de liberté de la radiation (v,v + dv) dans

(delta(nu)^2)(barre) = h*nu*W(nu)(barre) + (W(nu)(barre)^2)/[(8*Pi*(nu^2)/(c^3))*d(nu)*v]

(1)

Si maintenant l’on cherche à retrouver cette formule au moyen d’un modèle corpusculaire ou ondulatoire, du champ de rayonnement, on constate le fait suivant : aucune des deux interprétations ne peut rendre compte à la fois des deux termes du second membre de (1). La théorie corpusculaire rend compte du premier terme seulement, la théorie ondulatoire rend compte du second terme seulement. Dans cette formule apparaît ainsi d’une façon particulièrement saisissante la nécessité de concilier, d’adapter l’un à l’autre les concepts d’onde et de particule. Mais jusqu’à la nouvelle mécanique quantique, aucun résultat n’a pu être obtenu dans ce sens.


  • 2. Introduction de la nouvelle mécanique quantique.

— Ce fut justement un des gros succès du début de la mécanique quantique que de permettre une démonstration ondulatoire directe de la formule d’Einstein. Il était d’ailleurs assez naturel d’espérer ce résultat si l’on pense à la fusion intime de la théorie ondulatoire et de la théorie corpusculaire qu’elle réalise. Ce pas essentiel a été fait par M. Born, W. Heisenberg et P. Jordan (1) dans un de leurs premiers mémoires sur la nouvelle mécanique quantique. En étudiant (pour éviter des calculs trop compliqués) les fluctuations d’énergie dans un continuum à une dimension, et en considérant les coefficients du développement de Fourier des champs électrique et magnétique comme des nombres non commutatifs, ils alliaient comme je viens de l’indiquer, la notion d’ondes et la notion de corpuscules.

(2, suite) le volume v, n(nu) le nombre de quanta de lumière (nu, nu + d(nu)) appartenant au même volume, on a :

(delta(nu)^2)(barre)/(W(nu)^2)(barre) = 1/(z(nu)) + 1/(n(nu))

(1 bis)

  • (1) M. Born, W. Heisenberg et P. Jordan. Z. Physik, 39 (1926), p. 610 ; M. Born et P. Jordan. Elem. Quantenmechanik, p. 386.

Après un calcul assez compliqué, on retrouve la loi d’Einstein. D’ailleurs Bose avait montré que si l’on applique une statistique convenable (1) aux quanta de lumière, on retrouve la loi d’Einstein. Ainsi est rétabli le parallélisme complet entre interprétation corpusculaire et interprétation ondulatoire du rayonnement.

Voyons maintenant comment la théorie des quanta modifie la démonstration ondulatoire classique pour aboutir au résultat correct. Les modifications tiennent essentiellement à l’existence, comme nous allons le voir, de l’énergie au zéro absolu. On trouve, en effet, pour un continuum de longueur L sur lequel on considère un segment à (2) :

W(nu)(barre) = (a/L)*z(nu)*d(nu)*h*nu*(M_nu + 1/2) ,

(delta(nu)^2)(barre) = (a/2*c)*d(nu)*[(((c*W(nu)(barre))/(a*d(nu)))^2) - ((h*nu)^2)]

Nous décomposons maintenant W(nu)(barre) en deux parties : l’une est l'énergie au zéro absolu (a/L)*z(nu)*d(nu)*h*nu/2, l'autre W(nu,t)(barre) correspond à « l’énergie thermique » habituelle. On a alors :

(delta(nu)^2)(barre) = (a/2*c)*d(nu)*[((((c*W(nu,t))(barre))/(a*d(nu))))^2) + (((2*c*W(nu,t))(barre))/(a*d(nu)))*h*nu] = ((W(nu,t)(barre))^2)/((a/L)*d(nu)*z*nu) + h*nu*(W(nu,t)(barre))

  • (1) On sait que cette statistique revient à considérer les corpuscules lumineux comme n’étant pas indépendants les uns des autres : A. Einstein. Berl. Berichte (1925), p. 3; W. Bothe. Z. Physik, 26 (1924), p. 178 ; R. Furth. Z. Physik, 50 (1928),
  • (2) Dans cette relation, z(nu) est le nombre de degrés de libertés de la radiation, défini p. 66, note 1.

C’est-à-dire (1 bis). Nous voyons facilement ici le rôle essentiel que joue l’énergie au zéro absolu. C’est à lui que doit être attribuée l’apparition du terme (h*nu)*W(v,t) qui faisait défaut dans la théorie ondulatoire classique. Mais, nous l’avons vu, ce terme supplémentaire d’énergie au zéro absolu apporte avec lui des complications peu naturelles et il était intéressant de se rendre compte si l’on pouvait modifier la démonstration précédente tout en conservant le résultat, de manière à éviter l'emploi de celte énergie indésirable. C’est ce qu’a fait Möglich (1) dans un travail que nous avons déjà cité page 31. Comme nous l’avons vu, il modifie l’ordre des facteurs dans la fonction de Hamilton de manière à faire disparaître le terme d’énergie au zéro absolu. Dans ces conditions, il montre par une méthode très analogue à celle qui vient d’être rappelée qu’on obtient bien la formule d’Einstein. Nous avons déjà examiné les critiques que l’on peut faire à cette conception. Quoi qu’il en soit, ce travail a montré que les questions de la formule correcte des fluctuations et de l’énergie au zéro absolu ne sont pas liées d’une façon aussi étroite que l’on avait pu le croire.

Les calculs que nous allons indiquer plus loin sont très analogues à ceux de Möglich : Ils procèdent de morne du travail de Born, Heisenberg et Jordan. On nous permettra de faire remarquer leur grande simplicité comparée aux raisonnements des auteurs précédents. Cette simplicité nous a permis de donner explicitement le calcul de la formule d’Einstein dans le cas tridimensionnel, calcul qui, depuis l’avènement de la nouvelle mécanique quantique, n’avait, à notre connaissance, par suite de sa trop grande complication, jamais été exécuté.

Pour permettre plus facilement la comparaison avec les travaux précédents, nous donnerons avec quelques détails le calcul des fluctuations pour un continuum à une dimension,

  • (1) F. Möglich. Ann. der Phys., 2 (1929), p. 676.

ce qui nous permettra de passer plus rapidement sur le cas tridimensionnel.


  • 3. Formule d’Einstein pour un continuum unidimensionnel.

— Considérons un continuum à une dimension, une « corde » de longueur L,

-L/2 <= x <= L/2 ,

La fonction de Hamilton relative à une dimension s’écrira ici :

H(x) = (1/2)*Sigma(j,k)b(j)*b(k)+*w(j)*w(k)' ,

où w et w(j)' sont données par :

w(j) = [(L)^(-1/2)]*exp[(i*Pi/L)*(r(j)*x)] ,

w' = [(L)^(-1/2)]*exp[(-i*(Pi/L))*(r(j)*x)] ,

(2)

où r(j) est le nombre de nœuds présentés par la vibration d’ordre j et est relié à la fréquence correspondante par :

nu(j) = (c/(2*L))*r(j) ,

(3)

et où b(j) et b(j)+ sont reliés au nombre de quanta correspondant par la formule, analogue à (31) du chapitre précédent ;

b(j) = sqrt(2*h*nu(j))*[(M(j))^(1/2)]*exp[-(2*Pi*i/h)*(theta(j))] ,

b(j)+ = sqrt(2*h*nu(j))*exp[(2*Pi*i/h)*(theta(j))]*[(M(j))^(1/2)]

(4)

Plus explicitement, H(x) s’écrit donc :

H(x) = (1/(2*L))*sum(j,k)[b(j)*b(k)+*exp[(i*Pi/L)*(r(j)-r(k))*x] ,

et l’énergie du continuum relative au segment(-a/2, a/2) est :

W(a) = sum_(-a/2)_(a/2)(H(x)*dx) = (a/(2*L))*Sigma(j,k)b(j)*b(k)+*[sin((Pi/(2*L))*(r(j) - r(k))*a)]/[(Pi/(2*L))*(r(j) - r(k))*a]

(5)

Par suite l’énergie moyenne relative au même segment s’obtient à partir de l’expression précédente (1) et s’écrit :

W(a)(barre) = (a/(2*L))*Sigma_j(b(j)*b(j+)) = (a/L)*(Sigma_j(h*nu(j)*M(j))

(6)

Ceci nous montre encore une fois la disparition de l’énergie au zéro absolu et nous montre aussi que, comme il fallait s’y attendre, la répartition moyenne de l’énergie est uniforme sur le continuum. Comme cette valeur moyenne s’obtient en ne prenant dans (7) que la partie de la somme correspondant à j = k, nous obtiendrons la fluctuation :

delta = W(a) — W(a)(barre),

en supprimant dans (5) cette partie de la somme. Donc

delta = (a/(2*L))*Sigma(j,k,j<>k)(b(j)*b(k)+*[sin((Pi/(2*L))*(r(j) - r(k))*a)]/[(Pi/(2*L))*(r(j) - r(k))*a])

Formons-en le carré :

(delta^2) = ((a^2)/(4*L^2))*Sigma(j,k,l,m)(j<>k,l<>m)(b(j)*b(k)+*b(l)*b(m)+*[sin((Pi/(2*L))*(r(j) - r(k))*a)]/[(Pi/(2*L))*(r(j) - r(k))*a]*[sin((Pi/(2*L))*(r(l) - r(m))*a)]/[(Pi/(2*L))*(r(l) - r(m))*a]

et l’on obtient la valeur moyenne (delta^2)(barre) de (delta^2) en prenant dans les sommes précédentes les termes diagonaux, c’est-à-dire en y faisant j = m, k = l.

(1) Quoique le temps ne figure pas explicitement dans nos relations, il va sans dire que b(j) par exemple doit être considéré comme étant de la forme (b(j))*exp(2*Pi*i*nu(j)*t). Lorsque l’on prend la moyenne sur le temps, seuls apportent une contribution les termes j = k.

(delta^2)(barre) = Sigma(j,k)(j<>k)((a^2)/(4*L^2))(b(j)*b(k)+*b(k)*b(j)+)*[[sin((Pi/(2*L))*(r(j) - r(k))*a)]/[(Pi/(2*L))*(r(j) - r(k))*a]^2] = [(h^2)*(a^2)/(L^2)]*Sigma(j,k)(j<>k)(nu(j)*nu(k)*M(k)*(M(k) + 1)*[[sin((Pi/(2*L))*(r(j) - r(k))*a)]/[(Pi/(2*L))*(r(j) - r(k))*a]^2]

(7)

Supposons maintenant que L augmente indéfiniment.

D’après (3), les fréquences sont de plus en plus rapprochées les unes des autres et à la limite 011 peut remplacer les sommes (7) par des intégrales. Si, d’autre part, on tient compte de ce que, toujours d’après (3), le nombre de fréquences propres comprises à l’intérieur de l’intervalle (nu, nu + d(nu)) est 2*L*d(nu)/c, les intégrales en question s’écrivent :

(delta^2)(barre) = [(h^2)*(a^2)/(L^2)]*sum(sum((nu_1)*(nu_2)*M(nu_1)*(M(nu_2)+1)*[[(sin((Pi/c)*(nu_1 - nu_2)*a)/((Pi/c)*(nu_1 - nu_2)*a)]^2]*(4*(L^2)/(c^2))*d(nu_1)*d(nu_2) ,

et en tenant compte de ce que :

lim(infini)(1/a)*sum_-grand_omega_grand_omega'(sin^2(omega*a)/(omega^2))*f(omega)*d(omega) = (Pi/2)*f(0) , pour grand_omega, grand_omega'>0

(7 bis)

si on fait augmenter a indéfiniment de manière toutefois que le rapport a/L reste constamment inférieur à 1, il vient :

(delta^2)(barre) = (2*(h^2)*a/c)*sum((nu_2)*M(nu)*[M(nu) + 1]*d(nu) = sum((delta_nu^2)(barre))

(8)

en posant

(delta_nu^2)(barre) = (2*(h^2)*a/c)*(nu^2)*(M^2)(nu)d(nu) + (2*(h^2)*a/c)*(nu^2)*M(nu)d(nu)

(9)

D’autre part (6) peut s’écrire aussi :

W(a)(barre) = sum(W(nu)(barre))

avec :

W(nu)(barre) = (2*a*h/c)*M(nu)*nu*d(nu).

(10)

En comparant (9) et (10), on a immédiatement :

(delta_nu^2)(barre) = (W(nu)(barre)^2)/((2*a/c)*d(nu)) + h*nu*W(nu) (11)

Or, nous avons vu que 2*a*d(nu)/c représente le nombre de degrés de liberté (z_nu) correspondant à la longueur a et à l’intervalle de fréquence (nu, nu + d(nu)). D’autre part, le nombre de quanta de lumière contenus dans a et appartenant au môme intervalle de fréquences est :

n(nu) = 2*a*(d(nu)/c)*M(nu).

(12)

Avec ces nouvelles notations (11) devient :

(delta_nu^2)(barre)/(W(nu)(barre)^2) = 1/(z(nu)) + 1/(n(nu)) ,

(13)

c’est-à-dire la formule d’Einstein.

Il est intéressant de remarquer (1) que la condition que a est très grand (et qui revient évidemment à supposer la longueur d’onde étudiée petite devant a) a la signification physique suivante : les fluctuations de l’énergie proviennent de passages d’énergie entre deux fréquences telles que (nu_1) et (nu_2). Pour que de telles « ondes de fluctuation » puissent fournir une fluctuation appréciable pour l’intervalle a, il est nécessaire qu’elles aient une longueur d’onde au moins égale à a.

  • (1) Born et. P. Jordan. Loc. cit., p. 397.

Si alors a est grand vis-à-vis des longueurs d’onde des oscillations propres considérées, les oscillations ne peuvent agir que si elles ont de très grandes longueurs d'ondes vis-à-vis de lambda. Il n’y a donc interférence possible qu'entre fréquences (nu_1)*(v_2) infiniment voisines.


  • 4. Formule d’Einstein par un continuum tridimensionnel.

Considérons un cube d’arête L avec les fonctions correspondantes :

w(s) = ((L)^(-3/2))*exp((i*Pi/L)*(vecteur(r)(s).vecteur(x)) , w(s)' = ((L)^(-3/2))*exp(-(i*Pi/L)*(vecteur(r)(s).vecteur(x)) ,

(14)

On ne peut pas écrire directement H(x, y, z) en fonction des b(alpha,s) et b(alpha+,s), il faut partir de l’expression à partir des f(alpha,s) et f(alpha+,s) puis effectuer les rotations D(s) indiquées au chapitre précédent. On trouve ainsi que l’analogue de (5), énergie d’un cube d’arête a est :

W(a) = [(a^3)/(2*(L^3))]*sum_alpha(sum_lambda_mu(sum_j_k(D(alpha,lambda,j)*D(alpha,mu,k)*b(lambda,j)*b(mu+,k)))). [[sin((Pi/(2*L))*(r(j,1) - r(k,1))*a)]/[(Pi/(2*L))*(r(j,1) - r(k,1))*a]*[sin((Pi/(2*L))*(r(j,2) - r(k,2))*a)]/[(Pi/(2*L))*(r(j,2) - r(k,2))*a]*[sin((Pi/(2*L))*(r(j,3) - r(k,3))*a)]/[(Pi/(2*L))*(r(j,3) - r(k,3))*a]]

(15)

On en tire pour la valeur moyenne W(a)(barre), en y faisant = k:

W(a)(barre) = [(a^3)/(L^3)]*Sigma(j,lambda)((h*nu(j))*M(j,lambda))

puis en prenant pour expression de delta la somme (15) en y faisant j<>k, puis prenant la moyenne de (delta^2) sur le temps (1) :

(delta^2)(barre) = [(a^6)*(h^2)/(L^6)]*[Sigma(alpha,beta)[Sigma(lambda,mu)[Sigma(j,k)(j<>k)D(alpha,lambda,j)*D(alpha,mu,k)*D(beta,mu,k)*D(beta,lambda,j)*nu(j)*nu(k)*M(j,lambda)*[M(k,mu) + 1]([ ]^2)

  • (1) Dans la formule suivante, l’expression [ ] représente la parenthèse entrant en jeu en (15).

Si l'on augmente L indéfiniment, on passe comme au paragraphe précédent au cas où les fréquences propres forment un ensemble continu. Dans ces conditions, les éléments de matrice tels que D(alpha,lambda,j) deviennent des fonctions continues de l’indice j.

Pour l’indiquer, nous les écrirons :

D(alpha,lambda)(r,j)

et l’on a :

(delta^2)(barre) = (a^6)*(h^2)*(Sigma(alpha,beta)(Sigma(lambda,mu)(sum(sum(D(alpha,lambda,r(1))*D(beta,lambda,r(1))*D(alpha,mu,r(2))*D(beta,mu,r(2))*nu(1)*nu(2)*M(lambda,nu(1))*[M(mu,nu(2)) + 1]. ([ ]^2)*dr(1,1)*dr(2,1)*dr(3,1)*dr(1,2)*dr(2,2)*dr(3,2) ,

Soit en tenant compte de (7 bis) :

(delta^2)(barre) = [(h^2)*(a^3)/(c^3)]*(Sigma(alpha,beta)(Sigma(lambda,mu)sum(D(alpha,lambda,r)*D(beta,lambda,r)*D(alpha,mu,r)*D(beta,mu,r)*(nu^2)*M(lambda,nu)*[M(mu,nu) + 1]*dr(1)*dr(2)*dr(3),

c’est-à-dire en prenant des coordonnées polaires, r, theta, phi, et en tenant compte des relations d’orthogonalité que vérifient les éléments de la matrice unitaire D(alpha,lambda,r),

(delta^2)(barre) = [(8*Pi)*(h^2)*(a^3)/(c^3)]*(Sigma(lambda)(sum((nu^2)*M(lambda,nu)*[M(lambda,nu) + 1]d(nu)))

(16)

et en posant :

(delta^2(nu))(barre) = [(8*Pi)*(h^2)*(a^3)/(c^3)]*(Sigma(lambda)((nu^2)*M(lambda,nu)*[M(lambda,nu) + 1]d(nu)))

W(nu)(barre) = [(8*Pi)*h*(a^3)/(c^3)]*(Sigma(lambda)(M(lambda,nu)d(nu)))

z(nu) = [(8*Pi)*(a^3)/(c^3)]*(nu^2)*d(nu)

n(nu) = [(8*Pi)*(a^3)/(c^3)]*(nu^2)*d(nu)*M(nu)

on retrouve la formule d’Einstein (1 bis) pour le cas tridimensionnel.


  • 5. Sur une autre formule d’Einstein.

— Einstein a montré également (1)) que dans le cas limite de la loi de Wien, la probabilité pour que l’énergie E de la radiation nu se trouve à un instant donné toute entière concentrée dans la portion v(0) du volume total v est donnée par :

P = [(v/v(0))^(E/(h*nu))]

formule évidemment susceptible d’une interprétation corpusculaire directe. P. Jordan (2) a montré récemment que la théorie d’hyperquantification des ondes électromagnétiques en établissant un parallélisme rigoureux avec la théorie corpusculaire, permet de rendre compte de cette formule.

Comme ses considérations sont indépendantes de la forme de la fonction de Hamilton considérée, elles subsistent entièrement dans notre théorie, qui permet ainsi de rendre compte d’une manière ondulatoire de tous les phénomènes de fluctuations, de môme que la statistique de Bose-Einstein permet d’en rendre compte d’une manière corpusculaire. Ainsi est établie à nouveau l’identité des deux conceptions.


  • 6. Interaction entre ondes gravitationnelles et ondes électromagnétiques.

— D’après la théorie de la gravitation d'Einstein, l’existence d’un champ électromagnétique entraîne l’apparition d’un champ gravitationnel. Les coefficients g(i,k) du (ds^2) fondamental diffèrent des valeurs qu’ils prennent pour un champ de Minkowski et à cette « déformation » de l’espace correspond une certaine énergie gravitationnelle du rayonnement.

  • (1) A. Einstein, Ann. der Phys., 17, (1905), p.132.
  • (2) P. Jordan, Z. Physik, 45 (1927), p.773.

Cette énergie a été calculée par L. Rosenfeld (1) au moyen de la théorie de Heisenberg et Pauli. Il aboutit au résultat suivant : l’énergie gravitationnelle du rayonnement est infinie; elle se décompose en deux parties, toutes deux infinies ; l’une est indépendante du nombre de photons ; l’autre lui est proportionnelle et correspond à une énergie d’interaction infinie entre photons et ondes gravitationnelles. Les calculs que nous allons indiquer rapidement ont eu pour but de préciser quel est le rôle de l’énergie du rayonnement au zéro absolu dans cette difficulté.

Posons :

g(i,k) = delta(i,k) + ki*gamma(i,k)

où ki est la constante d’Einstein (ki = 8*Pi*f/(c^4) , où f est la constante de la gravitation de Newton).

Les équations de la gravitation d’Einstein s’écrivent (2) :

Sigma(k)(d^2(gamma(i,k))/d((x(k))^2)) = -2*ki*T(i,k)

(17)

où T(i,k) est le tenseur de Maxwell défini p. 62. On peut mettre ces équations (ainsi que les équations de Maxwell naturelle ment modifiées par des termes gravitationnels) sous forme hamiltonienne, la fonction de Hamilton s’écrivant dans le cas présent, en tenant compte du théorème de conservation auquel satisfait T(i,k) :

H(ronde) = (1/2)*(Sigma(alpha)(F(alpha)*F(alpha)+ + (1/8)Sigma(r,s,i)(d(gamma(r,s)/d(x^i))*(d(gamma(r,s)/d(x^i)) - (1/4)Sigma(r,s)(d(gamma(r,s)/d(x^4))*(d(gamma(r,s)/d(x^4)) - (ki/2)Sigma(r,s)(gamma(r,s)*T(r,s))

(18)

(1) L. Rosenfeld, Z. Physik, 65 (1930), p. 689. Afin de faciliter la comparaison, nous suivons de très près la méthode de Rosenfeld.

(2) Dans tous les calculs suivants, on a : x(1) = x , x(2) = y , x(3) = z , x(4) = i*c*t

D’autre part, au moyen du tenseur beta(i,j)(r,lambda,s,mu) défini p. 64, le tenseur de Maxwell s’écrit :

T(i,j) = Sigma(r,lambda,s,mu)((beta)(i,j)(r,lambda,s,mu))*b(lambda,r)*b(mu+,S)*w(r)*w(s)(étoile)

(17) s’intègre alors au moyen de la formule de Kirchhoff et s’écrit :

gamma(i,k) = -ki((L^2)/(Pi^2))*Sigma(r,lambda,s,mu)((beta)(i,j)(r,lambda,s,mu))*b(lambda,r)*b(mu+,S)*w(r)*w(s)(étoile)/(|k(r)|*|k(s)|*cos(theta(r,s))) ,

(19)

où cos(theta(r,s)) est donné par :

cos(theta(r,s))) = (vecteur(k(r)).vecteur(k(s)))/(|k(r)|*|k(s)|)

gamma(i,k) étant du premier ordre en ki,

H(ronde)(barre) - (1/2)*(Sigma(alpha)(F(alpha)*F(alpha+)))(barre) = H(ronde)(barre) - Sigma(r,lambda)(M(r,lambda)*h*nu(r))

sera du second ordre en ki. On obtient donc l’approximation du second ordre en introduisant dans (18) la valeur (19) de gamma(i,k) et prenant le terme diagonal. On obtient pour le second et le troisième termes de (18) :

H(G) = (-1/8)*Sigma(j,k,i)(i=1,2,3)(Sigma(r,s,lambda,mu)Sigma(r',s',lambda',mu')(beta(j,k)(r,lambda,s,mu)*beta(j,k)(r',lambda',s',mu')*b(lambda,r)*b(mu+,s)*b(lambda',r')*b+(mu',s')*w(r)*w(s)(étoile)*w(r')*w(s')(étoile)*(k(i,r)-k(i,s))*(k(i,r')- k(i,s'))/[|k(r)|*|k(s)|*|k(r')|*|k(s')|*(cos(theta(r,s) - 1))*cos(theta(r',s') - 1)])

(-1/8)*Sigma(j,k)(Sigma(r,s,lambda,mu)Sigma(r',s',lambda',mu')(beta(j,k)(r,lambda,s,mu)*beta(j,k)(r',lambda',s',mu)*b(lambda,r)*b(mu+,s)*b(lambda,r)*b+(mu',s')*w(r)*w(s)(étoile)*w(r')*w(s')(étoile)*(k(r)-k(s))*(k(r')- k(s'))/[|k(r)|*|k(s)|*|k(r')|*|k(s')|*(cos(theta(r,s) - 1))*cos(theta(r',s') - 1)])

(20)

On obtient les termes diagonaux de cette expression en y faisant r = s, r' = s', ou r = s', s = r'. On est donc amené à calculer Sigma(j,k)((beta(j,k)(r,lambda,s,mu))^2) qui, étant covariante vis-à-vis des rotations se calcule aisément en considérant le cas particulier où le trièdre (O,x,y,z) est confondu avec le trièdre ki(r,lambda), eta(r,lambda), k(r). On obtient ainsi :

Sigma(j,k)((beta(j,k)(r,lambda,s,mu))^2) = (1/4)*((1-cos(theta(r,s))^2)

(21)

D’autre part, lorsqu’on intègre (20), on constate que les termes diagonaux correspondant à r = s, r' = s' disparais sent. En tenant compte de :

b(lambda,s) = sqrt(2*h*nu(s))*(M(s,lambda)^(1/2))*exp[(2*Pi*i/h)*(theta(lambda,s)] ,

b+(lambda,s) = sqrt(2*h*nu(s))*exp[(-2*Pi*i/h)*(theta(lambda,s)]*(M(r,lambda)^(1/2))

nu(s) = (c/2*L)*|k(s)|

on obtient pour H(G)(barre) :

H(G)(barre) = ((ki^2)*(c^2)*(h^2)/32*(Pi^2)*(L^3))*Sigma(r,s,lambda,mu)(M(r,lambda))(M(s,mu) + 1)[((|k(r)| - |k(s)|)^2) + Sigma(i)(k(1,r) - k(1,s))^2)]/(|k(r)|*|k(s)|)

= ((ki^2)*(c^2)*(h^2)/16*(Pi^2)*(L^3))*Sigma(r,s,lambda,mu)(M(r,lambda))(M(s,mu) + 1)[(|k(r)|^2) + (|k(s)|^2) - |k(r)|*|k(s)|(1 - cos(theta(r,s)))]/(|k(r)|*|k(s)|)

(22)

Enfin la dernière partie de (18) s’écrit :

H(I)(Barre) = (-ki/2)*Sigma(r,s)(sum(gamma(r,s)*T(r,s))dv) = -((ki^2)/(Pi^2))(sum(Sigma(r,s,lambda,mu)Sigma(r',s',lambda',mu')(beta(j,k)(r,lambda,s,mu)*beta(j,k)(r',lambda',s',mu')*b(lambda,r)*b(mu+,s)*b(lambda',r')*b+(mu',s')*w(r)*w(s)(étoile)*w(r')*w(s')(étoile)/[|k(r)|*|k(s)|*(cos(theta(r,s)) - 1)]

et en prenant de même les termes diagonaux r = s', s = r' , et en utilisant (21),

H(I)(barre) = ((ki^2)*(c^2)*(h^2)/16*(Pi^2)*(L^3))*Sigma(r,s,lambda,mu)(M(r,lambda))(M(s,mu) + 1)(1 - cos(theta(r,s)))

(23)

d’où pour la perturbation gravitationnelle de l'énergie électromagnétique pure Sigma(r,lambda)(M(r,lambda)*h*nu(r))

H(G)(barre) + H(I)(barre) = ((ki^2)*(c^2)*(h^2)/16*(Pi^2)*(L^3))*Sigma(r,s,lambda,mu)(M(r,lambda))(M(s,mu) + 1)(|k(r)|^2 + |k(s)|^2)/(|k(r)|*|k(s)|)

(24)

Au moyen de la théorie de Heisenberg et Pauli, Rosenfeld trouvait :

H(G)(barre) + H(I)(barre) = ((ki^2)*(c^2)*(h^2)/64*(Pi^2)*(L^3))*Sigma(r,s)(cos(theta(r,s)) + 1) + ((ki^2)*(c^2)*(h^2)/16*(Pi^2))*Sigma(r)(1/(L^3)) + ((ki^2)*(c^2)*(h^2)/64*(Pi^2))*(1/(L^3))*Sigma(r,s,lambda,mu)(|k(r)|^2 + |k(s)|^2)/(|k(r)|*|k(s)|)[(2*M(r,lambda) + 1)(2*M(s,mu) + 1)]

Nous voyons tout d’abord que les termes de la première ligne de (25) sont supprimés : ils correspondaient donc bien à l’énergie infinie du rayonnement au zéro absolu. Quant à la seconde ligne, on peut décomposer le produit (2*M(r,lambda)+1)*(2*M(s,lambda)+1) en :

4*M(r,lambda)*M(s,mu) + 2*M(r,lambda) + 2*M(s,mu) + 1

tandis que d’après (24) on a :

4*M(r,lambda)*M(s,mu) + 4*(M(r,lambda))

ici encore le terme indépendant du nombre de photons a disparu. Mais avec (24) subsiste encore la difficulté signalée par Rosenfeld : l’énergie gravitationnelle relative à un photon (r,lambda) est donnée par :

(ki^2)*(c^2)*(h^2)/16*(Pi^2)*(L^3)*Sigma(s,mu)(|k(r)|^2 + |k(s)|^2)/(|k(r)|*|k(s)|)

et est évidemment infinie.

Ainsi notre théorie du rayonnement n’est pas capable de nous fournir une théorie complète de l’interaction entre rayonnement et gravitation. Mais il nous semble probable qu’il s’agit plutôt d’une imperfection de la théorie quantique de la gravitation : c’est ainsi que la quantification des ondes planes gravitationnelles amène comme pour le rayonnement, à une énergie infinie en l’absence de toute gravitation. Ceci fait penser que la forme (18) du hamiltonien de la gravitation n’est pas la forme correcte, mais la modification que l’analogie avec l’électromagnétisme engage à rechercher est bien moins évidente et la question reste encore ouverte.


CHAPITRE IV

L’interaction entre électrons et rayonnement.


  • 1. Généralités.

— Sans chercher à résoudre les difficultés qui se présentent actuellement lors de l’étude approfondie de l’interaction entre électrons et rayonnement, nous nous proposons simplement dans ce chapitre d'indiquer comment il est possible d’introduire dans la théorie précédente la notion de courant de convection et de préciser ainsi les échanges d’énergie entre le rayonnement et les électrons.


  • 2. Equations de Dirac. Quantification des ondes matérielles.

— Pour définir la matière, nous partirons des équations de Dirac. Soient gamma^mu (mu= i, 2, 3, 4) quatre matrices de rang quatre définies par :

(gamma^mu)*(gamma^nu) + (gamma^nu)*(gamma^mu) = 2*delta(nu,mu)

Les quatre fonctions d’onde psi, de Dirac satisfont aux équations :

Sigma(mu)Sigma(sigma)(gamma(rho,sigma,mu)((h/2*Pi*i)*(d/dx(mu)) + (e/c)*Phi(mu))psi(sigma) - i*m*c*(psi(rho)) = 0 (1)

où Phi(mu) est le quadrivecteur potentiel,

Phi(i) = A(i)(i = 1,2,3,...), Phi(4) = i*V,

où V est le potentiel scalaire. La charge électronique est supposée être — e(e > o). On est naturellement conduit à considérer en même temps l’équation adjointe :

Sigma(mu)Sigma(sigma)(gamma(rho,sigma,mu)((h/2*Pi*i)*(d/dx(mu)) - (e/c)*Phi(mu))psi(sigma)+ + i*m*c*(psi(rho))+ = 0

et l’on peut déduire ces deux groupes d’équations par variation des psi^rho et psi^rho+ (considérés comme indépendants) à partir de la fonction de Lagrange (non symétrique).

L(M) = -Sigma(mu,sigma,rho)(gamma(rho,sigma,mu)Psi(rho)+*(((h*c)/(2*Pi*i))*(d/dx(mu)) + e*Phi(mu))psi(rho) - i*m*(c^2)*(psi(rho+)*(psi(rho)))

On tire de là l’expression du moment conjugué de psi:

d(L(M))/d(d(Psi(rho)/dx4)) = -((h*c)/(2*Pi*i))Sigma(sigma)(gamma(sigma,rho,4)*Psi(sigma)+ = -((h*c)/(2*Pi))*Psi(rho)(étoile)

moyennant un choix convenable des matrices gamma^mu. La fonction de Hamilton de la matière s’écrit dans ces conditions :

H(M) = -((h*c)/(2*Pi*i))(gamma(rho,sigma,4)*Psi(rho)+*d(Psi(rho)/dx4) - L(M) = ((h*c)/(2*Pi*i))*alpha(rho,sigma,k)*Psi(sigma)(étoile)*d(Psi(sigma)/d(x^k)) + m*(c^2)*alpha(rho,sigma,4)*Psi(rho)(étoile)*Psi(sigma) + e*alpha(rho,sigma,mu)Psi(rho)(étoile)*Psi(sigma)*Phi(mu) + e*i*Psi(rho)(étoile)*Psi(rho)*Phi(4)

où l’on est revenu aux matrices habituelles de Dirac :

alpha(k) = i*gamma(4)*gamma(k) ,

alpha(4) = gamma(4) ,

alpha(mu)*alpha(nu) + alpha(nu)*alpha(mu) = 2*delta(nu,mu) ;

(3)

Quand aux conditions de permutation, on sait qu’elles s’expriment différemment suivant la statistique utilisée. Pour cela, à côté du symbole :

{A,B} = AB — BA,

nous introduirons le symbole :

<A,B> = AB + BA.

Le premier se rapportera à la statistique de Bose-Einstein, le second à la statistique de Fermi-Pauli-Dirac. Ces relations de permutation s’écrivent alors :

Statistique de Bose-Einstein :

{Psi(sigma,P),Psi(sigma,P')} = 0 ;

{Psi'(rho,P),Psi'(rho,P')} = {Psi+(rho,P),Psi+(sigma,P')} = 0 ;

{Psi(rho,P),Psi'(sigma'(P'))} = delta(rho,sigma)*delta(P - P') ;

Statistique de Fermi :

<Psi(sigma,P),Psi(sigma,P')> = 0 ;

<Psi'(rho,P),Psi'(sigma,P')> = <Psi+(rho,P),Psi+(sigma,P')> = 0 ;

<Psi(rho,P),Psi'(sigma(P'))> = delta(rho,sigma)*delta(P - P') ;

(5)

Développons les fonctions psi^rho en séries de fonctions fondamentales, par exemple correspondant aux équations de Dirac où l’on suppose les potentiels constants. A chaque valeur E de l’énergie correspondent des fonctions propres qui seront normalisées d’après :

Sigma(rho)(sum(u'(rho,r)*u(rho,s)*dv = delta(r,s)

(6)

On aura également :

Sigma(s)u'(rho,s)(P)*u(sigma,s)(P') = delta(rho,sigma)*delta(P - P')

(7)

Posons alors :

Psi(rho) = Sigma(s)(a(s)*u(rho,s))

Psi'(rho) = Sigma(S)(a'(S)*u'(rho,S))

(8)

(4) et (5) s’écrivent alors, en tenant compte de (6) :

[a(s),a'(t)] = delta(s,t)*(2*Pi*i/h) (9) <a(s),a'(t)> = delta(s,t)*(2*Pi*i/h) (10)

Les relations (9) et (10) permettent d’écrire les a(s) et a(s)(étoile) sous la forme :

Statistique de Bose-Einstein :

a(s) = [exp[(-2*Pi*i/h)*(theta(s))]]*[N(s)^(1/2)] , a'(s) = [N(s)^(1/2)]*[exp[(2*Pi*i/h)*(theta(s))]] (11)

où N(s) a pour valeur caractéristique 0, 1, 2,... et où exp[(2*Pi*i/h)*theta(s)] est un opérateur qui transforme N(s) en N(s)-1.

Statistique de Pauli :

a(s) = V(s)*[exp[(-2*Pi*i/h)*(theta(s))]]*[N(s)^(1/2)] , a'(s) = [N(s)^(1/2)]*[exp[(2*Pi*i/h)*(theta(s))]]*V(s)

(12)

où N(s) a pour valeurs caractéristiques 0 et 1 ;

exp[(2*Pi*i/h)*(theta(s))] est un opérateur transformant N(s) en 1 — N(s) .

Enfin V(s) est une fonction introduite par Jordan et Wigner (1) :

V(s) = Pi(t <= s)(1 - 2*N(t)) ,

fonction qui a évidemment pour valeurs caractéristiques 1 et — 1. Les relations (11) et (12) indiquent les relations entre les a(s) , a(s)(étoile) et le nombre d’électrons se rapportant à l’énergie E(s).

Ecrivons maintenant l’expression du flux. On sait qu’on obtient à partir des équations de Dirac le quadrivecteur

S(mu) = -exp[(Sigma(rho,sigma)(gamma(rho,mu)*psi(rho,sigma)+*psi(sigma))]

(13)

dont les trois premières composantes correspondent au vecteur courant (divisé par c) et la quatrième à la charge (multipliée par i). Pour cette dernière en particulier, on a :

rho = -exp[(Sigma(sigma)(Psi(sigma)'*Psi(sigma)))]

(14)

Le quadrivecteur précédent satisfait d’ailleurs au principe de conservation :

Sigma(mu)(dS(mu)/dx(mu)) = 0

(15)

Enfin, nous rappellerons que d’après la théorie générale des systèmes continus, les deux séries de variables (psi^rho, psi^rho+) et (F(alpha),F(alpha)+) permutent d’une série à l’autre, ce n’est qu’à l’intérieur d’une même série qu’existent les relations de permutation donnant un résultat non nul.


  • 3. Equations de Hamilton avec courant de convection.

Comment allons-nous maintenant raccorder nos équations de l'électromagnétisme pur, et nos équations de la matière? L’hypothèse la plus simple, et la seule qu’on soit en mesure de faire actuellement, consiste à ajouter purement et simple ment les deux hamiltoniens correspondants. On suppose ainsi que les termes d’interaction entre matière et rayonnement sont suffisamment représentés par les termes d’interaction de l’équation de Dirac. Nos équations du champ seront donc déduites de la fonction de Hamilton totale.

H(ronde) = H(M) + H(R)

(16)

Ecrivons tout de suite les équations de Maxwell avec courant de convection. L’hamiltonien correspondant s’écrit évidemment en prenant pour H(M) l’hamiltonien linéaire de Dirac :

H(ronde)(barre) = (1/2)*sum(F(k,P)*F+(k,P)*dv(P) + e*c*alpha(k)*A(k,Q) = sum([(1/2)*F(k,P)*F+(k,P) + e*c*alpha(k)*A(k,P)*delta(P-Q)])*dv(P)

Donc :

H(ronde) = (1/2)*F(k)*F+(k) + e*c*alpha(k)*A(k)*delta(P-Q)

(17)

où P est le point courant, Q le point où se trouve l’électron considéré. Les équations de Hamilton qu’on en tire s’écrivent (1):

F'(k) = sqrt(delta)*F(k) + e*c*alpha(k)*delta(P-Q) F'(k)+ = -sqrt(delta)*F+(k) + e*c*alpha(k)*delta(P-Q)

(18)

(1) En réalité, il faudrait ajouter aux seconds membres un terme (grad(rho))/(sqrt(delta)) d’origine électrostatique. Comme il ne joue aucun rôle dans ce qui suivra nous l’avons omis. On complétera par exemple facilement les formules de la page 498 pour en tenir compte. Ce terme joue un grand rôle dans la question de l'énergie électrostatique propre de l’électron.

  • (1) P. Jordan et E. Wigner. Z. Physik, 47 (1928), p. 631.

Le rôle du courant de convection est donc joué par :

s(k) = -e*c*alpha(k)*delta(P-Q)

(19)

dont la signification dans la théorie classique est évidente : passage d’une charge — e avec la vitesse c.

A ces équations nous adjoindrons la condition accessoire :

div(F) = div(F+) = rho = -e*Sigma(Sigma(Psi(sigma)(étoile)*Psi(sigma))

(20)

Il nous faut montrer que cette condition, supposée satis faite à l’instant t = o, se propage avec le temps en vertu des équations de Hamilton. On peut pour cela utiliser une méthode (1) qui a déjà été employée au chapitre II : utilisation de l’invariance de la fonction d’Hamilton vis-à-vis d’un groupe de transformations : le groupe de 1’ « Eichinvarianz », défini comme nous l’avons vu par :

Phi(nu) -> Phi(nu) + d(ki)/d(x(nu))

Psi(rho) -> [exp((-2*Pi*i/h)*(e/c)*ki)]*Psi(rho)

Psi(rho)(étoile) -> Psi(rho)(étoile)*[exp((2*Pi*i/h)*(e/c)*ki)]

de transformation infinitésimale :

phi(nu) -> phi(nu) + delta(d(ki)/d(x(nu)))

psi(rho) -> psi(rho) - 2*Pi*i/h)*(e/c)*delta(ki)*psi(rho)

psi(rho)(étoile) -> psi(rho)(étoile) + (2*Pi*i/h)*(e/c)*delta(ki)*psi(rho)

Comme nous l'avons vu, on peut arbitrairement poser :

Phi(4) = 0.

il s’ensuit alors que ki est une fonction des trois variables d’espaces (x1, x2, x3) seulement. Exprimée au moyen des F et F+ la transformation précédente s’écrit :

F(nu) - F(nu)+ - F(nu) - F(nu)+ - 2*delta(d(sqrt(delta*ki))/d(x(nu)))*psi(rho) -> psi(rho) - (2*Pi*i/h)*(e/c)*delta(ki)*psi(rho)

psi(rho)(étoile) -> psi(rho)(étoile) + (2*Pi*i/h)*(e/c)*delta(ki)*psi(rho)

(21)

  • (W. Heisenberg et W. Pauli, Z. Physik, 59 ( 1930), p. 172)

Considérons alors une fonctionnelle G(F(alpha)-F+(alpha)),psi(rho)), elle se transforme en :

G - delta(sum(dv[(delta(G))/(delta(F(nu)-F(nu)+))*(2d(sqrt(delta*ki))/d(x(nu)) + (2*Pi*i/h)*(e/c)*(delta(G)/delta(psi(rho)))*psi(rho)*ki)] = G - delta(sum(dv[2*sqrt(delta)*d/d(x(nu))(delta(G)/delta(F(nu)) - delta(G)/delta(F(nu)+) + (2*Pi*i/h)*(e/c)(delta(G)/delta(psi(rho))*psi(rho)]*ki.

Par suite, à la transformation (18) correspond l’opérateur :

sum(dv*ki*[2*sqrt(delta)*d/delta(x(nu))(delta/delta(F(nu)) - delta/delta(F(nu)+) + (2*Pi*i/h)*(e/c)*psi(rho)*delta/delta(psi(rho))]

(22)

D’après les conditions de permutation, delta/delta(F^nu) correspond à (F(nu)+)/(sqrt(delta)) tandis que delta/delta((F^nu)+) correspond à -F(nu)/(sqrt(delta)), enfin delta/delta(Psi(rho)) correspond à Psi(rho)(étoile).

Par suite :

sum(dv*ki[d/d(x(nu))(F(nu) + F(nu)+) + 2*e*psi(rho)(étoile)*psi(rho)])

est une constante. Or ki est une fonction arbitraire ; donc :

div(F + F+) + 2*e*Sigma(rho)(psi(rho)(étoile)*psi(rho)) = C ;

(23)

et si, à l'instant t = o, on a choisi pour C la valeur C = o, on est certain qu’il en sera ainsi pour tout instant t > 0. Montrons maintenant que, en vertu des équations de Hamilton :

div F = div F+ (24)

De (18) on tire, en ajoutant et prenant la divergence :

div(F' + F'+) = -2*e*(d/dt(Sigma(rho)(psi(rho)(étoile)*psi(rho)) = sqrt(delta)*(div(F - F+) + 2*e*c*div[(alpha(k)*delta(P-Q)]

c’est-à-dire, en utilisant le théorème de conservation (15) :

div(F — F+) = o.

La relation (13) prend alors sa forme définitive (1) :

div(F) = div(F+) = -e*Sigma(rho)(psi(rho)(étoile)*psi(rho)) (25)

Remarquons que grâce à (24), la décomposition que nous avons faite au chapitre II en champ électrique et champ magnétique est encore possible dans le cas où il y a présence de charges électriques libres. Car, la divergence de F — F+ étant nulle, il est possible d’égaler F — F+ à un rotationnel, ce qui nous donne immédiatement la décomposition en question.

En introduisant alors ces expressions dans les équations de Hamilton, on vérifie immédiatement que l’on retrouve exactement les équations de Maxwell avec courant de convection.

Quelle est maintenant l’expression du vecteur impulsion?

Si l’on se reporte au calcul qui a été fait p. 38 et p. 52, on voit, en tenant compte de ce que, dans le cas présent, la divergence de F (ou de F+) n’est pas nulle, que l’on a :

c*S'(k) = P'(k) - e*A(k)*delta(P - Q)

(26)

où P'(k) est une expression qui est identique au vecteur de Poynting classique lorsqu’on suppose les grandeurs de champ commutables.

(1) Il va sans dire que (25) signifie simplement que l’opérateur :

div(F) + e*Sigma(rho)(psi(rho)(étoile)*psi(rho))

appliqué à la fonctionnel le cherchée doit donner zéro. Toutes les relations entre les champs doivent être interprétées de la même façon.

Par conséquent, dans notre théorie comme dans la théorie classique, l'impulsion électromagnétique du champ total (champ électromagnétique et champ matériel) se compose additivement de l’impulsion du champ électromagnétique et de l’impulsion électromagnétique de l’électron. Ceci était d’ailleurs à prévoir : en effet (26) est une intégrale du mouvement et, si nous considérons les grandeurs de champ comme commutables, notre nouvelle théorie revient simplement à une transformation canonique, qui conserve l’intégrale (26). Montrons encore que l’on retrouve les formules classiques des potentiels retardés. De (18) on tire (1) :

F"(k) = delta(F(k)) - sqrt(delta)(s(k)) - s'(k) ,

F"(k)+ = delta(F+(k)) + sqrt(delta)(s(k)) - s'(k) .

ou encore, (d'alembertien) représentant le d'alembertien:

(d'alembertien)(F(k)) = sqrt(delta)(s(k)) + s'(k)

(d'alembertien)(F(k)+) = sqrt(delta)(s(k)) + s'(k)

Ces relations s’intègrent par la méthode de Kirchhoff :

F(k) = sum((([sqrt(delta)(s(k)) + s'(k)](t) - (r/c))/r)*dv

F(k)+ = sum((([s'(k) - sqrt(delta)(s(k))](t) - (r/c))/r)*dv

Quant au potentiel vecteur, le plus commode est de former son d'alembertien :

(d'alembertien)(A(k)) = - [(d'alembertien)(F(k)) - (d'alembertien)(F(k)+)]/(2*sqrt(delta)) = -s(k)

et l’on retrouve la formule classique :

A(k) = sum((([s(k)]*t - r/c)/r)*dv

  • (1) Voir page 494, note 1.


  • 4. Equations générales d’interaction entre champ électromagnétique et électrons.

— On peut mettre les équations précédentes sous une forme où apparaissent plus explicitement les échanges de probabilité. L’équation générale de de Broglie-Schrödinger relative au champ considéré s’écrit :

((1/2)*(F(alpha)*F+(alpha))(barre)+H(M)(barre)-E)*Psi(N1,N2,...,N,...;M(1,1),M(1,2),...,M(r,lambda),...) = 0,

(27)

où les N(s) sont les nombres d’électrons appartenant à la case s, le nombre de photons appartenant à la case r,lambda. H(M) est l’hamiltonien de Dirac défini par (2). Nous y poserons Phi(4) = o. On a alors :

A(k) = c*(Sigma(r)((f(k,r)*w(r) + f+(k,r)*w(r)(étoile))/(2*Pi*i*nu(r)))

Posons :

a(s,t,r,k) = sum([(c*u'(rho,s)*alpha(rho,sigma,k)*u'(sigma,t)*w(r))/(2*Pi*i*nu(r))*dv])

(28)

a(s,t,r,k,1) = sum([(c*u'(rho,s)*alpha(rho,sigma,k)*u(sigma,t)*w(r))/(2*Pi*i*nu(r))*dv])

(29)

où les sont les fonctions propres des équations de Dirac non perturbées par le rayonnement. On a évidemment :

a(s,t,r,k,1)(étoile) = a(t,s,r,k)

Le terme d’interaction se met alors sous la forme :

(-e/2)*Sigma(k,s,r,t)(f(k,r)*a(s)(étoile)*a(t)*a(s,t,r,k) + f+(k,r)*a(s)(étoile)*a(1)*a(s,t,r,k))

Afin de faire apparaître les M(r,lambda), introduisons les rotations D(k,lambda,s) par:

Sigma(k)(D(k,lambda,r)*a(s,t,r,k) = g(s,t,r,lambda)

Sigma(k)(D(k,lambda,r)*a(s,t,r,k,1) = g(s,t,r,lambda,1)

et, en tenant compte de (11) et (31, chapitre II), on a pour la statistique de Bose-Einstein par exemple :

- (e/2)(Sigma(k,r,s,t)(sqrt(2*h*nu(r))*[(M(r,lambda))^(1/2)]*[exp(2*Pi*i/h)*(theta(lambda,r))]*[(N(s))^(1/2)]*[exp(2*Pi*i/h)*(theta(s))]*[exp(-2*Pi*i/h)*(theta(t))]*[(N(t))^(1/2)]*(g(s,t,r,lambda)) + sqrt(2*h*nu(r))*[exp(2*Pi*i/h)*(theta(lambda,r))]*[(M(r,lambda))^(1/2)]*[(N(s))^(1/2)]*[exp(2*Pi*i/h)*(theta(s))]*[exp(-2*Pi*i/h)*(theta(t))]*[(N(t))^(1/2)]*(g(s,t,r,lambda,1))

Finalement l’équation (27) s’écrit sous forme d'équation aux différences :

(-E+Sigma(s)(N(s)*E(s) + Sigma(r,lambda)(M(r,lambda)*(h*nu(r)))*Psi(N1,N2,...;M(1,1),M(1,2),...) = (e/2)*Sigma(r,s,t)(sqrt(2*h*nu(r))*[(N(s))^(1/2)]*[(N(t)+1)^(1/2)]*[[(M(r,lambda))^(1/2)]*(g(s,t,r,lambda)*Psi(N1,...,N(s)-1,...,N(t)+1,...;M(1,1),...,M(r,lambda)-1,...)+[(M(r,lambda)+1)^(1/2)]*(g(s,t,r,lambda,1))*Psi(N1,...,N(s)-1,...,N(t)+1,...; M(1,1),...,M(r,lambda)+1,...)] + (e/2)*Sigma(r,s)(sqrt(2*h*nu(r))*N(s)*[[(M(r,lambda))^(1/2)]*(g(s,s,r,lambda))*Psi(N1,...,N(s),...;M(1,1),...,M(r,lambda)-1,...)+([(M(r,lambda)+1)^(1/2)]*(g(s,s,r,lambda,1))*Psi(N1,...,N(s),...;M(1,1),...,M(r,lambda)+1,...)]

où les Sigma' indiquent que le terme s=r est exclu de la sommation. À cette équation, il faut naturellement adjoindre la condition accessoire. En posant:

k(s,t,r,1) = sum(u'(rho,s)*w'(r)*u(rho,t)*dv ,

k(s,t,r) = sum(u'(rho,s)*w(r)*u(rho,t)*dv ,

celle-ci s’écrit :

(b(3,r) + e*Sigma(s,t)(a'(s)*a(t)*k(s,t,r))Psi = 0 ,

(b+(3,r) - e*Sigma(s,t)(a'(s)*a(t)*k(s,t,r)) = 0.

La première de ces relations par exemple se met sous la forme :

[(M(r,s))^(1/2)]*Psi(N1,...,N(s),...,N(t),...;M(1,1),...,M(r,3)+1,...) + [exp(Sigma(S,t)[N(S)^(1/2)][(N(t)+1)^(1/2)]*k(s,t,r,1)]* Psi(N1,...,N(s)-1,...,N(t)+1,...;M(1,1),...,M(r,3),...) = 0 ,

sur laquelle on voit que la condition accessoire règle exclusivement les échanges de photons longitudinaux entre électrons. Nous n’insisterons pas davantage sur les conséquences que l'on peut tirer de ces relations : étude de l’effet Compton par exemple; elles sont les mêmes que celles que l’on peut tirer des équations de Heisenberg et Pauli.


CONCLUSION

En résumé, l'étude précédente a montré que c’est par une transposition hâtive des données de l’électromagnétisme classique à la théorie des quanta qu’est survenue la difficulté de l’énergie infinie du rayonnement au zéro absolu. La forme que la théorie classique donne à l’énergie du champ électromagnétique, si elle est la plus simple, n’est pas la seule possible en mécanique quantique du fait que les diverses grandeurs qui y entrent ne sont plus permutables entre elles.

Si l’on s’attache alors à poursuivre le parallélisme entre matière et lumière, on est conduit à introduire pour définir le champ électromagnétique des grandeurs inobservables, de même que les fonctions d’onde psi qui définissent le champ matériel. Au moyen de ces nouvelles grandeurs est définie une nouvelle expression, très simple, de l’énergie électromagnétique. Et cette expression permet d'échapper à la difficulté dont nous venons de parler.

  • Thèse de doctorat de sciences physiques.
  • Annales de Physique
  • Publiées par MM. Marcel Brillouin, Jean Perrin, Aimé Cotton
  • Source: PANDOR, Portail des Archives Numériques, Université de Bourgogne