1 INTRODUCTION
Ce chapitre concerne la représentation du temps et du changement dans les théories physiques classiques (c’est-à-dire non quantiques). L’un des principaux objectifs du chapitre est de tenter de clarifier la nature et la portée de ce que l’on appelle le problème du temps : un nœud de problèmes techniques et interprétatifs qui semblent faire obstacle aux tentatives de quantification de la relativité générale, et qui ont leurs racines dans la covariance générale de cette théorie.
L’approche la plus naturelle de ces questions passe par la considération de cas plus clairs. Une grande partie du chapitre est donc consacrée à une discussion de la représentation du temps et du changement dans d’autres théories mieux comprises, en commençant par les cas les plus simples et en procédant à une considération des cas qui préparent, dans un sens ou dans un autre, aux caractéristiques de la relativité générale qui sont responsables du problème du temps.
Permettez-moi de commencer par dire un peu quel genre de chose j’ai à l’esprit en parlant de la représentation du temps et du changement dans les théories physiques, en fondant la discussion sur le cas le plus traitable de tous, la physique newtonienne.
En règle générale, de nombreuses questions et affirmations sur le contenu d’une théorie physique admettent deux interprétations – comme des questions sur les caractéristiques structurelles des solutions aux équations du mouvement de la théorie, ou comme des questions sur les caractéristiques structurelles de ces équations. Par exemple, d’une part, le temps apparaît comme un aspect des espaces-temps dans lesquels la physique se déroule – c’est-à-dire comme un aspect de l’arrière-plan dans lequel les solutions aux équations de la théorie sont établies. D’autre part, le temps est représenté via son rôle dans les lois de la physique – en particulier, dans son rôle dans les équations différentielles codant ces lois. Ainsi, les questions et les affirmations sur la nature du temps dans les théories physiques admettront deux sortes de lecture.
Considérez, par exemple, l’affirmation que le temps est homogène dans la physique newtonienne (ou, comme le dirait Newton, que le temps s’écoule de manière équitable). Il y a deux sortes de faits que nous pourrions considérer comme fondant cette affirmation.
Il y a un sens dans lequel le temps est un aspect séparable de l’espace-temps de la physique newtonienne et il y a un sens dans lequel le temps, ainsi considéré, est homogène.3.
Les lois des théories d’apparence fondamentale de la mécanique classique (par exemple, La théorie de la gravité de Newton) sont invariantes par translation temporelle – les équations différentielles de ces théories ne changent pas de forme quand l’origine de la coordonnée temporelle est modifiée – donc les lois de ces théories sont indifférentes à l’identité des instants du temps.
Dans le cadre newtonien, ces deux sortes de considérations s’emboîtent bien et se soutiennent mutuellement : il y a une consilience entre les symétries des lois et les symétries de l’espace-temps. Mais en principe, les deux types de considérations ne conduisent pas nécessairement au même type de réponse : on peut considérer un système dans l’espace-temps newtonien qui est soumis à des forces dépendant du temps ; ou bien on peut placer le problème newtonien à n corps dans un espace-temps qui présente un instant privilégié, mais qui a autrement la structure de l’espace-temps newtonien. Et au fur et à mesure que l’on s’éloigne du cadre familier de la physique newtonienne, il devient encore plus important de distinguer les deux approches : dans la relativité générale, les lois ont un énorme groupe (en fait, de dimension infinie) de symétries alors que les solutions génériques n’ont aucune symétrie.
En discutant de la représentation du temps et du changement, ce chapitre se concentrera sur les caractéristiques structurelles des lois des théories physiques plutôt que sur les caractéristiques des solutions particulières. Pour insister sur ce point, je dirai que je m’intéresse à la structure de telle ou telle théorie en tant que théorie dynamique.
J’aborderai mes sujets via les approches lagrangienne et hamiltonienne des théories classiques, deux grands cadres primordiaux – et intimement liés – dans lesquels de tels sujets sont naturellement abordés4. En gros, dans chacune de ces approches, le contenu des équations d’une théorie est encodé dans certaines structures sur un espace de possibilités associé à la théorie.5 Dans l’approche lagrangienne, l’espace en question est l’espace des solutions aux équations de la théorie, que nous pouvons identifier, à des fins heuristiques, avec l’espace des mondes possibles permis par la théorie.6 Du côté hamiltonien, l’espace vedette est l’espace des données initiales pour les équations de la théorie, que nous pouvons dans le même esprit identifier à l’espace des états instantanés possibles permis par la théorie.
En mécanique newtonienne, la réflexion dans le cadre lagrangien de l’invariance des lois par translation temporelle est que l’espace des solutions est lui-même invariant sous les translations temporelles : étant donné un ensemble de trajectoires de particules dans l’espace-temps obéissant aux lois du mouvement de Newton, on peut construire l’ensemble des trajectoires de particules qui résultent si tous les événements sont translatés dans le temps d’une quantité t ; ce dernier ensemble est une solution (i.e., est autorisé par les lois du mouvement) si et seulement si le premier ensemble l’est ; en outre, la carte qui nous amène d’une solution à sa translation temporelle préserve la structure de l’espace des solutions qui code la dynamique de la théorie. Dans le cadre hamiltonien, en revanche, l’invariance des lois par translation temporelle se traduit par l’existence d’une carte qui envoie un ensemble de données initiales vers l’état dans lequel il évoluera dans t unités de temps ; là encore, cette carte laisse invariante la structure sur l’espace qui code la dynamique de la théorie. Ainsi, la symétrie temporelle de la dynamique de la théorie se traduit du côté lagrangien par une notion de translation temporelle et du côté hamiltonien par une notion d’évolution temporelle.
La représentation du changement dans la physique newtonienne prend également des formes différentes (mais étroitement liées) dans les cadres lagrangien et hamiltonien. Le changement consiste pour un système à avoir des propriétés différentes et incompatibles à des moments différents. On veut dire, par exemple, qu’il y a un changement dans les propriétés observables d’un système à deux corps si et seulement si la distance relative entre les particules est différente à différents moments.
Approche hamiltonienne. Il suffit de spécifier l’état dynamique instantané d’un tel système pour spécifier la distance relative instantanée entre les particules. Il existe donc une fonction sur l’espace des données initiales correspondant à cette quantité. Une histoire du système est une trajectoire à travers l’espace des données initiales. Dans notre exemple simple, un changement observable se produit au cours d’une histoire donnée si et seulement si la fonction correspondant à la distance relative entre les particules prend des valeurs différentes en différents points de la trajectoire en question. Plus généralement, dans tout système newtonien, toute quantité d’intérêt physique (observable ou non) est représentée par une fonction sur l’espace des données initiales, et une trajectoire dans cet espace représente ces quantités comme changeant si les fonctions correspondantes prennent des valeurs différentes en différents points de la trajectoire.
Approche lagrangienne. Il est clair qu’aucune fonction sur l’espace des solutions ne peut représenter une quantité changeante de la même manière directe que les fonctions sur l’espace des données initiales. Mais pour chaque t, il existe une fonction sur l’espace des solutions de notre problème à deux corps qui attribue à chaque solution la distance relative entre les particules au temps t selon cette solution. En laissant t varier, nous construisons une famille de fonctions à un paramètre sur l’espace des solutions. Une solution aux équations du mouvement représente la distance relative entre les particules comme changeant si et seulement si différents membres de cette famille de fonctions à un paramètre prennent des valeurs différentes lorsqu’ils sont évalués sur la solution donnée. Et ainsi de suite de façon plus générale : toute quantité physique modifiable correspond à une telle famille de fonctions à un paramètre sur l’espace des solutions, et le changement est compris comme dans l’exemple simple à deux corps.
Voilà le genre de chose que j’ai en tête en parlant de la représentation du temps et du changement dans une théorie physique. Avant d’esquisser le chemin que prend ce chapitre dans la discussion de ces sujets, il sera peut-être utile de dire un peu sur son objectif ultime – la clarification de la nature du soi-disant problème du temps. Les discussions sur le problème du temps se concentrent généralement sur les versions hamiltoniennes de la relativité générale, dans lesquelles l’accent est mis sur l’espace des géométries instantanées possibles (métriques et formes fondamentales secondes sur les surfaces de Cauchy). Ceci est quelque peu regrettable, car de telles approches nécessitent dès le départ une division de l’espace-temps en une famille d’hypersurfaces spatiales – ce qui semble aller à l’encontre de l’esprit de la compréhension habituelle de la covariance générale de la théorie. À la lumière de ce fait, on peut s’inquiéter que certains aspects du problème du temps tel qu’il est habituellement présenté soient des conséquences de cette façon plutôt maladroite de procéder. J’emprunte une voie quelque peu différente, en ancrant toujours ma discussion dans l’approche lagrangienne, qui prend comme fondamentale l’histoire complète des systèmes plutôt que les états instantanés.
Le point de vue développé ci-dessous est que, grosso modo, le cœur du problème du temps est que dans la relativité générale, lorsqu’elle est comprise dynamiquement, il n’y a pas moyen de considérer l’évolution ou la translation du temps comme des symétries de la théorie et, par conséquent, il n’y a pas de moyen naturel de modéliser le changement par des fonctions sur les espaces apparaissant dans les approches lagrangienne et hamiltonienne.7 Cela marque un aspect dans lequel la relativité générale, ainsi conçue, est très différente des théories précédentes d’apparence fondamentale.
Le problème du temps peut sembler – pas très pressant. Certes, il y a là des énigmes. Pourquoi la relativité générale devrait-elle différer de cette manière de ses prédécesseurs ? Dans les prédécesseurs de la relativité générale, la représentation du temps et la représentation du changement sont liées dans un ensemble très soigné – à quoi ressemble le remplacement relativiste général de cet ensemble ? Ce sont des questions intéressantes. Mais bien sûr, personne ne devrait s’attendre à ce que le temps soit représenté dans la relativité générale comme dans ses prédécesseurs – le fait qu’elle présente une image totalement nouvelle du temps et de l’espace est l’une des gloires de la théorie. Et l’on pourrait aussi penser : puisque la structure de l’espace-temps varie d’une solution à l’autre de la relativité générale, il est sûrement plus approprié d’examiner la représentation du temps dans telle ou telle solution physiquement réaliste, plutôt que dans les équations de la théorie, si l’on veut comprendre ce que la théorie nous dit de la nature du temps dans notre monde.
Le problème du temps prend cependant un aspect plus pressant lorsqu’on envisage la quantification de la relativité générale (ou de toute autre théorie qui est généralement covariante au sens pertinent). Le projet de construire des théories successeurs concentre naturellement notre attention sur les caractéristiques structurelles des théories en question – en construisant des successeurs, on fait des paris sur les caractéristiques des théories actuelles qui survivront (peut-être sous une nouvelle forme), et celles qui seront abandonnées. Les techniques de quantification connues nécessitent non seulement des équations différentielles, mais aussi des théories sous forme hamiltonienne ou lagrangienne. Ainsi, pour ceux qui s’intéressent à la quantification de la relativité générale, les questions relatives à la structure de la théorie en tant que théorie dynamique sont naturellement importantes. Et en l’absence de solutions aux énigmes mentionnées ci-dessus, on s’attend à des difficultés conceptuelles pour formuler (ou extraire des prédictions de) toute quantification de la relativité générale. Donc, de ce point de vue, le problème du temps est en fait assez pressant.
Ce chapitre prend une longue route vers le problème du temps. Je commence dans la section 2 avec la plus brève des introductions à la mécanique hamiltonienne et lagrangienne, en guise de motivation pour une partie de ce qui suit. Dans la section 3, j’esquisse quelques concepts et résultats importants de la géométrie symplectique, le domaine des mathématiques qui sous-tend la mécanique classique. Les concepts introduits ici sont cruciaux pour ce qui suit : pour les théories qui se comportent bien, l’espace des solutions (du côté lagrangien) et l’espace des données initiales (du côté hamiltonien) ont tous deux des structures symplectiques. Et nous verrons que divers espaces symplectiques (ou presque symplectiques) apparaissent même lorsqu’on s’éloigne du cas idéal. Dans la section 4, j’esquisse le cadre très puissant de la mécanique lagrangienne moderne, avec son appareil de lois de conservation locales.
Dans la section 5, j’esquisse les images lagrangienne et hamiltonienne pour des théories idéalement bien conduites satisfaisant les conditions suivantes : (i) la géométrie de l’espace-temps d’arrière-plan admet un groupe de translations temporelles et le Lagrangien de la théorie est invariant (dans un sens approprié) sous l’action de ce groupe ; (ii) la spécification de données initiales pour les équations de la théorie suffit à déterminer une seule solution maximale ; (iii) cette solution maximale est définie pour toutes les valeurs du paramètre temporel. Lorsque ces conditions sont réunies, nous constatons qu’il existe un groupe de symétries de translation temporelle opérant sur l’espace des solutions du côté lagrangien, tandis que du côté hamiltonien, il existe un groupe mettant en œuvre l’évolution temporelle sur l’espace des données initiales. Ces deux espaces sont isomorphes, et les deux actions de groupe s’entrecroisent de manière satisfaisante. On est capable de donner un compte rendu direct et attrayant de la manière dont le changement est représenté sur l’un ou l’autre de ces deux espaces fondamentaux.
Dans la section 6, je me tourne vers les complications qui doivent être introduites dans le tableau lorsqu’on abandonne l’une des conditions (i)-(iii) du paragraphe précédent. Enfin, dans la section 7, j’aborde la représentation du temps et du changement dans la relativité générale. Cela conduit directement au problème du temps.
Comme ce plan le montre clairement, une grande partie du chapitre est consacrée à l’exposition de matériel technique. Afin de garder la longueur raisonnable, j’ai dû présumer que le lecteur vient à ce chapitre avec un certain nombre de connaissances techniques. J’ai essayé d’écrire pour un lecteur idéal qui a précédemment étudié la relativité générale ou la théorie de jauge, et donc se sent à l’aise avec les concepts de base, les résultats et les constructions de la géométrie différentielle (bien qu’à quelques points stratégiques, j’ai inclus une discussion destinée à rafraîchir la mémoire de tels lecteurs).
Ce chapitre est fondé sur l’approche géométrique moderne de la mécanique lagrangienne qui est présentée dans l’esquisse la plus sommaire dans la section 4. Cette approche, développée relativement récemment par des mathématiciens, fournit un cadre hautement abstrait pour penser les théories physiques plutôt qu’un traitement entièrement rigoureux d’une théorie donnée. Elle existe au niveau formel, différentiel-géométrique : l’accent est mis sur la structure géométrique de divers espaces et sur le contenu géométrique des équations et des constructions ; les détails analytiques fonctionnels sont tenus en suspens. Une grande partie du matériel esquissé dans d’autres sections fonctionne à ce même niveau.
En termes de contenu, ce chapitre chevauche quelque peu avec , , et . Mais il est plus étroitement lié à . Le chapitre de Butterfield fournit une introduction philosophique aux approches géométriques modernes de la mécanique ; le présent chapitre est conçu comme un exemple de l’application de cette approche à un problème philosophique. Le présent chapitre est cependant censé être autonome. Et il y a en fait une différence considérable d’accent entre ce chapitre et celui de Butterfield : ce dernier se limite aux systèmes à dimension finie, et se concentre sur le côté hamiltonien des choses ; le présent chapitre concerne principalement les théories des champs, et se concentre dans une bien plus large mesure sur l’approche lagrangienne.
REMARQUE 1 (Notation et terminologie).
Les éléments de et les structures sur l’espace des solutions d’une théorie des champs sont toujours indiqués par des lettres majuscules (grecques ou latines) tandis que les éléments de et les structures sur l’espace des données initiales d’une théorie des champs sont toujours indiqués par des lettres minuscules (grecques ou latines). Les caractères gras indiquent les fonctions à trois vecteurs ou à trois valeurs vectorielles. Dans ce chapitre, une courbe est officiellement une carte d’intervalles de nombres réels dans un espace qui est un collecteur ou une généralisation légère d’un collecteur – parfois, pour des raisons d’emphase, j’appelle une courbe de manière redondante une courbe paramétrée. Une courbe affinément paramétrée est une classe d’équivalence de telles courbes, où deux courbes sont considérées comme équivalentes si elles ont la même image et si leur paramétrage concorde jusqu’au choix de l’origine.8 Une courbe non paramétrée est une classe d’équivalence de courbes, sous la relation d’équivalence où les courbes sont considérées comme équivalentes si elles ont la même image. Je confonds parfois une courbe et son image.
REMARQUE 2 (discours sur les mondes possibles).
Ci-après, notamment dans la section 7, je parle parfois de points de l’espace des solutions (données initiales) comme représentant des mondes possibles (états instantanés possibles) permis par la théorie, même si je ne prétends pas être impliqué dans des questions d’interprétation fine ici. Ce genre de choses n’est entendu que de manière grossière et heuristique. L’idée est qu’en essayant de comprendre une théorie, nous sommes en partie engagés dans une recherche d’une formulation perspicace de la théorie ; et il est raisonnable d’espérer que si une formulation est perspicace, alors il existera une interprétation prima facie attractive de la théorie selon laquelle il y a une bijection entre l’espace des solutions (données initiales) et l’espace des mondes possibles (états instantanés possibles) admis par la théorie sous cette interprétation. Il ne s’agit pas de nier qu’il puisse y avoir des raisons de rejeter en fin de compte de telles interprétations : un leibnizien pourrait se contenter d’une formulation standard de la mécanique classique, même si cela implique de considérer la relation de représentation entre les solutions et les mondes possibles comme plusieurs à un en vertu du fait que les solutions reliées par une translation temporelle doivent être considérées comme correspondant au même monde possible.