Partie II : Les quatre interactions fondamentales

*****

"La différence entre le génie et la stupidité est que seul le génie peut avoir ses limites "

Auteur inconnu

table des matières de la page :

I- Les quatre interactions fondamentales. 2

1. L’interaction électromagnétique. 4

2. Interaction faible. 5

3. L’interaction forte. 6

4. Les deux étapes de la théorie de la gravitation. 7

II- Tentatives d'unification. 11

III- Unification des interactions. 12

1) Unification des interactions électromagnétique et faible : l'interaction électrofaible  25

2) Brisure spontanée de symétrie - Mécanisme de Higgs. 65

______________________________________________________________________

 

I- Les quatre interactions fondamentales

Les interactions, c’est ce qui permet l’existence d’un ensemble, que ce soit à l’échelle microscopique comme les atomes, ou alors à l’échelle macroscopique au niveau des galaxies. Elles permettent en fait la liaison entre les différents composants de la matière ; malgré l’apparent paradoxe qu’il existe aussi bien des interactions répulsives (entre deux aimants portant des charges de même signe), que des interactions attractives (entre les planètes). Mais ce sont aussi ces interactions qui sont responsables de leur destruction. En effet, les interactions entre quarks par exemple permettent la stabilité du noyau en "collant" les nucléons entre eux ; mais à l’inverse, la radioactivité est la désintégration des atomes, phénomène aussi régi par des interactions.

L'ultime but de la science dans ce domaine serait de pouvoir fournir une théorie unique qui décrirait l'univers dans son ensemble, aussi bien à l’échelle macroscopique que à l’échelle microscopique. Cette théorie serait l'aboutissement de l'unification de la mécanique quantique (décrivant des phénomènes à une échelle extrêmement réduite) et la relativité générale (décrivant la force de gravité et la structure à grande échelle de l'univers). A ce jour, les scientifiques décrivent l'univers grâce à ces 2 théories partielles de base, qui se complètent : la mécanique quantique caractérise l’infiniment petit alors que la relativité générale caractérise plutôt l’infiniment grand. Elles sont donc apparemment incompatibles entre elles à première vue, mais à l’heure actuelle, malgré quelques expériences qui ont montré qu’il existe des cas où ces deux théories se rejoignent, il n’existe toujours pas de théorie qui serait valable dans les deux cas, macroscopiques et microscopiques. Nous verrons donc ici les différentes tentatives et les différentes théories élaborées dans ce sens, comme par exemple la théorie des cordes qui est bien connue, au moins de nom. 

Il est clair qu'Einstein à fait connaître à la physique moderne un bond énorme. La théorie de la relativité générale a supplanté la théorie Newtonienne de la gravitation et passé avec succès tous les tests obtenus par l’expérience et par les observations…enfin, pour le moment !

Rappelons les 4 forces/interactions fondamentales:


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

                                                    Figure 1 : les quatre grandes forces existant dans la Nature

Les 3 dernières forces peuvent être combinées dans ce que l'on appelle les théories de la grande unification.

La principale difficulté pour trouver une théorie unifiant la gravitation et les autres forces est que la relativité générale est une théorie "déterministe", classique, c'est à dire qu'elle ne contient pas de principe d'incertitude comparable à celui existant en mécanique quantique ( c’est le célèbre principe d’incertitude de HEISENBERG que nous avons déjà vu et qui stipule que l’on ne peut voir avec une grande précision à la fois des informations sur la position et la vitesse : ,  et ).

Dans la plupart des situations, la différence entre cette théorie générale et la relativité générale seront très faibles parce que la relativité générale traite de la structure de l’espace-temps à très grande échelle.

Rappelons quelques caractéristiques importantes de ces interactions dans le tableau suivant :

Interactions fondamentales

Champ et charge  mis en jeu

Messager

Caractéristique prédisposante

Électromagnétique

 

Photon

Charge électrique

Interaction faible

champ et charge faibles

W+, W-, ZO

Isospin faible

Interaction forte

champ et charge de couleur

Gluons

Charge de couleur

Gravitation

champ de gravitation et charge communément appelée…masse !

Graviton

Énergie/masse

Chaque interaction est caractérisée par son boson. On appelle bosons les messagers, particules nécessaires aux interactions. Ainsi, par exemple, l’interaction nucléaire forte, aussi encore appelée quelquefois chromodynamique, ne peut exister sans la présence de photons. Le graviton est, lui, une particule "imaginaire" : on suppose que son existence permet la gravitation. Mais il ne peut y avoir d'interaction sans qu'un certain boson d'interaction soit émis, absorbé ou échangé.

 

 

a)      L’interaction électromagnétique

La constante de couplage, est également appelée constante de structure fine car elle fournit une mesure de la structure fine observée dans le spectre des atomes. Elle est attribuée à l'interaction spin-orbite, qui détermine l'intensité de l'interaction entre particules pourvues d'une charge électrique et le photon, et vaut :. Le processus électromagnétique élémentaire est schématisé par le diagramme de Feynman de la figure 2 ci dessous. Il correspond à l'absorption ou l'émission d'un photon par un électron (effet photoélectrique) qui doit forcément être lié dans un atome pour garantir la conservation de la quantité de mouvement dans ce processus.

\begin{figure}
\htmladdimg{images/feyEM.gif}
\par {\par\centering\resizebox* {0.5\textwidth}{!}{\includegraphics{images/feyEM.eps}}\par }
\par\end{figure}

Figure 2 : Diagramme de Feynman décrivant le couplage d'un électron au champ électromagnétique avec émission d’un photon

Comme l'électron est couplé au photon avec une intensité égale à, la section efficaceest proportionnelle à a : l'effet photoélectrique est un processus dit du premier ordre en a. La section efficace de diffusion d'un électron et d'un positron par exemple, proportionnelle à , sera un processus du deuxième ordre. En introduisant le propagateur du photon (m=0), elle est égale à  , expression identique à celle de Rutherford pour la section efficace de diffusion de deux charges électriques.

La théorie des champs développée pour le calcul des processus électromagnétiques est appelée l'électrodynamique quantique, en abrégée QED pour Quantum ElectroDynamics. La mécanique quantique permet l'existence de processus dans lesquels un électron émet et absorbe un photon ou une paire électron-positron (figure 3). Ces processus contribuent à la masse et à l'énergie de l'électron et sont appelés les termes de self-énergie.

\begin{figure}
\htmladdimg{images/feyselene.gif}
\par {\par\centering\resizebox* {0.8\textwidth}{!}{\includegraphics{images/feyselfene.eps}}\par }
\par\end{figure}

Figure 3 ; Contribution de self- énergie à la masse et a la charge de l'électron : émission suivie de l'absorption d'un photon (a) ou d'une paire électron- positon par l'électron (b)

On parlera alors de diagrammes à l'ordre dominant (LO : leading order diagram) lorsque le diagramme a le plus petit nombre possible de vertex, comme celui de la figure 4. Les diagrammes dits diagramme à l'ordre suivant l'ordre dominant (NLO : next to leading order diagram), contiennent des termes de self-énergie.

 

\begin{figure}
\htmladdimg{images/feynlo.gif}
\par {\par\centering\resizebox* {0.9\textwidth}{!}{\includegraphics{images/feynlo.eps}}\par }
\par\end{figure}

Figure 4 : Diagramme à l'ordre suivant l'ordre dominant entrant dans le calcul de l'amplitude de diffusion électron/positon

Le calcul des termes de self-énergie conduit à des divergences qui résultent en une masse et une charge infinies. En fait, ce type de divergence apparaît dans le calcul de l'amplitude de n'importe quel processus électromagnétique. Pour s'affranchir de ce problème un artefact mathématique est inclus dans la théorie qui consiste d'abord à inclure tous les termes divergents dans la masse et la charge de l'électron et ensuite à redéfinir les valeurs théoriques comme égales aux valeurs physiques, déterminées expérimentalement. Cette technique est appelée "renormalisation". La "renormalisabilité" de QED est l'une des propriétés essentielles de la théorie. L'autre propriété essentielle est l'invariance de jauge, de la même manière que dans la théorie de Maxwell, nous avions les jauges de Lorentz ou de Coulomb.

En électrostatique, l'énergie présente dans une interaction dépend de l'évolution du potentiel statique et non de la valeur absolue de l'intensité du potentiel. Ainsi l'énergie à fournir pour déplacer une charge électrique d'un point de l'espace où le potentiel a une intensité V1 vers un autre point de l'espace où le potentiel a une valeur V2 est proportionnelle à la différence V1-V2 (E=qDV) et ne dépend pas des valeurs de V1 et V2. Ce processus physique est donc indépendant du choix, en un point quelconque de l'espace, de l'intensité ou de la jauge, et la théorie qui possède cette propriété aura ce que l’on appelle une invariance locale de jauge. La conséquence de cette propriété d'invariance est la conservation des courants et des charges électriques. Ce résultat peut s'expliquer  par ce qui suit. Supposons qu'il existe dans la nature un processus qui crée ou détruit la charge électrique. Le processus de création requiert un travail W qui est regagné lorsque la charge est détruite, un peu comme la création es particules virtuelles dans l’effet CASIMIR qui naissent à partir du vide. Créons maintenant une charge q en un point de l'espace où le potentiel a une intensité V1 et transportons cette charge en un autre point de l'espace, où l'intensité du potentiel a une valeur V2, où la charge est détruite. Le bilan énergétique de ce processus est égal à W+q(V1 -V2)-W. Ce processus ne conserve pas l'énergie et ne peut donc pas exister dans la nature. Nous en concluons que la charge est conservée dans les interactions qui sont invariantes par changement de jauge.

L'électrodynamique quantique et la Chromodynamique Quantique sont des théories quantiques des champs, qui décrivent l'interaction entre fermions par le couplage de ceux-ci avec un champ de longue portée. Elles sont toutes les deux localement invariantes pour une transformation arbitraire de jauge, c'est-à-dire qu'en tout point de l'espace la phase des champs de fermion peut être choisie arbitrairement sans que les résultats physiques ne dépendent pour autant de ce choix. Les théories incluant cette propriété d'invariance sont également "renormalisables", c'est-à-dire que les effets de cette interaction, telles les sections efficaces et la vie moyenne des particules, ont des valeurs finies et peuvent être calculées à n'importe quel ordre de la constante de couplage.

 

 

b)      Interaction faible

L'interaction faible agit entre les quarks et les leptons que l'on peut considérer comme porteurs d'une charge faible. Étant donné la faiblesse de cette interaction, ses effets ne sont mesurables que dans les processus pour lesquels les interactions électromagnétique et forte ne sont pas permises par les lois de conservation. Les interactions faibles observables impliquent donc soit des neutrinos, qui sont électriquement neutres et ne portent pas de charge de couleur, soit des quarks mais induisent alors un changement de couleur, mécanisme interdit pour l'interaction forte. La décroissance b du neutron est l'exemple type de l'interaction faible : n ® p+e-+.

Le diagramme de Feynman élémentaire pour l'interaction faible est représenté dans la figure 5 et le diagramme de la décroissance b du neutron dans la figure 6.

 

\begin{figure}
\htmladdimg{images/feyFai.gif}
\par {\par\centering\resizebox* {0.8\textwidth}{!}{\includegraphics{images/feyFai.eps}}\par }
\par\end{figure}

Figure 5 : Diagramme de Feynman décrivant le couplage d'un fermion aux bosons intermédiaires, vecteurs de l'interaction faible. Puisque le boson W est électriquement chargé, les fermions f1 et f2 sont deux particules différentes.

Les vecteurs de l'interaction faible sont les mésons massifs W± et Z0 de masses respectivement égales à 81 et 94 GeV. L'échange d'un boson W± a pour effet de changer la charge du lepton impliqué dans l'interaction; ce processus est appelé réaction à courant chargé. Les processus donnant lieu à l'échange d'un boson Z0 sont appelés réaction à courant neutre.

\begin{figure}
\htmladdimg{images/feyBeta.gif}
\par {\par\centering\resizebox* {0.8\textwidth}{!}{\includegraphics{images/feyBeta.eps}}\par }
\par\end{figure}

Figure 6: Diagramme de Feynman de la désintégration du neutron par intégration faible.

L'intensité de l'interaction faible peut être estimée à partir de la mesure de la vie moyenne d'une particule dans une décroissance purement faible et la comparaison avec à la vie moyenne mesurée dans une décroissance purement électromagnétique. La décroissance purement hadronique de l'hypéron sigma () ne conserve pas l'étrangeté et est donc interdite pour l'interaction forte. La valeur de la vie moyenne est égale à 10-10 secondes. La décroissance électromagnétique du partenaire neutre de l'hypéron sigma () est elle aussi interdite pour l'interaction forte par la conservation de l'isospin (l'hypéron sigma est un triplet d'isospin et l'hypéron lambda un singlet d'isospin). La valeur de la vie moyenne est égale à 10-10 secondes. Le rapport des deux vies moyennes donne l'ordre de grandeur du couplage faible, soit 10-5 fois plus faible que le couplage de l'interaction électromagnétique. Le propagateur de l'interaction est.

Dans la limite des moments transférés petits par rapport à la masse des bosons intermédiaires, l'amplitude est celle postulée par Fermi pour décrire la décroissance b :, la valeur numérique étant obtenue à partir du taux de décroissance expérimental.

En 1967, SALAM et WEINBERG ont suggéré que les interactions électromagnétique et faible ne sont que deux aspects d'une même interaction, l'interaction électrofaible. A suffisamment haute énergie ces deux interactions sont unifiées c'est-à-dire que le couplage g des bosons intermédiaires aux leptons et aux quarks est identique au couplage e des photons aux mêmes particules. En posant g = e, la masse du boson W est prédite égale à 90 GeV, qui est la valeur déterminée expérimentalement. Ceci pose le problème de l'invariance de jauge qui pour être vérifiée doit impliquer des bosons de masse nulle. En fait dans la théorie électrofaible, le photon et les trois bosons de masse intermédiaire sont les conséquences observables d'un champ hypothétique à quatre composante et de masse nulle. L'hypothétique boson de Higgs, au travers du mécanisme de Higgs, mélange les deux composantes neutres du champ pour donner naissance au photon et au et donne une masse aux deux composantes chargées pour donner naissance aux bosons W± et W-. les équations de mélange sont les suivantes :

                        g = cosqW B + sinqW

                        = - sin qW B + cos qW

L'angle de mélange, appelé angle de Weinberg (qW) vaut environ 29°, est un paramètre de la théorie électrofaible et lie le couplage g du courant neutre de l'interaction faible et le couplage e du courant neutre de l'interaction électromagnétique : e= g sinqW.

 

 

c)      L’interaction forte

L'interaction forte agit entre les quarks constituants qui constituent les hadrons. L'intensité du couplage peut être estimée à partir de la probabilité de décroissance des baryons instables. Prenons le cas de la résonance S°(1385) formée dans la réaction suivante :

K-+p ® S°(1385) ® L°+p°

De la largeur mesurée de la résonance, égale à 36 MeV, on déduit une vie moyenne égale à 10-23sec. En comparant cette valeur avec la vie moyenne dans la décroissance électromagnétique (les deux processus de décroissance ont des bilans énergétiques semblables, 130 MeV comparé à 77 MeV) :

S°(1192) ® L° + g

et en faisant le rapport des deux vies moyennes on obtient que l'intensité du couplage fort est égale à 100 fois l'intensité du couplage électromagnétique, c'est-à-diregs est, par analogie avec la constante de structure fine, la charge forte. Le médiateur de l'interaction est le gluon, un boson de masse nulle comme le photon. La particularité de la Chromodynamique Quantique, la théorie des champs de l'interaction forte, est l'existence de six types de charge forte appelés couleurs et libellés rouge, bleu et vert. Chaque quark peut être porteur de l'une des trois couleurs, les anti-quarks étant porteurs de l'anti-couleur et le gluon est également porteur d'une couleur et d'une anti-couleur. Cette dernière propriété implique que les gluons interagissent entre eux, ce qui conduit à trois diagrammes élémentaires pour l'interaction forte (fig. 7).

\begin{figure}
\htmladdimg{images/feyFort.gif}
\par {\par\centering\resizebox* {0.9\textwidth}{!}{\includegraphics{images/feyFor.eps}}\par }
\par\end{figure}

Figure 7  : Les  diagrammes de base dans la théorie de la chromatographie  quantique. En partant de la gauche : couplage du quark au gluon, du gluon sur un autre gluon et de 2 gluons entre eux.

Une autre particularité de l'interaction forte, résultant de la valeur du couplage voisin de l'unité, implique que le diagramme de la figure , c'est-à-dire l'échange d'un seul gluon dans la diffusion de deux quarks, n'est pas le seul à prendre en compte puisque les termes aux ordres as plus élevés (l'échange de plusieurs gluons) deviennent toujours plus important.

\begin{figure}
\htmladdimg{images/feyCoul.gif}
\par {\par\centering\resizebox* {0.7\textwidth}{!}{\includegraphics{images/feyCoul.eps}}\par }
\par\end{figure}

Figure 8 : Diagramme d’une diffusion de quark avec échanges de charges de couleur

En fait, pour des collisions violentes, dans lesquelles le moment transféré est important (où de façon équivalente les inter-distances sont petites), le couplage est inférieur à 1 de sorte que l'échange d'un gluon unique est une bonne approximation. Ce cas de figure constitue le régime perturbatif de QCD. Cependant pour des moments transférés faibles (des inter-distances grandes) le couplage devient plus grand que 1 et la théorie est incalculable car le nombre de termes à prendre en compte est infini. Ce cas de figure constitue le régime non-perturbatif.

Comme déjà mentionné précédemment, la particularité de la théorie de la Chromodynamique Quantique, notamment par rapport à l'électrodynamique quantique, réside dans le fait que le médiateur de l'interaction est lui-même porteur de charges de couleur et donc que les gluons interagissent entre eux. Tout comme les lignes de force de l'interaction électromagnétique relient deux charges électriques (fig. 14), les quarks sont liés entre eux par des lignes de force de l'interaction forte.

\begin{figure}
\htmladdimg{images/string.gif}
\par {\par\centering\resizebox* {0.8\textwidth}{!}{\includegraphics{images/string.eps}}\par }
\par\end{figure}

Figure 9 : Lignes de forces  du champ électrique entre 2 charges électriques comparées aux lignes de force du champ de couleur. Pour le champ de couleur, le lignes se groupent en un  tube ou corde du fait de l’interaction des gluons.

Cependant, du fait de l'interaction entre gluons, ces lignes de force sont regroupés en forme de tube que l'on désigne par le terme de corde (fig. 14). En tirant sur cette corde pour isoler par exemple un quark, l'énergie stockée dans la corde augmentera jusqu'à un point où le système trouvera énergétiquement plus économique de produire une nouvelle paire d'un quark et d'un anti-quark (fig. 15 ) en cassant la corde.

 

\begin{figure}
\htmladdimg{images/feyString.gif}
\par {\par\centering\resizebox* {0.9\textwidth}{!}{\includegraphics{images/feyString.eps}}\par }
\par\end{figure}

Figure 10 : Tenter de libérer un quark en tirant sur la corde résulte en la cassure de cette corde et la formation d'une paire d'un quark et d'un anti-quark.

Le tableau suivant résume les propriétés des trois interactions.

Interaction

Electromagnétique

Faible

Forte

 

 

 

 

Particule

Photon

bosons intermédiaires

Gluon

quantum de champ

g

W±, Z0

G

Spin-parité

1+

1-, 1+

1-

Masse (GeV/c²)

0

80,91

0

Portée (m)

¥

10-18

10-15³

Source

Charge électrique

Charge faible

charge de couleur

Couplage

1/137

1.02 10-5

» 1 grande distance

 

 

 

<1 courte distance

Section efficace (m²)

10-33

10-44

10-30

Vie moyenne (s)

10-20

10-8

10-23

 

Tableau 1: Les trois interactions fondamentales d'intérêt pour la physique des particules élémentaires



d)      Les deux étapes de la théorie de la gravitation

q       La relativité restreinte (1905)

Première étape, 1905, quand Einstein publia sa théorie de la relativité restreinte qui unifie deux concepts clés : l’espace et le temps. De cette théorie on peut retenir trois choses importantes:

·        L’espace temps dans lequel nous nous trouvons, est défini mathématiquement comme un espace pseudo-euclidien à quatre dimensions (une de temps et trois d’espace)  muni de la métrique de MINKOVSKI. Des quadrivecteurs décrivent un événement ; l’énergie et le vecteur quantité de mouvement sont également réunis en un seul objet mathématique (un autre quadrivecteur dont la norme est reliée à la masse selon la formule E² = Eau repos + Erelativiste = m²c4 +p²c²  ).

·        Rien de matériel ne peut se déplacer plus vite que la lumière, seule la lumière ou d'autres phénomènes sans masse intrinsèque peuvent l'atteindre et même la dépasser, comme par exemple dans l’effet tunnel.

·        Il n'y a pas de temps absolu (ce qui signifie que des horloges identiques aux mains d'observateurs différents ne devraient pas forcement indiquer la même heure).

La relativité restreinte nous apprend donc que plus un objet se déplace vite plus le temps s'écoule lentement pour lui (la limite de vitesse étant c la vitesse de la lumière soit environ 300000 km/s). Ce phénomène n'est pas subjectif mais bien réel et peut être vérifié par des expériences simples : une personne embarquée à bord d’un avion de ligne peut mesurer un très léger retard (mais retard quand même !) par rapport à une autre personne restée au sol, pour peu qu’elles soient toutes deux munies d’horloges extrêmement précises comme des horloges atomiques.

 

q       La relativité générale (1915)

Ensuite, en 1915, Einstein compléta ses théories en publiant cette fois la théorie générale de la relativité, théorie phare de la science du XXe siècle. Mais en cette période de guerre, on ne faisait guère attention à la science qui n’avait pas de rapport avec des utilisations pratiques militaires. C’est pour cela qu’à la fin de la guerre seulement, une expédition britannique est allée observer l’éclipse de 1919 et a confirmé les prédictions de la relativité générale : l’espace-temps n’est pas plat mais courbé par la matière et/ou l’énergie qui s’y trouvent comme le montre la figure 11. Cette découverte d’Einstein a complètement transforme notre vision de l’espace : nous ne pouvions plus penser que l’espace et le temps pouvaient s’écouler indépendamment de ce qui se passait autour dans l’univers, mais au contraire, ils devenaient des quantités dynamiques interagissant avec ce les événements s’y déroulant.


Figure 11 : Espace-temps courbé par un objet suffisamment massif (comme un trou noir)

 


La théorie de la relativité générale est très complexe au niveau mathématique, (en tous cas beaucoup trop pour moi !), je ne vais donc pas la présenter ici. Il lui manque cependant quelque chose : elle prédit l’existence de singularités…et elle n’est plus applicable en ces singularités !  En particulier, elle ne peut pas expliquer ce qui se passe dans les discontinuités de l’espace temps dont HAWKING et PENROSE ont prouvé l’existence si l’espace temps est courbé comme on le pense aujourd’hui. De même, elle ne peut pas dire comment l’Univers est né à partir du Big Bang.

Ainsi, la relativité générale n’est pas une théorie complète. Elle nécessite un ingrédient supplémentaire pour déterminer comment l’Univers est né, ce qui se passe quand la matière s’effondre sous l’effet de sa gravité, ce qui se passe aux discontinuités de l’espace temps, ce qui se passe au niveau subatomique, dans ce qui s’appelle par exemple l’écime quantique…cet ingrédient semble être la mécanique quantique. Pour unifier la gravitation aux autres interactions fondamentales il est nécessaire de parvenir à décrire la gravitation dans le formalisme de la physique quantique. La seule description théorique de la gravitation dont nous disposons aujourd’hui est celle fournie par la relativité générale. Or la relativité générale et la mécanique quantique ne font pas toujours bon ménage. Sur de nombreux points fondamentaux, le monde de la relativité générale et celui de la physique quantique ont une vision totalement divergente. Notamment :

 

Relativité générale                                                                                                                             Mécanique quantique

Théorie purement géométrique                                                                                                           Théorie "analytique"

Les lois physiques sont indépendantes de l’observateur                                                                     les résultats des mesures dépendent de l’observateur

Théorie déterministe                                                                                                                           Théorie non déterministe

Les interactions sont continues                                                                                                           Les interactions sont quantifiées (discontinues)

Gravité est décrite comme un champ classique => un champ n’interagit pas avec lui-même.        Gravité est décrite par des quanta nommés gravitons. Les gravitons interagissent entre eux

 

Cela tient peut être du fait que la relativité générale tente d’expliquer l’infiniment grand alors que la physique quantique s’intéresse à l’infiniment petit. Les moyens mathématiques employés par les physiciens pour atteindre ces objectifs sont radicalement différents. Pour unifier la gravitation aux autres interactions fondamentales il est nécessaire de parvenir à décrire la gravitation dans le formalisme de la physique quantique. La seule description théorique de la gravitation dont nous disposons aujourd’hui est celle fournie par la relativité générale. Or la relativité générale et la mécanique quantique ne font pas toujours bon ménage. Sur de nombreux points fondamentaux, le monde de la relativité générale et celui de la physique quantique ont une vision totalement divergente. Cela tient peut être au fait que la relativité générale tente d’expliquer l’infiniment grand alors que la physique quantique s’intéresse à l’infiniment petit. Les moyens mathématiques employés par les physiciens pour atteindre ces objectifs sont radicalement différents. Cependant, quelle que soit l’échelle des phénomènes décrits, il ne devrait exister qu’un modèle unique pour aborder aussi bien l’infiniment petit que l’infiniment grand, théorie qui, à ce que l’on pense aujourd’hui, devait exister au tout début de l’Univers, avant les fatidiques 10-43 secondes au-dessous desquelles on ne sait plus rien prédire.

Dans un cadre quantique, la gravitation doit être transportée par des quanta associés au champ gravitationnel, de la même manière que les ondes électromagnétiques sont associées aux photons . Ces quanta ont été baptisés gravitons. Il est possible de définir de façon purement théorique les principales caractéristiques du graviton :

1.      une masse nulle car la portée de la gravitation est infinie.

2.      un spin égal à 2 car la gravitation est représentée par un tenseur (le tenseur métrique) qui possède 5 degrés de liberté (un spin j peut prendre 2j+1 valeurs ce qui fait 5 dans le cas d’un spin 2)

3.      l’interaction gravitationnelle étant très faible (de manière théorique, tous les corps devraient s’attirer mutuellement…cependant dans la pratique, quand nous marchons dans la rue par exemple, nous ne sommes pas attirés physiquement par les autres passants !), les interactions impliquant des gravitons deviennent prépondérantes à des niveaux d’énergie très élevés (de l’ordre de 1019 GeV)

4.      les gravitons étant des quanta d'énergie, ils transportent de facto de l'énergie. Or la gravitation est sensible à la masse et à l'énergie (il suffit de penser aux trous noirs qui dévient et même attirent la lumière). Par conséquent, les gravitons doivent interagir entre eux.

Quand on essaye de représenter la gravitation - telle que proposée par la relativité générale - avec le formalisme de la théorie quantique des champs, on se heurte immédiatement à une difficulté majeure. Une des relations d’incertitude d’Heisenberg nous apprend que l’incertitude sur la mesure de l’énergie est d’autant plus grande que la durée de la mesure est courte. Ce qui peut être interprété différemment en disant que l’énergie peut d’autant plus fluctuer que la durée d’observation est courte. Ces fluctuations se rencontrent partout, même dans le vide absolu. Cela implique que dans le vide total, sur des très courtes durées, la quantité d’énergie présente n’est pas nulle et peut même être gigantesque. Ce phénomène porte le nom de fluctuations du vide. Il peut paraître paradoxal, voire aberrant et pourtant récemment il a clairement été mis en évidence dans une expérience reproduisant l’effet Casimir, ou même dans ce que l’on appelle les particules virtuelles.

Les fluctuations de l’énergie dans le vide se matérialisent sous forme de champ de matière ou de force. Ainsi, le vide n’est pas vide du tout, mais rempli de particules et d’anti-particules qui se créent spontanément et s’annihilent presque aussitôt. Quand l’amplitude des fluctuations d’énergie atteint des valeurs pour lesquelles la gravitation devient prépondérante (c'est-à-dire aux alentours de 1019 GeV), l’énergie va pouvoir se "matérialiser" sous forme de gravitons. Or selon la théorie de la relativité générale, l’interaction gravitationnelle créée l’espace-temps. Il s’ensuit que la production spontanée de gravitons dans le vide va modifier profondément la topologie de l’espace-temps localement au point d’affecter la notion même de position et d’instant. Ainsi, à des échelles de distance et de temps très courtes - typiquement l'échelle de Planck à savoir 10-43 s et 10-33 cm - l’espace-temps est tellement "secoué" par les fluctuations d’énergie qu’il n’est plus vraiment possible de parler d’espace et de temps. Les fluctuations de l’énergie dans le vide ont donc pour effet de "faire fluctuer" l’espace-temps.

Sans espace et sans temps « solide » sur lequel la physique peut s’appuyer, toutes les théories physiques se dissolvent dans le "néant".

Comme on peut l’imaginer cette situation ne satisfait pas les physiciens. Pour y remédier, la physique théorique s’est lancée dans plusieurs directions de recherche passionnantes mais également incroyablement abstraites. Il faut dire qu’aux niveaux d’énergie auxquels ces nouvelles théories s’attaquent, l’expérience ne peut être d’une grande aide.

Trois grands axes de recherche canalisent aujourd’hui les efforts des physiciens :

  1. Les théories de la supergravité reposant elles-mêmes sur des théories supersymétriques (SUSY)
  2. La théorie des supercordes.
  3. La remise en question de la topologie classique de l’espace-temps.

 

 

 

II- Tentatives d'unification

Albert Einstein fut le premier physicien à tenter d'élaborer une théorie unificatrice dans les années 1910. Ses travaux sur la relativité lui faisant présumer l'existence d'une théorie commune pour les forces électromagnétiques et gravitationnelles, il essaya en vain, durant les trente dernières années de sa vie, de concevoir un modèle où forces et particules seraient représentées uniquement par des champs, les particules n'étant rien d'autre que des zones du champ où les valeurs d'intensité seraient particulièrement élevées. Mais l'avènement de la théorie quantique et la découverte de nouvelles particules sonnèrent l'échec d'Einstein, qui ne pouvait réussir dans sa tâche en s'aidant uniquement des lois de la relativité et de la physique classique.

Cette quête fut relancée dans les années 1960 sous l'impulsion des physiciens américains Steven Weinberg et Sheldon Glashow, et du physicien pakistanais Abdus Salam. Ces trois chercheurs parvinrent à unifier l'interaction nucléaire faible et l'interaction électromagnétique en faisant appel à des symétries internes, symétries portant sur les propriétés intrinsèques des particules (charge, spin, etc.) et non sur leurs positions spatio-temporelles. Selon cette théorie connue sous le nom de théorie électrofaible, les photons, responsables des interactions électromagnétiques, appartiendraient à la même famille que les bosons intermédiaires W et Z, qui gouvernent les interactions faibles.

En 1976, apparut le nom de supergravité. Elle se base sur la supersymétrie (1974) associant à chaque particule de matière (fermions: spin demi-entier), une particule support de forces (bosons: spin entier) et réciproquement. La supergravité combine une particule de masse nulle et de spin 2 (appelée graviton) à d'autres particules de spins 3/2, 1, 1/2 et 0. Toutes ces particules peuvent être considérées comme faisant partie d'une "superparticule" qui resterait à définir…. et à en prouver l’existence !

Aujourd'hui, les scientifiques tentent de combiner les quatre types d'interactions à l'aide de théories de supersymétrie et de supergravité mais le problème s'avère très ardu, les physiciens ne parvenant pas à englober l'interaction gravitationnelle dans leur théorie unificatrice. Pourtant, après des décennies d'échecs, la théorie des cordes, puis la théorie des supercordes semble ouvrir de nouveaux horizons...

Nous pouvons résumer ceci par le schéma suivant :

 

Interaction faible

                                                       Interaction électrofaible

Théorie quantique des champs

 
Interaction électromagnétique                                                       

 


Théorie des cordes, des super cordes, …

 
Interaction forte

 

Gravitation

 

 

 

III- Unification des interactions

Comme nous l’avons déjà vu plusieurs fois, les physiciens ont recensé quatre interactions fondamentales dans la nature. Cependant, rien n’indique pourquoi il n’y en aurait que 4, et il peut en exister plus sans que les moyens expérimentaux dont nous disposons à l’heure actuelle nous permettent de les mettre en évidence. Nous en connaissons 4, …mais pourquoi 4 et pas plus ? Nul ne peut répondre à cette question pour le moment. Mais ce qui est quasi sur, est qu’à l’origine du temps, au fameux moment du Big-Bang, toutes les interactions étaient rassemblées en une seule et unique interaction, mais dans des conditions extrêmes de densité, de température et de pression.

Augmenter l'énergie mise en jeu dans les interactions revient à se rapprocher des conditions qui prévalaient lors du Big-Bang, à des temps inférieurs au fameux temps de Plank de 10-43s. Augmenter l'énergie est donc équivalent à remonter le cours de l'histoire de l'univers. S'il existe effectivement une interaction unique à très haute énergie, synthèse des interactions observées à notre niveau d'énergie, alors cela signifie que cette interaction était celle qui existait au moment du Big-Bang… et dans ce cas-là, on pourrait apporter des éléments de réponse à une des questions les plus mystérieuses : "D’où vient l’Univers que nous connaissons et qu’il y avait-il avant celui-ci ??".

Certains faits expérimentaux tendent à laisser soupçonner l'existence d'une telle synthèse à très haute énergie. Notamment, les expériences ont montré que les valeurs des constantes de couplage des diverses interactions se modifient avec l'augmentation de l'énergie et semblent, en première approximation, converger vers une valeur unique (à l'exception de la gravitation, toutefois).

 

Figure 12 : L'unification des différentes forces en fonction de leur énergie.

Ainsi, l'on prédit qu'à des énergies de l'ordre de 1016 GeV, les interactions électromagnétiques, faible et forte ne formeraient qu'une seule et unique interaction. Le modèle théorique permettant de décrire cette interaction s'appelle GUT pour Grand Unified Theory.

Cette interaction unifiée se combinerait ensuite avec la gravitation à des niveaux d'énergie encore plus élevés de l'ordre de 1019 GeV pour ne constituer qu'une seule interaction universelle. Les physiciens disposent de plusieurs théories décrivant cette "super-interaction". L'une d'entre-elle retient aujourd'hui toute l'attention du monde de la physique des particules : la théorie des super-cordes à laquelle nous reviendrons plus loin.

 

a)      Unification des interactions électromagnétique et faible : l'interaction électrofaible

L'interaction faible se manifeste naturellement dans la nature dans deux phénomènes :

·        La désintégration béta,

·        La capture électronique.

Dans le cas de la désintégration béta, un neutron se transforme spontanément en un proton en émettant un électron et une particule non chargée nommée anti-neutrino électronique.

La capture électronique est un phénomène curieux qui consiste en l'absorption par un proton contenu dans un noyau atomique d'un électron de cet atome. Le proton se transforme alors en neutron en émettant un anti-neutrino électronique.

Dans le détail, on remarque que deux types de particules interviennent : des hadrons (le proton et le neutron) et une famille de particules dénommée leptons à laquelle appartiennent l'électron et le neutrino. Nous avons vu, les hadrons sont constitués de particules plus élémentaires : les quarks. Il n'en est rien des leptons, du moins selon l'état actuel de nos connaissances. Les leptons sont des particules véritablement élémentaires. En fait, ce n'est pas le hadron qui interagit mais l'in des quarks contenus dans le hadron. Ainsi, l'interaction faible est ressentie par les quarks d'une part, et les leptons d'autre part.

Les observations expérimentales ont montré que l'électron et l'anti-neutrino ainsi que le neutron et le proton jouent des rôsles symétriques dans ces réactions. Il est possible de les permuter sans modifier le phénomène :

Dit autrement, cette observation peut s'énoncer comme suit : l'interaction faible est symétrique (ou invariante) vis-à-vis des permutations entre anti-neutrinos et électrons. Donc si l'on transforme globalement tous les électrons en anti-neutrinos et inversement, l'interaction faible se comportera de la même manière. Nous tenons là l'amorce d'une théorie de jauge. Cette remarque s'applique également au proton et au neutron. Ces deux particules jouent en effet un rôle symétrique dans les réactions faisant intervenir l'interaction faible.

Pour pouvoir introduire l'invariance de l'interaction faible dans les équations, les physiciens ont dû inventer une grandeur physique abstraite qui se prêtait mieux à des manipulations mathématiques que les noms des particules. Cette grandeur abstraite est le spin isotopique ou encore l’isospin faible noté I. Pour l’électron et le neutrino, les valeurs de l’isospin sont respectivement +1/2 et -1/2. Ainsi, l’électron et le neutrino électronique ne diffèrent que par la valeur de leur isospin pour l’interaction faible. La symétrie globale évoquée plus haut peut alors s’énoncer comme une invariance vis-à-vis de la valeur de l’isospin. Tout comme dans le cas des quarks, il est possible de construire un espace abstrait pour représenter l’état d’isospin faible d’une particule.

Ce que nous dit la symétrie globale d’isospin c’est que l’on peut procéder à une rotation de 90° dans l’espace d’isospin - ce qui a pour effet de permuter les électrons et les neutrinos - sans pour autant affecter les phénomènes liés à l’interaction faible :

Pour construire une théorie de jauge à partir de cette symétrie globale, imposons à présent une symétrie locale d’isospin, c'est-à-dire l’invariance de l’interaction faible pour des changements d’isospin pour une seule ou un nombre limité de particules. Si cette symétrie locale existait effectivement dans la nature, l’on pourrait observer des réactions comme :

p + e- ---> n + e-

où l’on a transformé l’anti-neutrino en un électron dans la seconde partie de la réaction. Or une telle réaction ne peut être observée car elle viole la loi de conservation de la charge électrique (lacharge totale est nulle dans le membre gauche de la réaction et négative dans le membre droit). Notons au passage que cette remarque est importante car elle montre que la symétrie locale d’isospin n'est pas rigoureusement exacte. En effet l'interaction faible est invariante par symétrie d'isospin à la charge électrique près ! Dit autrement, imposer une symétrie locale de l'isospin pour l'interaction faible peut affecter les charges électriques, qui elles, relèvent de l’interaction électromagnétique. Il apparaît donc une connexion entre l’interaction faible et l’interaction électromagnétique.

Imposons la symétrie locale d’isospin, même si celle-ci donne des résultats physiques en apparence aberrants. Que se passe-t-il ? On constate l’apparition de quatre champs dans les équations : deux champs neutres, un champ chargé positivement et un dernier chargé négativement.

L’un de ces champs est constitué de quanta neutres, de masse nulle et de spin égal à 1. Ces propriétés sont celles du photon et le champ correspondant n’est donc rien d’autre que le champ électromagnétique. Les trois autres champs sont spécifiques à l’interaction faible proprement dite. La symétrie locale d’isospin a donc entraîné de facto l’unification des interactions électromagnétique et faible. Selon ce modèle, ces deux interactions seraient donc la manifestation d’une seule et unique interaction : l’interaction électrofaible.

Dans la première formulation de cette théorie, les trois champs spécifiques à l’interaction faible ont des quanta de masse également nulle ce qui n’était pas en accord avec les observations expérimentales. En effet, des quanta de masse nulle impliquent une interaction de portée infinie. Or, comme nous l’avons mentionné plus haut, l’interaction faible est confinée à des distances très courtes ce qui nécessite l’intervention de quanta de masse non nulle. En fait, en retravaillant la théorie, les physiciens ont démontré que les quanta associés à ces trois champs possédaient une masse. Nous verrons plus loin par quel mécanisme ces quanta acquièrent cette masse.

Finalement la description complète de l’interaction unifiée électrofaible fait intervenir quatre champs dont les quanta sont :

·        Le photon de charge nulle, de spin 1 et de masse nulle

·        Le Z0 de charge nulle, de spin 1 et d’une masse approximative de 90 GeV

·        Le W+ de charge positive, de spin 1 et de masse avoisinant les 80 GeV

·        Le W- de charge négative, de spin 1 et dont la masse est identique à celle du W+

Ce résultat peut être obtenu de manière intuitive à partir des constats établis précédemment :

-         L’invariance d’isospin peut affecter la charge électrique ce qui implique l’existence de quanta chargés (positifs et négatifs) c'est-à-dire les W+ et W-

-         La symétrie locale d’isospin, pour être exacte, doit être compensée par l’interaction électromagnétique (c’est en cela que les interactions faible et électromagnétique sont unifiées) et donc impliquer l’intervention du champ électromagnétique

L’existence du Z0 est moins « triviale ». En fait, les observations tirées de la multitude d’expériences réalisées ces dernières décennies ont indiqué l’existence d’un médiateur neutre dans certaines interactions faibles que l’on appelle communément un courant neutre. Ce médiateur est le Z0.

L'interaction électrofaible, ne l'oublions pas, est le résultat de l'imposition de la symétrie locale d'isospin. Comme nous l'avons indiqué, le changement d'isospin revient à inverser (faire tourner de 180°) l'isospin dans l'espace abstrait de l'isospin. L'ensemble des rotations des spineurs 1/2 est un groupe noté SU(2). Si la symétrie d'isospin était rigoureusement exacte, l'interaction faible pourrait être décrite intégralement par ce groupe. Cependant, pour que la symétrie soit parfaite, il faut introduire l'interaction électromagnétique qui est elle même décrite par le groupe U(1). Le groupe des symétries de l'interaction électrofaible est donc la combinaison de ces deux groupes et est notée SU(2) x U(1). Dans le détail, le groupe de symétrie est SU(2)L x U(1), le L en indice signifie que les seules rotations permises sont celles orientées vers la gauche (L pour Left en anglais). Ceci vient d'une propriété très étrange des neutrinos nommée l'hélicité.

Il reste cependant deux questions essentielles auxquelles il faut répondre :

1.      Pourquoi à notre échelle d'énergie les interactions faible et électromagnétiques paraissent distinctes ?

2.      Pourquoi les Z0, W+ et W- ont-ils une masse non nulle ?

La réponse à ces deux questions nous oblige à faire un détour par ce que l’on appelle en physique le mécanisme de brisure spontanée de symétrie.

 

 

b)      Brisure spontanée de symétrie - Mécanisme de Higgs

Une brisure spontanée de symétrie est un phénomène par lequel un système physique perd en degrés de symétrie. La rupture spontanée de la symétrie joue un rôle très important dans beaucoup de domaines différents de la physique. Comme nous l’avons vu, les équations de la physique possèdent en général des solutions qui présentent une ou plusieurs symétries internes. L'idée fondamentale réside dans le fait que certaines solutions de ces équations peuvent casser ou briser cette symétrie. L’un des exemples les plus connus d’un tel phénomène est la transition de phase du paramagnétisme au ferromagnétisme du fer.

Lorsque l’on chauffe un aimant, ses pouvoirs magnétiques décroissent pour disparaître subitement lorsque la température dépasse un seuil nommé température de Curie. Inversement, si l’on refroidit ce même aimant, ses propriétés magnétiques vont tout aussi subitement réapparaître lorsque la température passe au dessous de la température de Curie.

Chaque atome individuel de fer possède un moment magnétique propre c'est-à-dire qu’il se comporte un peu comme un aimant ou un dipôle magnétique en langage physique. Pour des températures situées au-dessus de la température de curie tous ces dipôles se dirigent dans des directions aléatoires. Dans ce cas-ci le système et les équations qui le décrivent ont une symétrie par rotation dans l’espace. En effet, en faisant tourner de façon aléatoire le morceau de fer dans l'espace, les propriétés magnétiques de ce dernier ne sont globalement pas altérées. Quand la température tombe au-dessous de la température de curie, les interactions entre les dipôles magnétiques ont pour effet de les aligner selon une direction unique (le morceau de fer devient ce que l'on appelle dans le langage courant un aimant). Avant la transition de phase le système était inchangé par n'importe quelle rotation dans trois dimensions, tandis qu’après la transition de phase le système est inchangé seulement par des rotations dans le plan perpendiculaire à la direction des dipôles. La symétrie tridimensionnelle initiale a été spontanément brisée en une symétrie bidimensionnelle

Il est important de noter que la direction dans laquelle s'alignent les atomes de fer après la transition de phase est totalement aléatoire. Il n'est pas possible de connaître a priori cette direction. C'est là une caractéristique majeure des phénomènes de brisure spontanée de symétrie.

Les physiciens ont imaginé qu’un processus similaire de brisure de symétrie pouvait expliquer la décomposition de l’interaction électrofaible en deux interactions - l’interaction faible et l’interaction électromagnétique - présentant un niveau de symétrie moins élevé.

transition de phase

SU(2) x U(1) [interaction électrofaible] ---> SU(2) [interaction faible classique] + U(1) [interaction électromagnétique]

La transition de phase du paramagnétisme au ferromagnétisme du fer s’explique relativement simplement à l’aide de l’agitation thermodynamique des atomes de fer qui, baissant avec la température, permet aux atomes de s’aligner spontanément au dessus d’une certaine température. Dans le cas de l’interaction électrofaible, qu’est-ce qui est à l’origine de la brisure de la symétrie ?

Supposons que le potentiel de l’interaction électrofaible ait la forme suivante

Pourquoi cette forme et pas une autre ? Parce que ce potentiel présente une propriété très intéressante. A haute énergie (énergie supérieure ou égale à Es sur la figure), le potentiel possède une symétrie cylindrique, c'est-à-dire qu’il reste inchangé après des rotations selon l’axe V. En revanche, au dessous de l’énergie Es, la symétrie cylindrique n’existe plus : plusieurs valeurs sont possibles pour le même niveau d’énergie (on dit que le niveau d’énergie est dégénéré). Le système peut alors tomber dans un ou l’autre des deux états avec la même probabilité. Au moment où la symétrie est brisée, il n’est pas possible de prédire lequel des deux états d’énergie le système va adopter. Nous nous trouvons dans une situation très similaire à celle que nous avons décrite dans le cas de la transition de phase paramagnétique à ferromagnétique du fer.

Text Box: Pour le niveau d'énergie E il existe 4 états possibles du champ S1, S2, S3 et S4

  

Il se trouve que le potentiel de l’interaction électrofaible se comporte de façon semblable à celui illustré par cet exemple. Au delà d’une certaine énergie (~ 100 GeV) le potentiel électrofaible possède la symétrie SU(2)L x U(1). En deça, les états d’énergie sont dégénérés et ce qui conduit briser spontanément la symétrie.

Pourquoi le potentiel électrofaible a-t-il cette forme ? Ceci est du au fait que d’autres champs se superposent à ceux de l’interaction électrofaible : les champs de Higgs dont les quanta sont appelés bosons de Higgs. Ces champs ne possèdent pas les mêmes symétries que ceux de l’interaction électrofaible. A haute énergie, leur effet n’est pas décelable et donc la symétrie de l’interaction faible est apparente. En revanche, à partir d’un certain seuil, la forme du potentiel est affectée par les champs de Higgs au point de provoquer la dégénérescence des états d’énergie, et du coup, ils provoquent la brisure spontanée de la symétrie électrofaible.

La présence des bosons de Higgs induit un autre phénomène d’une importance majeure : ils font anormalement baisser l’état d’énergie du vide. Par conséquent, les bosons de l’interaction électrofaible (W+, W- et Z0) ne se trouvent pas dans leur état fondamental (on dit qu’ils ne sont pas sur leur "couche de masse") et acquièrent une masse ! En acquérant une masse, leur portée devient finie et comme cette masse est très élevée (entre 80 et 90 GeV) cette portée est très courte.

Voilà, tout s’explique. Malheureusement, malgré tous les efforts déployés jusqu'à ce jour, les physiciens n’ont toujours pas mis en évidence les bosons de Higgs. Certains physiciens croient que ces particules ne sont que des artifices mathématiques qui n’ont aucune réalité physique. La prochaine grande étape de la physique des particules expérimentale est donc la découverte des bosons de Higgs. Si cette quête reste infructueuse, le modèle actuel de l’interaction électrofaible pourrait être remis en question.