Partie
II :
Les quatre interactions fondamentales ***** |
"La
différence entre le génie et la stupidité est que seul le génie peut avoir ses
limites "
Auteur
inconnu
table des matières de la page :
I- Les quatre interactions fondamentales
1. L’interaction
électromagnétique.
4. Les deux étapes de la
théorie de la gravitation
III- Unification des
interactions.
1) Unification des interactions
électromagnétique et faible : l'interaction électrofaible
2) Brisure spontanée de
symétrie - Mécanisme de Higgs
______________________________________________________________________
Les interactions,
c’est ce qui permet l’existence d’un ensemble, que ce soit à l’échelle
microscopique comme les atomes, ou alors à l’échelle macroscopique au niveau
des galaxies. Elles permettent en fait la liaison entre les différents
composants de la matière ; malgré l’apparent paradoxe qu’il existe aussi
bien des interactions répulsives (entre deux aimants portant des charges de
même signe), que des interactions attractives (entre les planètes). Mais ce
sont aussi ces interactions qui sont responsables de leur destruction. En
effet, les interactions entre quarks par exemple permettent la stabilité du
noyau en "collant" les nucléons entre eux ; mais à l’inverse, la
radioactivité est la désintégration des atomes, phénomène aussi régi par des
interactions.
L'ultime but de la science dans ce domaine
serait de pouvoir fournir une théorie
unique qui décrirait l'univers dans son ensemble, aussi bien à l’échelle
macroscopique que à l’échelle microscopique. Cette théorie serait
l'aboutissement de l'unification de la mécanique quantique (décrivant des phénomènes à une échelle extrêmement réduite) et la
relativité
générale (décrivant
la force de gravité et la structure à grande échelle de l'univers). A ce jour,
les scientifiques décrivent l'univers grâce à ces 2 théories partielles de
base, qui se complètent : la mécanique quantique caractérise l’infiniment
petit alors que la relativité générale caractérise plutôt l’infiniment grand.
Elles sont donc apparemment incompatibles entre elles à première vue, mais à
l’heure actuelle, malgré quelques expériences qui ont montré qu’il existe des
cas où ces deux théories se rejoignent, il n’existe toujours pas de théorie qui
serait valable dans les deux cas, macroscopiques et microscopiques. Nous
verrons donc ici les différentes tentatives et les différentes théories
élaborées dans ce sens, comme par exemple la théorie des cordes qui est bien
connue, au moins de nom.
Il est clair qu'Einstein
à fait connaître à la physique moderne un bond énorme. La théorie de la
relativité générale a supplanté la théorie Newtonienne de la
gravitation et passé avec succès tous les tests obtenus par l’expérience et par
les observations…enfin, pour le moment !
Rappelons les 4 forces/interactions
fondamentales:
Figure 1 : les quatre grandes forces existant dans la Nature
Les 3 dernières forces peuvent être
combinées dans ce que l'on appelle les théories de la grande unification.
La principale difficulté pour trouver une
théorie unifiant la gravitation
et les autres forces est que la relativité générale est une théorie
"déterministe", classique, c'est à dire qu'elle ne contient pas de principe d'incertitude comparable à
celui existant en mécanique
quantique ( c’est le célèbre principe d’incertitude de HEISENBERG que nous avons déjà vu
et qui stipule que l’on ne peut voir avec une grande précision à la fois des
informations sur la position et la vitesse : , et ).
Dans la plupart des situations, la différence
entre cette théorie générale et la relativité générale seront très faibles
parce que la relativité générale traite de la structure de l’espace-temps à
très grande échelle.
Rappelons quelques caractéristiques
importantes de ces interactions dans le tableau suivant :
Interactions fondamentales |
Champ et charge
mis en jeu |
Messager |
Caractéristique prédisposante |
Électromagnétique |
|
Photon |
Charge électrique |
Interaction faible |
champ et charge faibles |
W+, W-, ZO |
Isospin faible |
Interaction forte |
champ et charge de couleur |
Gluons |
Charge de couleur |
Gravitation |
champ de gravitation et charge communément
appelée…masse ! |
Graviton |
Énergie/masse |
Chaque interaction est caractérisée par
son boson. On appelle bosons les messagers,
particules nécessaires aux interactions. Ainsi, par exemple, l’interaction
nucléaire forte, aussi encore appelée quelquefois chromodynamique,
ne peut exister sans la présence de photons. Le graviton est, lui, une
particule "imaginaire" : on suppose que son existence
permet la gravitation. Mais il ne peut y avoir d'interaction sans qu'un certain
boson d'interaction soit émis, absorbé ou échangé.
La constante
de couplage, est également appelée constante
de structure fine car elle fournit une mesure de la structure fine
observée dans le spectre des atomes. Elle est attribuée à l'interaction
spin-orbite, qui détermine l'intensité de l'interaction entre particules
pourvues d'une charge électrique et le photon, et vaut :. Le processus électromagnétique élémentaire est schématisé
par le diagramme de Feynman de la
figure 2 ci dessous. Il correspond à l'absorption ou l'émission d'un
photon par un électron (effet photoélectrique) qui doit forcément être lié dans
un atome pour garantir la conservation de la quantité de mouvement dans ce
processus.
Figure 2 : Diagramme de Feynman décrivant le couplage d'un électron au champ électromagnétique avec émission d’un photon
Comme l'électron est couplé au photon avec une intensité égale à, la section efficaceest proportionnelle à a : l'effet photoélectrique est un processus dit du premier ordre en a. La section efficace de diffusion d'un électron
et d'un positron par exemple, proportionnelle à , sera un processus du deuxième ordre. En introduisant le
propagateur du photon (m=0), elle est égale à , expression
identique à celle de Rutherford pour la section efficace de diffusion de deux
charges électriques.
La théorie des champs développée pour le
calcul des processus électromagnétiques est appelée l'électrodynamique quantique, en abrégée QED pour Quantum ElectroDynamics. La mécanique quantique permet
l'existence de processus dans lesquels un électron émet et absorbe un photon ou
une paire électron-positron (figure 3). Ces processus contribuent à la masse et
à l'énergie de l'électron et sont appelés les termes
de self-énergie.
Figure 3 ; Contribution de self- énergie à la masse et a la charge de l'électron : émission suivie de l'absorption d'un photon (a) ou d'une paire électron- positon par l'électron (b)
On parlera alors de diagrammes à l'ordre dominant (LO : leading order
diagram) lorsque le diagramme a le plus petit nombre possible de vertex,
comme celui de la figure 4. Les diagrammes dits diagramme à l'ordre suivant
l'ordre dominant (NLO : next to leading order diagram), contiennent des
termes de self-énergie.
Figure 4 : Diagramme à l'ordre suivant l'ordre dominant entrant dans le calcul de l'amplitude de diffusion électron/positon
Le calcul des termes de self-énergie
conduit à des divergences qui résultent en une masse et une charge infinies. En
fait, ce type de divergence apparaît dans le calcul de l'amplitude de n'importe
quel processus électromagnétique. Pour s'affranchir de ce problème un artefact
mathématique est inclus dans la théorie qui consiste d'abord à inclure tous les
termes divergents dans la masse et la charge de l'électron et ensuite à
redéfinir les valeurs théoriques comme égales aux valeurs physiques,
déterminées expérimentalement. Cette technique est appelée "renormalisation". La
"renormalisabilité" de QED est l'une des propriétés essentielles de
la théorie. L'autre propriété essentielle est l'invariance de jauge, de la même
manière que dans la théorie de Maxwell, nous avions les jauges de Lorentz ou de
Coulomb.
En électrostatique, l'énergie présente
dans une interaction dépend de l'évolution du potentiel statique et non de la
valeur absolue de l'intensité du potentiel. Ainsi l'énergie à fournir pour
déplacer une charge électrique d'un point de l'espace où le potentiel a une
intensité V1 vers un autre point de l'espace où le potentiel
a une valeur V2 est proportionnelle à la
différence V1-V2 (E=qDV) et ne dépend pas des valeurs de V1
et V2. Ce processus physique est donc indépendant du choix,
en un point quelconque de l'espace, de l'intensité ou de la jauge, et la
théorie qui possède cette propriété aura ce que l’on appelle une invariance locale de jauge. La conséquence de
cette propriété d'invariance est la conservation des courants et des charges
électriques. Ce résultat peut s'expliquer
par ce qui suit. Supposons qu'il existe dans la nature un processus qui
crée ou détruit la charge électrique. Le processus de création requiert un
travail W qui est regagné lorsque la charge est détruite, un peu comme
la création es particules virtuelles dans l’effet CASIMIR qui naissent à partir
du vide. Créons maintenant une charge q en un point de l'espace où le
potentiel a une intensité V1 et transportons cette charge en
un autre point de l'espace, où l'intensité du potentiel a une valeur V2,
où la charge est détruite. Le bilan énergétique de ce processus est égal à W+q(V1
-V2)-W. Ce processus ne conserve pas l'énergie et ne peut donc
pas exister dans la nature. Nous en concluons que la charge est conservée dans
les interactions qui sont invariantes par changement de jauge.
L'électrodynamique quantique et la Chromodynamique
Quantique sont des théories quantiques des champs, qui décrivent l'interaction
entre fermions par le couplage de ceux-ci avec un champ de longue portée. Elles
sont toutes les deux localement invariantes pour une transformation arbitraire
de jauge, c'est-à-dire qu'en tout point de l'espace la phase des champs de
fermion peut être choisie arbitrairement sans que les résultats physiques ne
dépendent pour autant de ce choix. Les théories incluant cette propriété
d'invariance sont également "renormalisables", c'est-à-dire que les
effets de cette interaction, telles les sections efficaces et la vie moyenne
des particules, ont des valeurs finies et peuvent être calculées à n'importe
quel ordre de la constante de couplage.
L'interaction faible agit entre les quarks et les leptons que l'on peut
considérer comme porteurs d'une charge faible. Étant donné la faiblesse
de cette interaction, ses effets ne sont mesurables que dans les processus pour
lesquels les interactions électromagnétique et forte ne sont pas permises par
les lois de conservation. Les interactions faibles observables impliquent donc
soit des neutrinos, qui sont électriquement neutres et ne portent pas de charge
de couleur, soit des quarks mais induisent alors un changement de couleur,
mécanisme interdit pour l'interaction forte. La décroissance b du neutron est l'exemple type de l'interaction
faible : n ® p+e-+.
Le diagramme de Feynman élémentaire pour l'interaction faible est
représenté dans la figure 5 et le diagramme de la décroissance b du neutron dans la figure 6.
Figure 5 : Diagramme de Feynman décrivant le couplage d'un fermion aux bosons intermédiaires, vecteurs de l'interaction faible. Puisque le boson W est électriquement chargé, les fermions f1 et f2 sont deux particules différentes.
Les vecteurs de l'interaction faible sont les mésons massifs W± et Z0 de masses respectivement égales à 81 et 94 GeV.
L'échange d'un boson W± a pour effet de changer la charge du lepton
impliqué dans l'interaction; ce processus est appelé réaction à courant chargé. Les processus donnant lieu à l'échange
d'un boson Z0 sont appelés réaction
à courant neutre.
Figure 6: Diagramme de Feynman de la désintégration du neutron par intégration faible.
L'intensité de l'interaction faible peut
être estimée à partir de la mesure de la vie moyenne d'une particule dans une
décroissance purement faible et la comparaison avec à la vie moyenne mesurée
dans une décroissance purement électromagnétique. La décroissance purement
hadronique de l'hypéron sigma () ne conserve pas l'étrangeté et est donc interdite pour
l'interaction forte. La valeur de la vie moyenne est égale à 10-10
secondes. La décroissance électromagnétique du partenaire neutre de l'hypéron
sigma () est elle aussi interdite pour l'interaction forte par la
conservation de l'isospin (l'hypéron sigma est un triplet d'isospin et
l'hypéron lambda un singlet d'isospin). La valeur de la vie moyenne est égale à
10-10 secondes. Le rapport des deux vies moyennes donne l'ordre de
grandeur du couplage faible, soit 10-5 fois plus faible que le couplage
de l'interaction électromagnétique. Le propagateur de l'interaction est.
Dans la limite des moments transférés petits par rapport à la masse des
bosons intermédiaires, l'amplitude est celle postulée par Fermi pour décrire la
décroissance b :, la valeur numérique étant obtenue à partir du taux de
décroissance expérimental.
En 1967, SALAM et WEINBERG ont suggéré que les interactions électromagnétique et faible ne
sont que deux aspects d'une même interaction, l'interaction électrofaible. A
suffisamment haute énergie ces deux interactions sont unifiées c'est-à-dire que
le couplage g des bosons intermédiaires aux leptons et aux quarks est
identique au couplage e des photons aux mêmes particules. En posant g
= e, la masse du boson W est prédite égale à 90 GeV, qui est la
valeur déterminée expérimentalement. Ceci pose le problème de l'invariance de
jauge qui pour être vérifiée doit impliquer des bosons de masse nulle. En fait
dans la théorie électrofaible, le photon et les trois bosons de masse
intermédiaire sont les conséquences observables d'un champ hypothétique à
quatre composante et de masse nulle. L'hypothétique boson de Higgs, au travers
du mécanisme de Higgs, mélange les deux composantes neutres du champ pour
donner naissance au photon et au Z° et donne une masse aux deux
composantes chargées pour donner naissance aux bosons W± et W-. les équations
de mélange sont les suivantes :
g = cosqW B + sinqWW°
Z° = -
sin qW B + cos qWW°
L'angle de mélange, appelé angle de Weinberg (qW) vaut environ 29°,
est un paramètre de la théorie électrofaible et lie le couplage g du
courant neutre de l'interaction faible et le couplage e du courant
neutre de l'interaction électromagnétique : e= g sinqW.
L'interaction forte agit entre les quarks
constituants qui constituent les hadrons. L'intensité du couplage peut être
estimée à partir de la probabilité de décroissance des baryons instables.
Prenons le cas de la résonance S°(1385) formée dans la réaction suivante :
K-+p ® S°(1385) ® L°+p°
De la largeur mesurée de la résonance, égale à 36 MeV, on déduit une
vie moyenne égale à 10-23sec. En comparant cette valeur avec la vie
moyenne dans la décroissance électromagnétique (les deux processus de
décroissance ont des bilans énergétiques semblables, 130 MeV comparé à
77 MeV) :
S°(1192) ® L° + g
et en faisant le rapport des deux vies moyennes on obtient que l'intensité
du couplage fort est égale à 100 fois l'intensité du couplage
électromagnétique, c'est-à-dire où gs est, par analogie avec la constante
de structure fine, la charge forte. Le médiateur de l'interaction est le
gluon, un boson de masse nulle comme le photon. La particularité de la
Chromodynamique Quantique, la théorie des champs de l'interaction forte, est
l'existence de six types de charge forte appelés couleurs et libellés rouge, bleu
et vert. Chaque quark peut être porteur de l'une des trois couleurs, les
anti-quarks étant porteurs de l'anti-couleur et le gluon est également porteur
d'une couleur et d'une anti-couleur. Cette dernière propriété implique que les
gluons interagissent entre eux, ce qui conduit à trois diagrammes élémentaires
pour l'interaction forte (fig. 7).
Figure 7 : Les diagrammes de base dans la théorie de la chromatographie quantique. En partant de la gauche : couplage du quark au gluon, du gluon sur un autre gluon et de 2 gluons entre eux.
Une
autre particularité de l'interaction forte, résultant de la valeur du couplage
voisin de l'unité, implique que le diagramme de la figure , c'est-à-dire
l'échange d'un seul gluon dans la diffusion de deux quarks, n'est pas le seul à
prendre en compte puisque les termes aux ordres as plus élevés (l'échange de
plusieurs gluons) deviennent toujours plus important.
Figure 8 : Diagramme d’une diffusion de quark avec échanges de charges de couleur
En fait, pour des collisions violentes, dans lesquelles le moment transféré
est important (où de façon équivalente les inter-distances sont petites), le
couplage est inférieur à 1 de sorte que l'échange d'un gluon unique est une
bonne approximation. Ce cas de figure constitue le régime perturbatif de QCD.
Cependant pour des moments transférés faibles (des inter-distances grandes) le
couplage devient plus grand que 1 et la théorie est incalculable car le nombre
de termes à prendre en compte est infini. Ce cas de figure constitue le régime
non-perturbatif.
Comme déjà mentionné précédemment, la
particularité de la théorie de la Chromodynamique Quantique, notamment par
rapport à l'électrodynamique quantique, réside dans le fait que le médiateur de
l'interaction est lui-même porteur de charges de couleur et donc que les gluons
interagissent entre eux. Tout comme les lignes de force de l'interaction
électromagnétique relient deux charges électriques (fig. 14), les quarks
sont liés entre eux par des lignes de force de l'interaction forte.
Figure 9 : Lignes de forces du champ électrique entre 2 charges électriques comparées aux lignes de force du champ de couleur. Pour le champ de couleur, le lignes se groupent en un tube ou corde du fait de l’interaction des gluons.
Cependant, du fait de l'interaction entre gluons, ces lignes de force sont
regroupés en forme de tube que l'on désigne par le terme de corde
(fig. 14). En tirant sur cette corde pour isoler par exemple un quark,
l'énergie stockée dans la corde augmentera jusqu'à un point où le système
trouvera énergétiquement plus économique de produire une nouvelle paire d'un
quark et d'un anti-quark (fig. 15 ) en cassant la corde.
Figure 10 : Tenter de libérer un quark en tirant sur la corde résulte en la cassure de cette corde et la formation d'une paire d'un quark et d'un anti-quark.
Le tableau suivant résume les
propriétés des trois interactions.
Interaction |
Electromagnétique |
Faible |
Forte |
|
|
|
|
Particule |
Photon |
bosons
intermédiaires |
Gluon |
quantum
de champ |
g |
W±, Z0
|
G |
Spin-parité |
1+ |
1-,
1+ |
1- |
Masse
(GeV/c²) |
0 |
80,91 |
0 |
Portée
(m) |
¥ |
10-18 |
10-15³ |
Source |
Charge
électrique |
Charge
faible |
charge
de couleur |
Couplage |
1/137 |
1.02
10-5 |
» 1 grande distance |
|
|
|
<1
courte distance |
Section
efficace (m²) |
10-33 |
10-44 |
10-30 |
Vie
moyenne (s) |
10-20 |
10-8 |
10-23 |
Tableau 1: Les trois interactions fondamentales d'intérêt pour la physique des particules élémentaires
Première étape, 1905, quand Einstein publia sa théorie de la
relativité restreinte qui unifie deux concepts clés : l’espace et le
temps. De cette théorie on peut retenir trois choses importantes:
·
L’espace temps dans lequel nous nous trouvons, est défini
mathématiquement comme un espace pseudo-euclidien à quatre dimensions (une de
temps et trois d’espace) muni de la
métrique de MINKOVSKI. Des quadrivecteurs décrivent un événement ;
l’énergie et le vecteur quantité de mouvement sont également réunis en un seul
objet mathématique (un autre quadrivecteur dont la norme est reliée à la masse
selon la formule E² = Eau repos + Erelativiste = m²c4
+p²c² ).
·
Rien de
matériel ne peut se déplacer plus vite que la lumière, seule la lumière ou
d'autres phénomènes sans masse intrinsèque peuvent l'atteindre et même la
dépasser, comme par exemple dans l’effet tunnel.
·
Il n'y a pas
de temps absolu (ce qui signifie que des horloges identiques aux mains
d'observateurs différents ne devraient pas forcement indiquer la même heure).
La relativité restreinte nous apprend donc que plus un objet se déplace
vite plus le temps s'écoule lentement pour lui (la limite de vitesse étant c la
vitesse de la lumière soit environ 300000 km/s). Ce phénomène n'est pas
subjectif mais bien réel et peut être vérifié par des expériences
simples : une personne embarquée à bord d’un avion de ligne peut mesurer
un très léger retard (mais retard quand même !) par rapport à une autre
personne restée au sol, pour peu qu’elles soient toutes deux munies d’horloges
extrêmement précises comme des horloges atomiques.
Ensuite, en 1915, Einstein compléta ses
théories en publiant cette fois la théorie générale de la relativité, théorie
phare de la science du XXe siècle. Mais en cette période de guerre,
on ne faisait guère attention à la science qui n’avait pas de rapport avec des
utilisations pratiques militaires. C’est pour cela qu’à la fin de la guerre
seulement, une expédition britannique est allée observer l’éclipse de 1919 et a
confirmé les prédictions de la relativité générale : l’espace-temps n’est
pas plat mais courbé par la matière et/ou l’énergie qui s’y trouvent comme le
montre la figure 11. Cette découverte d’Einstein a complètement transforme
notre vision de l’espace : nous ne pouvions plus penser que l’espace et le
temps pouvaient s’écouler indépendamment de ce qui se passait autour dans
l’univers, mais au contraire, ils devenaient des quantités dynamiques
interagissant avec ce les événements s’y déroulant.
Figure 11 : Espace-temps courbé par
un objet suffisamment massif (comme un trou noir)
La théorie de la relativité générale est
très complexe au niveau mathématique, (en tous cas beaucoup trop pour
moi !), je ne vais donc pas la présenter ici. Il lui manque cependant quelque
chose : elle prédit l’existence de singularités…et elle n’est plus applicable en ces
singularités ! En particulier,
elle ne peut pas expliquer ce qui se passe dans les discontinuités de l’espace
temps dont HAWKING et PENROSE ont prouvé l’existence si l’espace
temps est courbé comme on le pense aujourd’hui. De même, elle ne peut pas dire
comment l’Univers est né à partir du Big Bang.
Ainsi, la relativité générale n’est pas
une théorie complète. Elle nécessite un ingrédient supplémentaire pour
déterminer comment l’Univers est né, ce qui se passe quand la matière
s’effondre sous l’effet de sa gravité, ce qui se passe aux discontinuités de
l’espace temps, ce qui se passe au niveau subatomique, dans ce qui s’appelle
par exemple l’écime quantique…cet ingrédient semble être la mécanique
quantique. Pour unifier la gravitation aux autres interactions fondamentales il
est nécessaire de parvenir à décrire la gravitation dans le formalisme de la
physique quantique. La seule description théorique de la gravitation dont nous
disposons aujourd’hui est celle fournie par la relativité générale. Or la
relativité générale et la mécanique quantique ne font pas toujours bon ménage.
Sur de nombreux points fondamentaux, le monde de la relativité générale et
celui de la physique quantique ont une vision totalement divergente. Notamment
:
Relativité générale Mécanique
quantique
Théorie purement géométrique Théorie
"analytique"
Les lois physiques sont indépendantes de
l’observateur les
résultats des mesures dépendent de l’observateur
Théorie déterministe Théorie
non déterministe
Les interactions sont continues Les
interactions sont quantifiées (discontinues)
Gravité est décrite comme un champ
classique => un champ n’interagit pas avec lui-même. Gravité est décrite par des quanta nommés gravitons. Les
gravitons interagissent entre eux
Cela tient peut être du fait que la
relativité générale tente d’expliquer l’infiniment grand alors que la physique
quantique s’intéresse à l’infiniment petit. Les moyens mathématiques employés
par les physiciens pour atteindre ces objectifs sont radicalement différents.
Pour unifier la gravitation aux autres interactions fondamentales il est
nécessaire de parvenir à décrire la gravitation dans le formalisme de la
physique quantique. La seule description théorique de la gravitation dont nous
disposons aujourd’hui est celle fournie par la relativité générale. Or la
relativité générale et la mécanique quantique ne font pas toujours bon ménage.
Sur de nombreux points fondamentaux, le monde de la relativité générale et
celui de la physique quantique ont une vision totalement divergente. Cela tient
peut être au fait que la relativité générale tente d’expliquer l’infiniment
grand alors que la physique quantique s’intéresse à l’infiniment petit. Les
moyens mathématiques employés par les physiciens pour atteindre ces objectifs
sont radicalement différents. Cependant, quelle que soit l’échelle des
phénomènes décrits, il ne devrait exister qu’un modèle unique pour aborder
aussi bien l’infiniment petit que l’infiniment grand, théorie qui, à ce que
l’on pense aujourd’hui, devait exister au tout début de l’Univers, avant les
fatidiques 10-43 secondes au-dessous desquelles on ne sait plus rien
prédire.
Dans un cadre quantique, la gravitation
doit être transportée par des quanta associés au champ gravitationnel, de la
même manière que les ondes électromagnétiques sont associées aux photons . Ces
quanta ont été baptisés gravitons.
Il est possible de définir de façon purement théorique les principales
caractéristiques du graviton :
1.
une masse nulle car la portée de la gravitation est infinie.
2.
un spin égal à 2 car la gravitation est représentée par un tenseur (le
tenseur métrique) qui possède 5 degrés de liberté (un spin j peut prendre 2j+1
valeurs ce qui fait 5 dans le cas d’un spin 2)
3. l’interaction gravitationnelle étant très
faible (de manière théorique, tous les corps devraient s’attirer
mutuellement…cependant dans la pratique, quand nous marchons dans la rue par
exemple, nous ne sommes pas attirés physiquement par les autres
passants !), les interactions impliquant des gravitons deviennent
prépondérantes à des niveaux d’énergie très élevés (de l’ordre de 1019
GeV)
4. les gravitons étant des quanta d'énergie,
ils transportent de facto de
l'énergie. Or la gravitation est sensible à la masse et à l'énergie (il suffit
de penser aux trous noirs qui dévient et même attirent la lumière). Par conséquent,
les gravitons doivent interagir entre eux.
Quand on essaye de représenter la
gravitation - telle que proposée par la relativité générale - avec le
formalisme de la théorie quantique des champs, on se heurte immédiatement à une
difficulté majeure. Une des relations d’incertitude d’Heisenberg nous apprend
que l’incertitude sur la mesure de l’énergie est d’autant plus grande que la
durée de la mesure est courte. Ce qui peut être interprété différemment en
disant que l’énergie peut d’autant plus fluctuer que la durée d’observation est
courte. Ces fluctuations se rencontrent partout, même dans le vide absolu. Cela
implique que dans le vide total, sur des très courtes durées, la quantité
d’énergie présente n’est pas nulle et peut même être gigantesque. Ce phénomène
porte le nom de fluctuations
du vide. Il peut paraître paradoxal, voire aberrant et pourtant
récemment il a clairement été mis en évidence dans une expérience reproduisant l’effet Casimir, ou même dans ce que l’on appelle les particules virtuelles.
Les fluctuations de l’énergie dans le vide
se matérialisent sous forme de champ de matière ou de force. Ainsi, le vide
n’est pas vide du tout, mais rempli de particules et d’anti-particules qui se
créent spontanément et s’annihilent presque aussitôt. Quand l’amplitude des
fluctuations d’énergie atteint des valeurs pour lesquelles la gravitation
devient prépondérante (c'est-à-dire aux alentours de 1019 GeV),
l’énergie va pouvoir se "matérialiser" sous forme de gravitons. Or
selon la théorie de la relativité générale, l’interaction gravitationnelle
créée l’espace-temps. Il s’ensuit que la production spontanée de gravitons dans
le vide va modifier profondément la topologie de l’espace-temps localement au
point d’affecter la notion même de position et d’instant. Ainsi, à des échelles
de distance et de temps très courtes - typiquement l'échelle de Planck à savoir 10-43 s et 10-33 cm
- l’espace-temps est tellement "secoué" par les fluctuations
d’énergie qu’il n’est plus vraiment possible de parler d’espace et de temps.
Les fluctuations de l’énergie dans le vide ont donc pour effet de "faire
fluctuer" l’espace-temps.
Sans espace et sans temps « solide » sur
lequel la physique peut s’appuyer, toutes les théories physiques se dissolvent
dans le "néant".
Comme on peut l’imaginer cette situation
ne satisfait pas les physiciens. Pour y remédier, la physique théorique s’est
lancée dans plusieurs directions de recherche passionnantes mais également
incroyablement abstraites. Il faut dire qu’aux niveaux d’énergie auxquels ces
nouvelles théories s’attaquent, l’expérience ne peut être d’une grande aide.
Trois grands axes de recherche canalisent
aujourd’hui les efforts des physiciens :
Albert Einstein fut
le premier physicien à tenter d'élaborer une théorie unificatrice dans les années 1910. Ses travaux sur la
relativité lui faisant présumer l'existence d'une théorie commune pour les
forces électromagnétiques et gravitationnelles, il essaya en vain, durant les
trente dernières années de sa vie, de concevoir un modèle où forces et
particules seraient représentées uniquement par des champs, les particules
n'étant rien d'autre que des zones du champ où les valeurs d'intensité seraient
particulièrement élevées. Mais l'avènement de la théorie quantique et la
découverte de nouvelles particules sonnèrent l'échec d'Einstein, qui ne pouvait réussir
dans sa tâche en s'aidant uniquement des lois de la relativité et de la
physique classique.
Cette quête fut relancée dans les années
1960 sous l'impulsion des physiciens américains Steven Weinberg et
Sheldon Glashow, et du physicien pakistanais Abdus Salam. Ces trois chercheurs parvinrent à unifier l'interaction nucléaire faible
et l'interaction électromagnétique en faisant appel à des symétries internes,
symétries portant sur les propriétés intrinsèques des particules (charge, spin,
etc.) et non sur leurs positions spatio-temporelles. Selon cette théorie connue
sous le nom de théorie
électrofaible, les photons, responsables des interactions
électromagnétiques, appartiendraient à la même famille que les bosons
intermédiaires W et Z, qui gouvernent les interactions faibles.
En 1976, apparut le nom de supergravité. Elle se base sur la supersymétrie (1974) associant à chaque particule de matière (fermions: spin demi-entier), une particule support
de forces (bosons: spin entier) et réciproquement. La
supergravité combine une particule de masse nulle et de spin 2 (appelée graviton) à
d'autres particules de spins 3/2, 1, 1/2 et 0. Toutes ces particules peuvent
être considérées comme faisant partie d'une "superparticule" qui resterait
à définir…. et à en prouver l’existence !
Aujourd'hui, les scientifiques tentent de
combiner les quatre types d'interactions à l'aide de théories de supersymétrie
et de supergravité mais le problème s'avère très ardu, les physiciens ne
parvenant pas à englober l'interaction gravitationnelle dans leur théorie unificatrice. Pourtant, après
des décennies d'échecs, la théorie des cordes, puis la théorie des supercordes semble ouvrir de nouveaux horizons...
Nous pouvons résumer ceci par le schéma
suivant :
Interaction faible
Interaction électrofaible
Théorie
quantique des champs
Interaction
électromagnétique
Théorie des
cordes, des super cordes, …
Interaction forte
Gravitation
Comme nous l’avons déjà vu plusieurs fois,
les physiciens ont recensé quatre interactions fondamentales dans la nature.
Cependant, rien n’indique pourquoi il n’y en aurait que 4, et il peut en
exister plus sans que les moyens expérimentaux dont nous disposons à l’heure
actuelle nous permettent de les mettre en évidence. Nous en connaissons 4,
…mais pourquoi 4 et pas plus ? Nul ne peut répondre à cette question pour
le moment. Mais ce qui est quasi sur, est qu’à l’origine du temps, au fameux
moment du Big-Bang, toutes les interactions étaient rassemblées en une seule et
unique interaction, mais dans des conditions extrêmes de densité, de
température et de pression.
Augmenter l'énergie mise en jeu dans les interactions revient à se
rapprocher des conditions qui prévalaient lors du Big-Bang, à des temps
inférieurs au fameux temps de Plank
de 10-43s. Augmenter l'énergie est donc équivalent à remonter
le cours de l'histoire de l'univers. S'il existe effectivement une interaction
unique à très haute énergie, synthèse des interactions observées à notre niveau
d'énergie, alors cela signifie que cette interaction était celle qui existait
au moment du Big-Bang… et dans ce cas-là, on pourrait apporter des éléments de
réponse à une des questions les plus mystérieuses : "D’où vient
l’Univers que nous connaissons et qu’il y avait-il avant celui-ci ??".
Certains faits expérimentaux tendent à
laisser soupçonner l'existence d'une telle synthèse à très haute énergie.
Notamment, les expériences ont montré que les valeurs des constantes de
couplage des diverses interactions se modifient avec l'augmentation de
l'énergie et semblent, en première approximation, converger vers une valeur
unique (à l'exception de la gravitation, toutefois).
Figure 12 : L'unification des différentes forces en fonction de leur énergie.
Ainsi, l'on prédit qu'à des énergies de
l'ordre de 1016 GeV, les interactions électromagnétiques, faible et
forte ne formeraient qu'une seule et unique interaction. Le modèle théorique
permettant de décrire cette interaction s'appelle GUT pour Grand Unified Theory.
Cette interaction unifiée se combinerait
ensuite avec la gravitation à des niveaux d'énergie encore plus élevés de
l'ordre de 1019 GeV pour ne constituer qu'une seule interaction
universelle. Les physiciens disposent de plusieurs théories décrivant cette
"super-interaction". L'une d'entre-elle retient aujourd'hui toute
l'attention du monde de la physique des particules : la théorie des super-cordes à laquelle nous reviendrons plus loin.
L'interaction faible se manifeste
naturellement dans la nature dans deux phénomènes :
·
La désintégration béta,
·
La capture électronique.
Dans le cas de la désintégration béta, un
neutron se transforme spontanément en un proton en émettant un électron et une
particule non chargée nommée anti-neutrino
électronique.
La capture électronique est un phénomène
curieux qui consiste en l'absorption par un proton contenu dans un noyau atomique
d'un électron de cet atome. Le proton se transforme alors en neutron en
émettant un anti-neutrino électronique.
Dans le détail, on remarque que deux types
de particules interviennent : des hadrons (le proton et le neutron) et une
famille de particules dénommée leptons à
laquelle appartiennent l'électron et le neutrino. Nous avons vu, les hadrons
sont constitués de particules plus élémentaires : les quarks. Il n'en est rien
des leptons, du moins selon l'état actuel de nos connaissances. Les leptons
sont des particules véritablement élémentaires. En fait, ce n'est pas le hadron
qui interagit mais l'in des quarks contenus dans le hadron. Ainsi,
l'interaction faible est ressentie par les quarks d'une part, et les leptons
d'autre part.
Les observations expérimentales ont montré
que l'électron et l'anti-neutrino ainsi que le neutron et le proton jouent des
rôsles symétriques dans ces réactions. Il est possible de les permuter sans
modifier le phénomène :
Dit autrement, cette observation peut
s'énoncer comme suit : l'interaction faible est symétrique (ou invariante)
vis-à-vis des permutations entre anti-neutrinos et électrons. Donc si l'on
transforme globalement tous les électrons en anti-neutrinos et inversement,
l'interaction faible se comportera de la même manière. Nous tenons là l'amorce
d'une théorie de jauge. Cette remarque s'applique également au proton et au
neutron. Ces deux particules jouent en effet un rôle symétrique dans les
réactions faisant intervenir l'interaction faible.
Pour pouvoir introduire l'invariance de
l'interaction faible dans les équations, les physiciens ont dû inventer une
grandeur physique abstraite qui se prêtait mieux à des manipulations
mathématiques que les noms des particules. Cette grandeur abstraite est le spin
isotopique ou encore l’isospin faible noté I. Pour l’électron et le neutrino,
les valeurs de l’isospin sont respectivement +1/2 et -1/2. Ainsi, l’électron et
le neutrino électronique ne diffèrent que par la valeur de leur isospin pour
l’interaction faible. La symétrie globale évoquée plus haut peut alors
s’énoncer comme une invariance vis-à-vis de la valeur de l’isospin. Tout comme
dans le cas des quarks, il est possible de construire un espace abstrait pour
représenter l’état d’isospin faible d’une particule.
Ce que nous dit la symétrie
globale d’isospin c’est que l’on peut procéder à une rotation de 90° dans
l’espace d’isospin - ce qui a pour effet de permuter les électrons et les
neutrinos - sans pour autant affecter les phénomènes liés à l’interaction
faible :
Pour construire une théorie de jauge à
partir de cette symétrie globale, imposons à présent une symétrie locale
d’isospin, c'est-à-dire l’invariance de l’interaction faible pour des
changements d’isospin pour une seule ou un nombre limité de particules. Si
cette symétrie locale existait effectivement dans la nature, l’on pourrait
observer des réactions comme :
p + e-
---> n + e-
où l’on a transformé l’anti-neutrino en un
électron dans la seconde partie de la réaction. Or une telle réaction ne peut
être observée car elle viole la loi de conservation de la charge électrique
(lacharge totale est nulle dans le membre gauche de la réaction et négative
dans le membre droit). Notons au passage que cette remarque est importante car
elle montre que la symétrie locale d’isospin n'est pas rigoureusement exacte.
En effet l'interaction faible est invariante par symétrie d'isospin à la charge
électrique près ! Dit autrement, imposer une symétrie locale de l'isospin pour
l'interaction faible peut affecter les charges électriques, qui elles, relèvent
de l’interaction électromagnétique. Il apparaît donc une connexion entre
l’interaction faible et l’interaction électromagnétique.
Imposons la symétrie locale
d’isospin, même si celle-ci donne des résultats physiques en apparence
aberrants. Que se passe-t-il ? On constate l’apparition de quatre champs dans
les équations : deux champs neutres, un champ chargé positivement et un dernier
chargé négativement.
L’un de ces champs est constitué de quanta
neutres, de masse nulle et de spin égal à 1. Ces propriétés sont celles du
photon et le champ correspondant n’est donc rien d’autre que le champ électromagnétique. Les trois
autres champs sont spécifiques à l’interaction faible proprement dite. La
symétrie locale d’isospin a donc entraîné de
facto l’unification des interactions électromagnétique et faible. Selon ce
modèle, ces deux interactions seraient donc la manifestation d’une seule et
unique interaction : l’interaction
électrofaible.
Dans la première formulation de cette
théorie, les trois champs spécifiques à l’interaction faible ont des quanta de
masse également nulle ce qui n’était pas en accord avec les observations
expérimentales. En effet, des quanta de masse nulle impliquent une interaction
de portée infinie. Or, comme nous l’avons mentionné plus haut, l’interaction
faible est confinée à des distances très courtes ce qui nécessite
l’intervention de quanta de masse non nulle. En fait, en retravaillant la
théorie, les physiciens ont démontré que les quanta associés à ces trois champs
possédaient une masse. Nous verrons plus loin par quel mécanisme ces quanta
acquièrent cette masse.
Finalement la description complète de
l’interaction unifiée électrofaible fait intervenir quatre champs dont les
quanta sont :
·
Le photon de
charge nulle, de spin 1 et de masse nulle
·
Le Z0 de
charge nulle, de spin 1 et d’une masse approximative de 90 GeV
·
Le W+ de
charge positive, de spin 1 et de masse avoisinant les 80 GeV
·
Le W- de
charge négative, de spin 1 et dont la masse est identique à celle du W+
Ce résultat peut être obtenu de manière
intuitive à partir des constats établis précédemment :
-
L’invariance
d’isospin peut affecter la charge électrique ce qui implique l’existence de
quanta chargés (positifs et négatifs) c'est-à-dire les W+ et W-
-
La symétrie
locale d’isospin, pour être exacte, doit être compensée par l’interaction
électromagnétique (c’est en cela que les interactions faible et
électromagnétique sont unifiées) et donc impliquer l’intervention du champ
électromagnétique
L’existence du Z0 est moins «
triviale ». En fait, les observations tirées de la multitude d’expériences
réalisées ces dernières décennies ont indiqué l’existence d’un médiateur neutre
dans certaines interactions faibles que l’on appelle communément un courant neutre. Ce médiateur est le Z0.
L'interaction électrofaible, ne l'oublions
pas, est le résultat de l'imposition de la symétrie locale d'isospin. Comme
nous l'avons indiqué, le changement d'isospin revient à inverser (faire tourner
de 180°) l'isospin dans l'espace abstrait de l'isospin. L'ensemble des
rotations des spineurs 1/2 est un groupe
noté SU(2). Si la symétrie d'isospin était rigoureusement exacte,
l'interaction faible pourrait être décrite intégralement par ce groupe.
Cependant, pour que la symétrie soit parfaite, il faut introduire l'interaction
électromagnétique qui est elle même décrite par le groupe U(1). Le groupe des symétries de l'interaction électrofaible est
donc la combinaison de ces deux groupes et est notée SU(2) x U(1). Dans le détail, le groupe de symétrie est SU(2)L
x U(1), le L en indice signifie que les seules rotations permises sont
celles orientées vers la gauche (L pour Left en anglais). Ceci vient d'une
propriété très étrange des neutrinos nommée l'hélicité.
Il reste cependant deux questions
essentielles auxquelles il faut répondre :
1. Pourquoi à notre échelle d'énergie les
interactions faible et électromagnétiques paraissent distinctes ?
2. Pourquoi les Z0, W+ et W- ont-ils une
masse non nulle ?
La réponse à ces deux questions nous
oblige à faire un détour par ce que l’on appelle en physique le mécanisme de brisure spontanée
de symétrie.
Une brisure spontanée de symétrie est un
phénomène par lequel un système physique perd en degrés de symétrie. La rupture
spontanée de la symétrie joue un rôle très important dans beaucoup de domaines
différents de la physique. Comme nous l’avons vu, les équations de la physique
possèdent en général des solutions qui présentent une ou plusieurs symétries
internes. L'idée fondamentale réside dans le fait que certaines solutions de
ces équations peuvent casser ou briser cette symétrie. L’un des exemples les
plus connus d’un tel phénomène est la transition de phase du paramagnétisme au ferromagnétisme du fer.
Lorsque l’on chauffe un aimant, ses
pouvoirs magnétiques décroissent pour disparaître subitement lorsque la
température dépasse un seuil nommé température
de Curie. Inversement, si l’on refroidit ce même aimant, ses propriétés
magnétiques vont tout aussi subitement réapparaître lorsque la température
passe au dessous de la température de Curie.
Chaque atome individuel de fer possède un
moment magnétique propre c'est-à-dire qu’il se comporte un peu comme un aimant
ou un dipôle magnétique en langage physique. Pour des températures situées au-dessus
de la température de curie tous ces dipôles se dirigent dans des directions
aléatoires. Dans ce cas-ci le système et les équations qui le décrivent ont une
symétrie par rotation dans l’espace. En effet, en faisant tourner de façon
aléatoire le morceau de fer dans l'espace, les propriétés magnétiques de ce
dernier ne sont globalement pas altérées. Quand la température tombe au-dessous
de la température de curie, les interactions entre les dipôles magnétiques ont
pour effet de les aligner selon une direction unique (le morceau de fer devient
ce que l'on appelle dans le langage courant un aimant). Avant la transition de
phase le système était inchangé par n'importe quelle rotation dans trois
dimensions, tandis qu’après la transition de phase le système est inchangé
seulement par des rotations dans le plan perpendiculaire à la direction des
dipôles. La symétrie tridimensionnelle initiale a été spontanément brisée en
une symétrie bidimensionnelle
Il est important de noter que la direction
dans laquelle s'alignent les atomes de fer après la transition de phase est
totalement aléatoire. Il n'est pas
possible de connaître a priori cette
direction. C'est là une caractéristique majeure des phénomènes de brisure
spontanée de symétrie.
Les physiciens ont imaginé qu’un processus
similaire de brisure de symétrie pouvait expliquer la décomposition de
l’interaction électrofaible en deux interactions - l’interaction faible et
l’interaction électromagnétique - présentant un niveau de symétrie moins élevé.
transition de phase
SU(2) x U(1) [interaction électrofaible]
---> SU(2) [interaction faible classique] + U(1) [interaction
électromagnétique]
La transition de phase du paramagnétisme
au ferromagnétisme du fer s’explique relativement simplement à l’aide de
l’agitation thermodynamique des atomes de fer qui, baissant avec la
température, permet aux atomes de s’aligner spontanément au dessus d’une
certaine température. Dans le cas de l’interaction électrofaible, qu’est-ce qui
est à l’origine de la brisure de la symétrie ?
Supposons que le potentiel de
l’interaction électrofaible ait la forme suivante
Pourquoi cette forme et pas une autre ?
Parce que ce potentiel présente une propriété très intéressante. A haute
énergie (énergie supérieure ou égale à Es sur la figure), le potentiel possède
une symétrie cylindrique, c'est-à-dire qu’il reste inchangé après des rotations
selon l’axe V. En revanche, au dessous de l’énergie Es, la symétrie cylindrique
n’existe plus : plusieurs valeurs sont possibles pour le même niveau d’énergie
(on dit que le niveau d’énergie est dégénéré).
Le système peut alors tomber dans un ou l’autre des deux états avec la même
probabilité. Au moment où la symétrie est brisée, il n’est pas possible de
prédire lequel des deux états d’énergie le système va adopter. Nous nous
trouvons dans une situation très similaire à celle que nous avons décrite dans
le cas de la transition de phase paramagnétique à ferromagnétique du fer.
Il se trouve que le potentiel de l’interaction
électrofaible se comporte de façon semblable à celui illustré par cet exemple.
Au delà d’une certaine énergie (~ 100 GeV) le potentiel électrofaible possède
la symétrie SU(2)L x U(1). En deça, les états d’énergie sont dégénérés et ce
qui conduit briser spontanément la symétrie.
Pourquoi le potentiel électrofaible a-t-il
cette forme ? Ceci est du au fait que d’autres champs se superposent à ceux de
l’interaction électrofaible : les champs
de Higgs dont les quanta sont appelés bosons
de Higgs. Ces champs ne possèdent pas les mêmes symétries que ceux de
l’interaction électrofaible. A haute énergie, leur effet n’est pas décelable et
donc la symétrie de l’interaction faible est apparente. En revanche, à partir
d’un certain seuil, la forme du potentiel est affectée par les champs de Higgs
au point de provoquer la dégénérescence des états d’énergie, et du coup, ils
provoquent la brisure spontanée de la symétrie électrofaible.
La présence des bosons de Higgs induit un
autre phénomène d’une importance majeure : ils font anormalement baisser l’état
d’énergie du vide. Par conséquent, les bosons de l’interaction électrofaible (W+,
W- et Z0) ne se trouvent pas dans leur état fondamental
(on dit qu’ils ne sont pas sur leur "couche
de masse") et
acquièrent une masse ! En acquérant une masse, leur portée devient finie et
comme cette masse est très élevée (entre 80 et 90 GeV) cette portée est très courte.
Voilà, tout s’explique. Malheureusement,
malgré tous les efforts déployés jusqu'à ce jour, les physiciens n’ont toujours
pas mis en évidence les bosons de Higgs. Certains physiciens croient que ces
particules ne sont que des artifices mathématiques qui n’ont aucune réalité
physique. La prochaine grande étape de la physique des particules expérimentale
est donc la découverte des bosons de Higgs. Si cette quête reste infructueuse,
le modèle actuel de l’interaction électrofaible pourrait être remis en question.