MÉTHODES MATHÉMATIQUES DE LA PHYSIQUE. Xavier Bagnoud UNIVERSITE DE FRIBOURG (2010) PDF
MÉTHODES MATHÉMATIQUES DE LA PHYSIQUE. Xavier Bagnoud UNIVERSITE DE FRIBOURG (2010) PDF
MÉTHODES MATHÉMATIQUES DE LA PHYSIQUE. Xavier Bagnoud UNIVERSITE DE FRIBOURG (2010) PDF
DE LA PHYSIQUE
Xavier Bagnoud
UNIVERSITE DE FRIBOURG
(2010)
Avant-propos
Dans ce cours, on utilisera toujours la notation adoptée par la plupart des livres de
physique théorique.
2
Table des matières
1 Calcul tensoriel 1
1.1 Introduction : exemples de tenseurs en physique . . . . . . . . . . . . . . . 1
1.2 Rappels d’algèbre linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Définition des tenseurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Grandeurs tensorielles typiques . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Opérations sur les tenseurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4 Problème de Sturm-Liouville 39
4.1 Introduction : opérateurs et équations . . . . . . . . . . . . . . . . . . . . . 39
4.2 Opérateur et équation de Sturm-Liouville . . . . . . . . . . . . . . . . . . . 40
4.3 Problème de Sturm-Liouville singulier . . . . . . . . . . . . . . . . . . . . . 45
5 Transformées de Fourier 49
5.1 Introduction : paquet d’ondes . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.2 Transformée de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.3 Utilisation des transformées de Fourier . . . . . . . . . . . . . . . . . . . . 53
6 Distributions √ 57
6.1 Introduction : transformée de Fourier de 1/ 2π . . . . . . . . . . . . . . . 57
6.2 Distribution de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
6.3 Distributions tempérées . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
6.4 Triplet de Gelfand ou triade hilbertienne . . . . . . . . . . . . . . . . . . . 64
6.5 Espace des états et notation de Dirac . . . . . . . . . . . . . . . . . . . . 65
3
7 Fonctions de Green 69
7.1 Introduction : dérivées d’une fonction de Green . . . . . . . . . . . . . . . 69
7.2 Fonction de Green relative à l’opérateur
de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
7.3 Fonctions de Green relatives à ∇2 et à 2 . . . . . . . . . . . . . . . . . . . 73
7.3.1 Fonction de Green relative à l’opérateur de Laplace . . . . . . . . . 74
7.3.2 Problème de Dirichlet (Méthode des charges images) . . . . . . . . 75
7.3.3 Fonction de Green de l’équation de Helmholtz . . . . . . . . . . . . 77
7.3.4 Fonctions de Green relative à l’opérateur de d’Alembert . . . . . . . 80
9 Appendices i
A Convergence ponctuelle
et convergence en moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . i
B Une idée de l’intégrale de Lebesgue . . . . . . . . . . . . . . . . . . . . . . ii
C Phénomène de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
10 Annexe : exercices 1
4
Chapitre 1
Calcul tensoriel
où les dσk désignent les trois composantes du vecteur surface élémentaire sur laquelle
agissent les tensions. Les 9 composantes τjk forment une matrice 3 × 3 appelée tenseur
des tensions.
2) Dans le cadre de la mécanique du corps rigide, on montre que l’énergie cinétique de
rotation est donnée par l’expression
3
1 X
T = ωj Θjk ωk (1.2)
2 j,k=1
où la matrice (Θjk ) est appelée tenseur d’inertie et les ωj sont les composantes du
vecteur vitesse angulaire ω. En fait, T est une forme bilinéaire
1
T (ω, ω) = ω T Θ ω . (1.3)
2
3) La relativité restreinte est définie sur l’espace-temps muni de la forme bilinéaire
3
X 3
X
2 2 2 2 2 2 2 2 2 µ
S =c t −r =c t −x −y −z = x xµ = g µν xµ xν (1.4)
µ=0 µ,ν=0
où l’on a défini les composantes covariantes xµ , contravariantes xµ ainsi que celles du
tenseur métrique (g µν ) d’indices µ, ν = 0, 1, 2, 3
ct ct 1 0 0 0
x −x 0 −1 0 0
[xµ ] = [xµ ] = [g µν ] = .
y −y 0 0 −1 0
z −z 0 0 0 −1
1
Quelle est la signification mathématique de Θjk , des xµ , des xµ et des g µν ? Nous allons
répondre à ces questions en apportant une unité mathématique. Pour l’essentiel, on verra
que le physicien qui travaille en coordonnées définit un vecteur, un tenseur par les pro-
priétés de transformation de ses composantes lors d’un changement de base et non pas en
tant qu’élément d’une structure mathématique.
2
Exemples : Applications multilinéaires
a) Produit scalaire : IR3 × IR3 −→ IR
f1 ⊗ f2 : V1 × V2 −→ IR
(v1 , v2 ) 7−→ (f1 ⊗ f2 )(v1 , v2 ) = f1 (v1 )f2 (v2 ) (1.11)
Déf. 1.4 Soient V, W des espaces vectoriels sur IR. Un produit scalaire sur V est une
forme bilinéaire symétrique (· , ·) : V × V −→ IR dont la forme quadratique associée est
définie positive. Il satisfait donc les propriétés suivantes :
a) (α1 u1 + α2 u2 , v) = α1 (u1 , v) + α2 (u2 , v) αi ∈ IR
(u, α1 v1 + α2 v2 ) = α1 (u, v1 ) + α2 (u, v2 )
b) (u, v) = (v, u)
c) (u, u) ≥ 0 .
L’espace V muni du produit scalaire est appelé espace vectoriel euclidien. Une famille
de vecteurs {v1 , v2 , · · · , vn } est orthonormale si (vj , vk ) = δjk . Toute base peut être
orthonormalisée grâce au procédé de Gram-Schmidt. Enfin, on peut montrer (exercice)
que toute forme linéaire f sur V peut être représentée par un produit scalaire f (v) = (v, w)
où w ∈ V est uniquement déterminé par f .
Déf. 1.5 On appelle espace vectoriel dual V ∗ ou simplement dual de V , l’espace vec-
toriel formé de l’ensemble des formes linéaires sur V
n . o
V ∗ = f f : V −→ IR linéaire . (1.12)
Pour v ∈ V, α ∈ IR, on vérifie (exercice) que le dual V ∗ satisfait les propriétés d’un espace
vectoriel en définissant la structure linéaire
3
où l’on a défini les composantes de f avec un indice en bas
xj = f (ej ) . (1.16)
La représentation (1.15) de f ∈ V ∗ suggère de définir la base duale par les formes linéaires
qui font correspondre à tout vecteur v ses coordonnées xj .
Déf. 1.6 On appelle base duale {e1 , · · · , en } de V ∗ l’ensemble des formes ou fonction-
nelles coordonnées {ej (v) = xj , j = 1, ..., n} .
Alors, en vertu de la linéarité de la forme
à n ! n
X X
j j k
e (v) = e x ek = xk ej (ek )
k=1 k=1
A partir de ces définitions, on peut déduire toutes les propriétés de transformation des
vecteurs de base et des composantes des vecteurs de V et V ∗ . Pour le vecteur v ∈ V qui
reste le même dans la base {e1 , ..., en } ou dans la base {e01 , ..., e0n }, on obtient
n
X n
X n
X
v= xk ek = xk Aj k e0j = x0j e0j . (1.23)
k=1 k,j=1 j=1
2
Avec cette notation des indices décalés, il est possible d’introduire une écriture cohérente des com-
posantes et d’utiliser la position des indices pour définir la matrice inverse.
4
On en déduit les transformations directes et inverses des composantes du vecteur v
n
X
x0j = Aj k xk (1.24)
k=1
Xn
xj = Ak j x0k j = 1, ..., n . (1.25)
k=1
En raison de Déf. 1.6 de la base duale, tout changement de base dans V induit une
transformation dans V ∗ . Alors, avec ej (v) = xj , la relation (1.24) donne
n
X
e0j (v) = Aj k ek (v)
k=1
pour tout v ∈ V . D’où l’on tire les transformations directes et inverses de la base duale
n
X
e0j = Aj k ek (1.26)
k=1
Xn
ej = Ak j e0k j = 1, ..., n . (1.27)
k=1
Finalement, la forme linéaire f ∈ V ∗ qui reste la même lorsqu’elle est exprimée dans la
bases {e1 , ..., en } ou {e01 , ..., e0n }
n
X n
X n
X
f= xk ek = xk Aj k e0j = x0j e0j
k=1 j,k=1 j=1
5
1.3 Définition des tenseurs
Nous allons définir les tenseurs en partant des notions générales de l’algèbre linéaire
pour aboutir finalement aux concepts qu’utilisent les physiciens.
à !
p
Déf. 1.7 Un tenseur de type est une forme multilinéaire
q
t : V ∗ p × V q −→ IR .
Pour simplifier l’écriture, on se limitera à des formes bilinéaires sur V ∗ × V dont l’espace
vectoriel (vérification !) est donné par l’ensemble noté
n o
V ⊗ V ∗ = t/ t : V ∗ × V −→ IR . (1.31)
La généralisation à des formes multilinéaires est immédiate. Exprimée dans les bases {ej }
et {ej }, la forme t ∈ V ⊗ V ∗ fournit l’expression3
où les T j k sont appelées composantes mixtes du tenseur. Cette expression nous incite à
introduire la base de V ⊗ V ∗ en définissant la forme bilinéaire produit tensoriel4
où l’on a utilisé les notations (1.16) et (1.6) des composantes. Alors, l’expression (1.33)
prend la forme
t(f, u) = T j k (ej ⊗ ek )(f, u) (1.35)
valable pour tout f et tout u. On en déduit la représentation d’un tenseur t ∈ V ⊗ V ∗
sous forme de combinaison linéaire
t = T j k ej ⊗ ek . (1.36)
Cette expression nous amène à formuler la définition utilisée par le physicien. Dans ce cas
on parlera de tenseur d’ordre plutôt que de tenseur de type
3
Convention de sommation d’Einstein : sommation implicite sur les indices répétés dans un produit
n
X
aj bj ≡ aj bj . (1.32)
j=1
4
La forme ej (f ) = xj doit être vue comme un élément de l’espace bidual V ∗∗ i.e. l’espace des formes
linéaires sur V ∗ . Dans V ∗∗ , la forme ej fait correspondre au vecteur f ∈ V ∗ sa j-ème composante xj . On
montre que V est isomorphe à V ∗∗ .
6
Déf. 1.8 Pour toute matrice de passage (Ak n ) et d’inverse transposée (Ak n ), on définit :
S scalaire ou tenseur d’ordre 0 si
S0 = S (1.38)
V 0j = Aj k V k (1.39)
Vj0 = Aj k Vk (1.40)
T 0j k = Aj m Ak n T m n . (1.43)
yk = y j gjk . (1.46)
Cette opération est appelée abaissement d’indice. Comme det(gjk ) 6= 0, les composantes
y j sont déterminées par l’inversion5 du système d’équations linéaires (1.46). Ainsi, les y j
fixés de manière unique par les yk permettent de définir la matrice inverse g kj telle que
Enfin, si la base de V est orthonormale on a gjk = δjk et dans ce cas, les deux types de
composantes coı̈ncident.
5
Pour des vecteurs ej linéairement indépendants, on a det(ek , ej ) 6= 0.
7
1.4 Grandeurs tensorielles typiques
Nous énumérons ci-après quelques exemples de tenseurs.
a) Le produit scalaire en tant que forme bilinéaire est une scalaire. Cependant, les
composantes de cette forme bilinéaire représenten un tenseur d’ordre 2.
b) Les xj sont les composantes d’un tenseur contravariant d’ordre 1 puisque
j
x0 = A j k xk .
M 0j k = Aj m Ak n M m n .
u⊗v u⊗h f ⊗h .
(x, y) = x0 y 0 − x1 y 1 − x2 y 2 − x3 y 3 .
8
h) A l’aide du symbole7
+1
(jkl) permutation paire de (123)
jkl
² = −1 (jkl) permutation impaire de (123) (1.49)
0 au moins 2 indices égaux
n . o
et pour une disposition de lignes (1, 2, 3) de la matrice A ∈ O(3) = A AT A = I ,
on peut définir le déterminant det A = ²jkl A1 j A2 k A3 l . Pour une disposition de lignes
(r, s, t) quelconque on obtient ²rst det A = ²jkl Ar j As k At l . Mais comme (det A)2 = 1,
on peut écrire
²0rst = det A Ar j As k At l ²jkl . (1.50)
On voit donc que sous une transformation de O(3), ²jkl se transforme comme un
tenseur, au signe près. C’est un pseudotenseur. En algèbre linéaire, on parle de forme
multilinéaire alternée. Le produit vectoriel est un pseudotenseur qui s’écrit
pj = ²jkl xk yl j, k, l = 1, 2, 3 . (1.51)
En fait, les pj sont les trois composantes indépendantes d’un tenseur d’ordre 2
antisymétrique. De manière générale, on montre (exercice) que les 3 composantes
d’un tenseur antisymétrique Tjk peuvent s’écrire comme pseudovecteur
1 jkl
T̃ j = ² Tkl . (1.52)
2
t = T j k ej ⊗ ek , (1.53)
T jk l = Rjk l + S jk l . (1.54)
b) Multiplication
Le produit tensoriel de formes multilinéaires implique le produit des composantes
des tenseurs correspondants, comme par exemple
T jk l = Rj S k l . (1.55)
T 0jk l = Aj m Rm Ak n Al p S n p = Aj m Ak n Al p T mn p . (1.56)
9
c) Contraction d’indices
Cette opération permet de diminuer l’ordre d’un tenseur. Elle n’est définie que pour
des tenseurs mixtes. On a par exemple le vecteur
V j = T jk k (1.57)
qui est tiré de la contraction d’un tenseur mixte d’ordre 3 en effectuant une som-
mation sur k. La grandeur V j est bien un vecteur puisque
Tous les tenseurs introduits ci-dessus peuvent être des fonctions des coordonnées xj . Ce-
pendant les propriétés de transformation ont un caractère global i.e. la matrice de chan-
gement de base est indépendante des coordonnées xj . Dans le cadre de la géométrie
différentielle, la notion de tenseur apparaı̂t aussi. Les espaces vectoriels sont alors les es-
paces tangents Tp (M ), T ∗ p (M ) en chaque point P de la variété différentiable M et les
transformations de coordonnées sont données par le difféomorphisme
Les tenseurs définis dans ce cadre ne possèdent des propriétés de transformation linéaire
que localement dans le voisinage du point P .
10
Chapitre 2
ẍ + ω 2 x = 0 . (2.1)
Cette équation possède deux solutions indépendantes que sont sinus et cosinus. Si l’on
fixe les conditions initiales x(0) = x0 , ẋ(0) = v0 , la solution est donnée de manière unique
par la combinaison linéaire
Pour ces équations différentielles linéaires ordinaires, les choses sont simples puisque l’es-
pace des solutions est un espace vectoriel de dimension finie. Il n’en est plus de même pour
les équations différentielles linéaires aux dérivées partielles, comme par exemple l’équation
de la chaleur1
∂
T (r, t) = c∇2 T (r, t) (2.4)
∂t
où T est la température qui dépend de l’espace et du temps, c > 0 la conductivité
thermique et ∇2 = ∂x2 + ∂y2 + ∂z2 l’opérateur de Laplace. L’équation (2.4) est du premier
ordre en t. Il ne faut pas la confondre avec l’équation d’onde qui est du deuxième ordre
1
L’équation de la chaleur fut introduite en 1811 par J. Fourier pour décrire le phénomène de conduction
thermique. Elle peut être établie à partir du premier principe de la thermodynamique.
11
en t. On simplifie le problème en considérant la diffusion de la chaleur dans un chaı̂non
circulaire mince d’abscisse curviligne x = ϕ. On aboutit ainsi à l’équation
∂ ∂2
T (x, t) = c T (x, t) . (2.5)
∂t ∂x2
La géométrie circulaire du problème impose les conditions :
a) T (x, t) 2π-périodique pour tout t,
b) T (x, 0) = f (x) où f 2π-périodique est donnée.
Essayons de trouver une solution de cette équation en faisant l’hypothèse de séparation2
des variables
T (x, t) = u(x)v(t) . (2.6)
Alors l’équation (2.5) devient
v̇(t) u00 (x)
=c . (2.7)
v(t) u(x)
Cette égalité, valable pour tout x et pour tout t, implique que chacun des membres doit
être constant et l’on écrit
v̇(t) u00 (x)
= const = c . (2.8)
v(t) u(x)
En notant const = −cλ2 , on en tire les deux équations différentielles linéaires
et les conditions de périodicité u(0) = u(2π) et u0 (0) = u0 (2π) fournissent les équations
Ce système homogène possède une solution non triviale si la condition suivante est remplie
¯ ¯
¯ (1 − cos 2πλ) − sin 2πλ ¯
¯ ¯
¯ ¯=0. (2.12)
¯ sin 2πλ (1 − cos 2πλ) ¯
λ=n n ∈ ZZ .
12
D’où l’on tire les solutions possibles de l’équation de la chaleur
2 ct
Tn (x, t) = (An cos nx + Bn sin nx) e−n . (2.15)
La constante Cn a été absorbée dans les constantes An et Bn . Toutefois, la condition
initiale T (x, 0) = f (x) ne peut pas être satisfaite puisque
Tn (x, 0) = (An cos nx + Bn sin nx) 6= f (x)
pour une fonction f (x) 2π-périodique quelconque donnée. Comme l’équation (2.5) est
linéaire, on peut chercher une solution plus générale par combinaison linéaire
N
X 2 ct
TN (x, t) = A0 + (An cos nx + Bn sin nx) e−n . (2.16)
n=1
Si cette série converge vers f (x) pour t = 0, alors la condition initiale T (x, 0) = f (x) est
satisfaite et l’on peut écrire
∞
X
f (x) = A0 + (An cos nx + Bn sin nx) . (2.18)
n=1
13
Cet exemple, nous amène à poser plusieurs questions :
- Les fonctions cos nx, sin nx forment-elles une base ?
- Quelle est la structure de l’espace vectoriel des fonctions ?
- Comment définir la convergence dans cet espace de dimension infinie ?
Pour clore cette introduction, rappelons que notre démarche essentielle dans la discussion
P
des espace de Hilbert4 consistera à passer de la combinaison linéaire nk=1 αk vk bien définie
P
dans un espace vectoriel de dimension finie au développement en série ∞ k=0 αk vk .
Déf. 2.1 Un produit scalaire sur V est une application (., .) : V × V −→ Cl telle que
a) (u, v) = (v, u)∗
b) (u, αv + βw) = α(u, v) + β(u, w)
c) (u, u) > o ∀u 6= 0
où u, v, w ∈ V , α, β ∈ Cl et (., .)∗ désigne le conjugué complexe.
Déf. 2.2 Un espace préhilbertien G est un espace vectoriel muni d’un produit scalaire.
∞
X
(u, v) = ξj∗ ηj (2.23)
j=0
4
David Hilbert (1862-1943) est un mathématicien allemand précurseur de l’analyse fonctionnelle.
5
En mathématiques, le conjugué complexe est noté (u, v) et l’on définit (u, αv) = α (u, v).
14
n . o
c) C([a, b]) = f : [a, b] → Cl f continue
Z b
(f, g) = f (x)∗ g(x) dx (2.24)
a
Pour chacun des ensembles définis ci-dessus, il faut vérifier les propriétés d’un espace
vectoriel et du produit scalaire (exercice). On dit qu’une famille de vecteurs vα ∈ G est
orthonormale si
(vα , vβ ) = δαβ . (2.25)
Par exemple, on vérifie que les fonctions f (x) = x et g(x) = 1 − 2x2 dans C([0, 1]) sont
orthogonales.
Prop. 2.1 Dans un espace préhilbertien G, l’expression
q
kvk = (v, v) (2.26)
définit une norme sur G.
Preuve. On vérifie les propriétés d’une norme :
a) kvk ≥ 0 (kvk = 0 ⇒ v = 0)
b) kαvk = |α| kvk α ∈ Cl
c) ku + vk ≤ kuk + kvk inégalité du triangle 2
Un espace vectoriel muni d’une norme s’appelle espace vectoriel normé. Les éléments de
l’espace vectoriel G peuvent être constitués de suites de vecteurs v (n) pour lesquelles il
s’agit de savoir si leur limite se trouve dans l’espace. La norme, va nous permettre de
définir la convergence.
Déf. 2.3 Soit V espace vectoriel normé. On dit qu’une suite v (n) , n ∈ IN d’éléments de
V converge vers v ∈ V si
lim kv (n) − vk = 0 .
n→∞
(2.27)
(n)
L’implication limn→∞ ku(n) − uk = 0 ⇒ limn→∞ |ξk − ξk | = 0 pour tout k est
toujours vraie, par contre l’inverse ” ⇐ ” est faux en général : une somme infinie de
termes petits ne converge pas toujours, comme par exemple la série harmonique.
b) Dans C([a, b]), on définit la convergence
Z b
lim kf (n) − f k2 = lim |f (n) (x) − f (x)|2 dx = 0 .
n→∞ n→∞ a
15
Pour passer à l’espace de Hilbert, il faut compléter le préhilbertien, i.e. trouver un critère
qui nous assure que les limites des suites sont dans l’espace. Un critère bien connu repose
sur les suites de Cauchy.
Déf. 2.4 Une suite de Cauchy est une suite v (n) , n ∈ N d’éléments de G telle que
Toute suite convergente dans G est une suite de Cauchy puique pour v limite de la suite
v (n) et en utilisant l’inégalité du triangle, on obtient
Déf. 2.5 Un espace vectoriel normé est complet si toute suite de Cauchy est convergente.
Déf. 2.6 Un espace de Hilbert H est un espace vectoriel muni d’un produit scalaire
et complet par rapport à la norme induite par le produit scalaire8 . C’est un préhilbertien
complet.
6
Du cours d’Analyse I, on se souvient du ”critère de convergence général” : une suite de nombres
complexes est convergente si et seulement si c’est une suite de Cauchy. Dans le cas d’une suite de nombres
réels on parle du critère de Cauchy.
7
Pour montrer que dans un espace vectoriel normé V de dimension finie n toute suite de Cauchy est
convergente, on prend une suite de Cauchy u(k) et l’on s’astreint à trouver dans V la limite u de cette suite.
Pn (k)
La base orthonormée {e0 , e1 , · · · , en } de V permet d’écrire la combinaison linéaire u(k) = j=1 cj ej où
(k) (k)
cj = (ej , u(k) ) et de voir que la suite cj ∈ Cl est une suite de Cauchy, puisque
(k) (l)
|cj − cj |2 = |(ej , u(k) ) − (ej , u(l) )|2 = |(ej , u(k) − u(l) )|2 ≤ kej k2 ku(k) − u(l) k2 → 0 .
(k)
La suite de nombres complexes cj converge donc vers cj ∈ C. l Il reste à montrer que le vecteur u donné
Pn
par la combinaison linéaire u = j=1 cj ej ∈ V est la limite de la suite u(l) , l ∈ IN
n
X ³X
n n
X ´
(l) (l) (l)
ku − u(l) k2 = k (cj − cj )ej k2 = (cj − cj )ej , (ck − ck )ek
j=1 j=1 k=1
n
X n
X
(l) (l) (l)
= (cj − cj )∗ (ck − ck )(ej , ek ) = |cj − cj |2 → 0 .
j,k=1 j=1
8
Un espace vectoriel normé complet dont la norme n’est pas nécessairement induite par le produit
scalaire s’appelle espace de Banach.
16
2.3 Espaces de Hilbert l2 et L2(U )
En algèbre linéaire, on connaı̂t bien l’espace vectoriel Cl n muni du produit scalaire
n
X
(u, v) = ξj∗ ηj . (2.29)
j=0
Cet espace est complet puisque dans un espace vectoriel de dimension finie toute suite
de Cauchy est convergente. Deux autres espaces de Hilbert ont une importance toute
particulière en mécanique quantique. Il s’agit des espaces l2 et L2 (U ).
a) Espace l2
L’espace l2 défini par l’ensemble
. ∞
X
l2 = u = (ξ0 , ξ1 , · · ·) ξj ∈ C,
l |ξj |2 < ∞ (2.30)
j=0
(n)
montre que la suite ξk est de Cauchy et converge donc vers ξk dans C.
l
(n)
– La suite de Cauchy ξj , pour m, n > N et tout entier p donne
p
X (m) (n)
|ξj − ξj |2 ≤ ku(m) − u(n) k2 < ²2 .
j=0
(n)
De plus, comme ξj converge vers ξj ∈ C,
l on a aussi pour tout entier p
p
X p
X
(m) (m) (n)
|ξj − ξj |2 = lim |ξj − ξj |2 < ²2 .
n→∞
j=0 j=0
On en conclut :
P (m)
(1) ku(m) − uk2 = ∞ j=0 |ξj − ξj |2 < ∞, puisque une série à termes positifs est
convergente si et seulement si la suite des sommes partielles est bornée.
(2) u ∈ l2 , puisque pour ku − u(n) k < ∞ et u(n) ∈ l2 on a l’inégalité
17
b) Espace L2 (U )
L’espace L2 (U ) défini par l’ensemble
½ .Z ¾
L2 (U ) = f : U → Cl |f (x)|2 dx < ∞, U ⊂ IR (2.32)
U
18
Prop. 2.2 Tout vecteur v ∈ H et toute base de Hilbert {e0 , e1 , e2 , · · ·} satisfont l’inéga-
lité de Bessel ∞ X
|(ej , v)|2 ≤ kvk2 . (2.35)
j=0
Pn
Comme la suite des sommes partielles j=0 |cj |2 à termes positifs est bornée par kvk2 , la
P
série ∞ 2
j=0 |cj | converge. 2
Prop. 2.3 Pour tout v ∈ H et pour toute base de Hilbert {e0 , e1 , e2 , · · ·}, on peut écrire
le développement de Fourier généralisé
∞
X
v= cj ej (2.36)
j=0
P
L’inégalité de Bessel (2.35) nous assure que la série ∞ 2
j=0 |cj | converge, ce qui im-
Pn P n P m
plique j=m+1 |cj |2 = j=0 |cj |2 − j=0 |cj |2 → 0. Ainsi, les v (n) forment une suite
de Cauchy qui converge donc dans H complet.
– La limite est égale a v !
P
On définit u = v − ∞ k=0 ck ek . Alors
n
X n
X
(ej , u) = (ej , v) − n→∞
lim (ej , ck ek ) = cj − n→∞
lim ck δjk = cj − cj = 0 .
k=0 k=0
L’égalité (2.36) représente en fait une convergence en moyenne de la série vers v. Pour ce
qui concerne la physique théorique, ce résultat de l’analyse hilbertienne est l’un des plus
importants. D’autres en découlent. Nous donnons ci-après des formulations équivalentes
du concept de base de Hilbert.
19
Th. 2.2 (Critères pour une base de Hilbert)
Soient en , n ∈ IN une famille de vecteurs orthonormés d’un espace de Hilbert H séparable
et les vecteurs v, u ∈ H.
Alors les propriétés suivantes sont équivalentes :
a) {e0 , e1 , ...} base de Hilbert
P∞
b) v = j=0 (ej , v)ej développement de Fourier
P∞
c) (u, v) = j=0 (u, ej )(ej , v) relation de fermeture
2 P∞ 2
d) kvk = j=0 |(ej , v)| relation de Parseval
e) Le sous-espace vectoriel engendré par {e0 , e1 , ...} est dense dans H
Preuve. La preuve de ces équivalences est laissée en exercice. On montre les implications
suivantes : a) ⇒ b) ⇒ c) ⇒ d) ⇒ a) puis b) ⇒ e) ⇒ a). 2
Les égalités ci-dessus doivent être comprises dans le sens de la convergence en moyenne.
Exemples : Bases de Hilbert
a) l2
P
produit scalaire : (u, v) = ∞ ∗
j=0 ξj ηj
base : e0 = (1, 0, · · ·), e1 = (0, 1, · · ·), · · ·
b) L2 (IR) R
produit scalaire : q (f, g) = IR f (x)∗ g(x) dx
1 2
base : en (x) = 1/ (π) 2 2n n! e−x /2 Hn (x) n = 0, 1, 2, · · ·
Les Hn (x), polynômes d’Hermite de degré n, sont donnés par la formule
2 dn −x2
Hn (x) = (−1)n ex e (2.37)
dxn
c) L2 ([−1, 1]) R +1 ∗
produit scalaire
q
: (f, g) = −1 f (x) g(x) dx
base : el (x) = l + 12 Pl (x) l = 0, 1, 2, · · ·
Les Pl (x), polynômes de Legendre de degré l, sont donnés par la formule
1 dl 2
Pl (x) = l l
(x − 1)l (2.38)
2 l! dx
d) L2 ([0, ∞]) R
produit scalaire : (f, g) = 0∞ f (x)∗ g(x) dx
base : en (x) = e−x/2 Ln (x) n = 0, 1, 2, · · ·
Les Ln (x), polynômes de Laguerre de degré n, sont donnés par la formule
1 x dn n −x
Ln (x) = e (x e ) (2.39)
n! dxn
e) L2 ([0, 2π]) R
produit scalaire : (f, g) = 02π f (x)∗ g(x) dx
base : ek (x) = √12π eikx k ∈ ZZ
Cette base est complexe et donne lieu aux séries de Fourier. On peut aussi définir
la base réelle pour n ∈ IN+
1 1 1
en (x) = √ sin nx, e0 (x) = √ , e−n (x) = √ cos nx (2.40)
π 2π π
20
n o
Il est clair que les vecteurs e0 = (1, 0, · · ·), e1 = (0, 1, · · ·), · · · forment une base de l2 . Il
reste à montrer que les polynômes définis ci-dessus ainsi que les séries de Fourier forment
des bases de Hilbert. On le fera dans les deux sections qui suivent en apprenant aussi à
construire ces polynômes et les séries de Fourier.
– Finalement
h µZ ¶1 i
2
kf − hn k ≤ kf − gk + kg − hn k ≤ ² 1 + r(x) dx .
U
21
Exemples : Polynômes orthogonaux
A partir de la suite {1, x, x2 , · · ·} et à l’aide du procédé d’orthogonalisation de Gram-
Schmidt (2.42), on peut, comme exercice, construire explicitement les polynômes de
chaque espèce à l’ordre n = 0, 1, 2, · · · et comparer les résultats aux formules (2.37),
(2.38) et (2.39). On utilise évidemment la norme
Z
kun k2 = (un , un )r = |un (x)|2 r(x)dx
U
dont la valeur est fixée par convention. Différentes normalisations sont possibles. Ici nous
utiliserons celle que l’on rencontre le plus couramment dans les livres de physique.
2
a) Polynômes d’Hermite (2.37) : U = IR, r(x) = e−x
Z +∞ √
2
ϕn (x) ∼ Hn (x) n = 0, 1, 2, · · · e−x Hm (x)Hn (x) dx = π2n n!δmn (2.44)
−∞
et par conséquent
u0 1
ϕ0 = =√ . (2.46)
ku0 k 2
Par Gram-Schmidt, le polynôme suivant s’écrit
1 Z +1
u1 = x − (x, ϕ0 )ϕ0 = x − xdx = x .
2 −1
Le calcul de la norme donne
Z +1
2
ku1 k2 = x2 dx =
−1 3
et par conséquent
u1 x
ϕ1 = =q . (2.47)
ku1 k 2/3
De même, le polynôme de degré n = 2, s’écrit
u2 = x2 − (x2 , ϕ0 )ϕ0 − (x2 , ϕ1 )ϕ1
et donne après normalisation
u2 3x2 − 1
ϕ2 = = q . (2.48)
ku2 k 2 2/5
On procède ainsi de suite pour les ordres supérieurs. Les polynômes de Legendre
correspondant à la normalisation (2.45) sont
1 1
P0 = 1 P1 = x P2 = (3x2 − 1) P3 = (5x3 − 3x) . (2.49)
2 2
22
c) Polynômes de Laguerre (2.39) : U = IR+ , r(x) = e−x
Z ∞
ϕn (x) = Ln (x) n = 0, 1, 2, · · · dx Lm (x)Ln (x) e−x = δmn (2.50)
0
Attention, la convergence des séries définies à l’aide de ces polynômes n’a lieu qu’en
moyenne i.e. toute fonction de L2 (U, r) ne peut être approchée qu’en moyenne par la série.
On verra plus loin comment on peut aussi trouver ces polynômes en tant que fonctions
propres d’opérateurs linéaires appelés opérateurs de Sturm-Liouville.
La convergence est uniforme i.e. indépendante de x sur ] − π, 0[ et ]0, π[, mais pas
sur tout l’intervalle [−π, π]. Le calcul numérique illustré dans l’appendice C montre
la convergence au voisinage des points −π, 0, π, c’est le phénomène de Gibbs !
11
Convergence des séries de Fourier des fonctions périodiques ou monotones continues par morceaux.
- Pour f : [x0 , x0 + 2π] −→ Cl continûment dérivable et périodique i.e. telle que f (x) = f (x + 2π), la série
de Fourier converge uniformément vers f (x).
- Pour f : [x0 , x0 + 2π] −→ IR bornée, monotone par morceaux, la série de Fourier converge pour tout x :
a) vers f (x) si f continue en x ∈]x0 , x0 + 2π[
b) vers 12 [f (x+ ) + f (x− )] si f discontinue en x ∈]x0 , x0 + 2π[
c) vers 21 [f (x+ −
0 ) + f ((x0 + 2π) )] si x = x0 ou x = x0 + 2π .
23
La proposition suivante va nous permettre de montrer la convergence dans L2 (U ) et
apporter ainsi un résultat plus utile au physicien.
Preuve. On suit la même démarche que celle employée pour les polynômes orthogonaux.
α) Ces fonctions forment une base de Hilbert. En effet, soit f ∈ L2 ([x0 , x0 + 2π]).
– En théorie de l’intégration, on montre qu’il existe g : [x0 , x0 +2π] −→ Cl continûment
différentiable et périodique telle que kf − gk < ²/2 .
P
– Par Prop. 2.5, il existe pN (x) = N k=−N ck e
ikx
tel que sup[x0 ,x0 +2π] |g(x)−pN (x)| < δ .
Alors, on peut écrire
Z x0 +2π
kg − pN k2 = |g(x) − pN (x)|2 dx ≤ 2πδ 2 .
x0
√
– Finalement, si l’on choisit 2πδ = ²/2, on obtient
kf − pN k ≤ kf − gk + kg − pN k ≤ ²/2 + ²/2 = ² .
12
Ces identités trigonométriques se retrouvent dans la note de bas de page3 .
24
L’essentiel concernant les séries de Fourier a été dit. Dans ce qui suit, nous donnons
une formulation des séries de Fourier pour d’autres intervalles de définition des fonctions.
Le passage de l’intervalle [x0 , x0 + 2π] de Prop. 2.6 au nouvel intervalle [a, b] se fait par
un simple changement de variable x0 = αx où α est fixé par les conditions aux bornes
x0 (a) = x0 et x0 (b) = x0 + 2π.
Preuve. La preuve découle de Prop. 2.6. Cependant, il faudrait encore montrer que cos nx
et sin nx n ∈ IN forment chacun une base de Hilbert. Pour cos nx, on prend une fonction
ϕ ∈ RL2 ([0, π]) et on la prolonge
R +π
en une fonction paire
R +π
ϕ̃(−x) = ϕ̃(x) sur [−π, π]. Puis,
de 2 0π ϕ̃(x) cos nx dx = −π ϕ̃(x) cos nx dx = 0 et −π ϕ̃(x) sin nx dx = 0, on déduit que
ϕ̃ = 0 presque partout. Pour sin nx, on prolonge ϕ ∈ L2 ([0, π]) en une fonction impaire.
2
En introduisant la nouvelle variable x ∈ [0, π] des fonctions de L2 ([0, π]), on a
a) Série de Fourier complexe
∞
X 1Zπ
f (x) = ck ei2kx ck = f (x)e−i2kx dx k ∈ ZZ (2.62)
k=−∞ π 0
a0 X ∞
1Zπ
f (x) = + an cos nx an = cos nxf (x) dx n ≥ 0 (2.64)
2 n=1 π 0
25
Prop. 2.8 Chacune des familles de fonctions suivantes :
1 2π
a) √ eik( b−a )x , k ∈ ZZ (2.66)
b−a
s s
1 2 h 2π i 2 h 2π i
b) √ , cos n( )x , sin n( )x , n ∈ IN+ (2.67)
b−a b−a b−a b−a b−a
s
1 2 h π i
c) √ , cos n( )(x − a) , n ∈ IN+ (2.68)
b−a b−a b−a
s
2 h π i
d) sin n( )(x − a) , n ∈ IN+ (2.69)
b−a b−a
Preuve. La preuve découle de Prop. 2.6. La formulation des séries de Fourier correspon-
dantes est laissée en exercice. 2
(−1)k
c0 = 0 , ck = i k 6= 0 (2.71)
πk
ainsi que la série de Fourier
∞
(−1)k iπkx
X
f (x) = i e k 6= 0 . (2.72)
k=−∞ πk
26
2.7 Produit tensoriel de deux espaces de Hilbert
Le produit tensoriel d’espaces de Hilbert permet de préciser le cadre mathématique
naturel de la mécanique quantique des systèmes de particules. On définira le produit ten-
soriel de deux espaces de Hilbert. La généralisation à plus de deux espaces est immédiate.
Déf. 2.8 Pour ϕ1 ∈ H1 et ϕ2 ∈ H2 et à l’aide des produits scalaires dans chaque espace,
on définit la forme bilinéaire appelée produit tensoriel
ϕ1 ⊗ ϕ2 : H1 × H2 −→ Cl
u, v 7−→ (ϕ1 ⊗ ϕ2 )(u, v) = (ϕ1 , u) (ϕ2 , u) . (2.74)
L’ensemble des combinaisons linéaires de telles formes constitue un espace vectoriel noté
H1 ⊗ H2 sur lequel on définit le produit scalaire
(ϕ1 ⊗ ϕ2 , ψ1 ⊗ ψ2 ) = (ϕ1 , ψ1 ) (ϕ2 , ψ2 ) . (2.75)
On vérifie que les propriétés du produit scalaire sont satisfaites.
Prop. 2.9 Le complété de H1 ⊗H2 par rapport au produit scalaire est un espace de Hilbert
appelé espace produit tensoriel de H1 et H2 .
Prop. 2.10 Si {ej } et {fk } sont des bases orthonormales de H1 et H2 , alors l’ensemble
{ej ⊗ fk } est une base orthonormale de H1 ⊗ H2 .
Tout vecteur ϕ ∈ H1 ⊗ H2 peut être développé dans la base produit tensoriel
∞
X
ϕ= cjk ej ⊗ fk cjk = (ej ⊗ fk , ϕ) . (2.76)
j,k=0
27
b) Les fonctions f, g de L2 (U ) donnent le produit scalaire
Z Z
2
(f ⊗ g , f ⊗ g) = (f, f )(g, g) = |f (x)| dx |g(y)|2 dy
U U
Z
∗
= [f (x)g(y)] f (x)g(y)dxdy.
U ×U
On en déduit que le produit tensoriel correspond au produit des valeurs des fonctions
Cette propriété justifie l’Ansatz de séparation des variables que l’on utilise pour trou-
ver la solution des équations différentielles aux dérivées partielles de la mécanique
quantique.
c) Cl 2 ⊗ Cl 2 ' Cl 4
C’est l’espace de Hilbert d’un système de deux spins 1/2.
d) L2 (IR3 ) ⊗ Cl 2 .
C’est l’espace de Hilbert de l’électron avec spin.
28
Chapitre 3
Ax = b , (3.2)
29
Dans les deux cas, l’opérateur A possède la représentation
n
X n
X
Ax = λk ξk ek = λk (ek , x)ek . (3.7)
k=1 k=1
30
De manière générale, on désignera par D(T ) ⊂ H le domaine de définition d’un
opérateur T et par R(T ) ⊂ H le domaine des valeurs.
Rx
b) T : L2 ([a, b]) −→ L2 ([a, b]) linéaire. L’opérateur (T u)(x) = a u(t) dt est borné
Z b Z b¯Z x ¯2 Z b¯ ¯2
2 2 ¯ ¯ ¯ ¯
kT uk = |(T u)(x)| dx = ¯ u(t) dt¯ dx = ¯(1, u)x ¯ dx
a a a a
Z bhZ x Z x i Z bhZ b Z b i
2 0 2 2 0
≤ 1 dt |u(t)| dt dx ≤ 1 dt |u(t)|2 dt dx
a a a a a a
= (b − a)2 kuk2 .
Dans les deux cas, les bornes supérieures sont données par l’inégalité de Cauchy-Schwartz.
Remarques :
a) La plupart des opérateurs que l’on rencontre en physique ne sont pas bornés.
L’opérateur de dérivation défini par (T u)(x) = u0 (x) u ∈ L2 ([0, 1]) est linéaire
non borné. En effet, avec u(n) = xn → 0 lorsque n → ∞ on a
Z 1 Z 1
(n) 2 0(n) 2 n2
kT u k = |u (x)| dx = |nxn−1 |2 dx = →
/ 0.
0 0 2n − 1
b) L’inverse d’un opérateur borné n’est en général pas borné. Par exemple l’opérateur
intégral qui est borné a pour inverse l’opérateur de dérivation qui n’est pas borné.
1
Opérateurs bornés et opérateurs continus.
Soit T : H −→ H un opérateur linéaire. Les conditions suivantes sont équivalentes :
a) T est continu en un point u0 de H
b) T est uniformément continu sur H
c) T est borné
Pour la preuve on montre c) ⇒ b) ⇒ a) ⇒ c)
c) ⇒ b) : T borné =⇒ ∃ c > 0 tel que kT uk ≤ ckuk, alors kT u − T vk = kT (u − v)k ≤ cku − vk → 0.
b) ⇒ a) : clair
a) ⇒ c) : contraposition, T non borné ! alors ∃u(n) ∈ H tel que kT u(n) k > nku(n) k
posons v (n) = a + n1 u(n) /ku(n) k qui donne kv (n) − ak → 0 lorsque n → ∞
d’où kT v (n) − T ak = kT (v (n) − a)k = n1 kT u(n) k/ku(n) k > 1
i.e. pour v (n) → a, T v (n) → / T a (T pas continu en a !) .
31
La théorie des opérateurs linéaires sur un espace de Hilbert H est délicate. Toutefois,
si l’opérateur T est borné, on peut lui donner une représentation matricielle comme on le
fait en algèbre linéaire. En effet, l’espace de Hilbert séparable H possède une base dénom-
brable {e0 , e1 , · · ·} sur laquelle, pour tout u ∈ H et αj = (ej , u), on a le développement
∞
X
u= αj ej (3.16)
j=0
Pn
Cette égalité est équivalente à ku − j=0 αj ej k → 0 pour n → ∞ et permet de voir que
n
X n
X n
X
kT u − αj T ej k = kT (u − αj ej )k ≤ cku − αj ej k → 0 pour n → ∞ .
j=0 j=0 j=0
P∞
d’où l’on tire l’expression (ej , T u) = k=0 αk (ej , T ek ) où les nombres complexes notés
s’appellent les éléments de matrice de T par rapport à la base {e0 , e1 , · · ·}. Le passage,
à l’aide de la relation de fermeture, à une autre base orthonormale {f0 , f1 , · · ·} donne
∞
X ∞
X
Tejk = (fj , T fk ) = (fj , en )(en , T em )(em , fk ) = (fj , en )Tmn (em , fk ) . (3.19)
m,n=0 m,n=0
Les (fj , en ) sont les éléments de matrice d’un opérateur unitaire. Si les fj sont les vecteurs
propres de Te , alors les (fj , en ) diagonalisent la matrice (Tmn ). Dans le cas où T n’est pas
borné, les difficultés surgissent. Si les ej n’appartiennent pas à D(T ) ⊂ H, alors la matrice
(Tjk ) n’existe pas. Toutefois, si T défini sur tout H possède une représentation matricielle,
alors il est borné.
Une analyse plus fine des propriétés des opérateurs linéaires sur H peut être donnée
grâce au théorème de Riesz qui permet de représenter les fonctionnelles linéaires continues
par un produit scalaire.
32
Pour montrer l’existence, on considère Φ linéaire et continue sur la base {e0 , e1 , · · ·}
³ n
X ´ n
X n ³
X ´
!
Φ(u) = Φ n→∞
lim (ej , u)ej = n→∞
lim (ej , u)Φ(ej ) = n→∞
lim Φ(ej )∗ ej , u = (h, u) .
j=0 j=0 j=0
P
La vérification de la dernière égalité, i.e. que h = limn→∞ nj=0 Φ(ej )∗ ej converge est
P P
laissée en exercice. On montre d’abord que ∞ j=0 cj ej converge si et seulement si ∞
j=0 |cj |
2
P∞
converge, puis que j=0 |Φ(ej )|2 < ∞ . 2
A l’aide du Th. 3.1, on peut introduire l’adjoint d’un opérateur linéaire borné T . En effet,
pour u ∈ H, on définit sur H la fonctionnelle linéaire
qui est bornée puisque |ΦTu (v)| = |(u, T v)| ≤ kukkT vk ≤ ckukkvk. Alors, d’après le
théorème de Riesz, il existe h ∈ H unique tel que
La comparaison de cette expression avec (3.21) donne (h, v) = (u, T v). En notant le
vecteur h = T † u, on définit donc un nouvel opérateur appelé adjoint de T .
Déf. 3.2 L’adjoint de T est l’opérateur T † : H −→ H défini par la relation
(T † u, v) = (u, T v) u, v ∈ H . (3.22)
T† = T (3.23)
Déf. 3.4 Un opérateur unitaire U est un opérateur linéaire de H dans H tel que
(U v, U w) = (v, w) v, w ∈ H . (3.24)
Un opérateur unitaire U est borné, son adjoint existe et est égal à l’inverse U † = U −1 . Si
l’opérateur T n’est pas borné, l’adjoint est plus difficile à définir. On ne peut plus utiliser
le théorème de Riesz. Cependant si T est défini sur un domaine D(T ) dense dans H, on
peut montrer qu’il existe un opérateur adjoint T † : D(T † ) −→ H défini sur le domaine
n . o
D(T † ) = u ∈ H (u, T v) = (h, v), h ∈ H, v ∈ D(T ) .
33
Exemples : Opérateurs autoadjoints
a) Opérateur de type Hilbert-Schmidt sur L2 (U )
Z Z
†
(T f )(x) = K(x, y)f (y) dy (T f )(x) = K(y, x)∗ f (y) dy (3.26)
U U
Une analyse semblable peut être faite pour les opérateurs linéaires T : D(T ) → H où
D(T ) ⊂ H. Toutefois dans ce cas, on devra en plus tenir compte de la notion d’opérateur
borné et non-borné. Pour v donné et λ ∈ Cl on considère l’équation
(T − λI)u = v . (3.29)
Quels sont les λ ∈ Cl et les u ∈ D(T ) qui satisfont cette équation ? Pour un λ fixé,
l’opérateur (T − λI) peut avoir un inverse ou pas. Si l’inverse existe, il peut être borné
ou pas. En fonction de ces trois possibilités, on définit :
a) Ensemble résolvant de T
½ . ¾
−1
ρ(T ) = λ ∈ Cl (T − λI) existe, borné (3.30)
dans ce cas on dit que λ est une valeur régulière de T . Les valeurs de λ qui ne
sont pas régulières forment le spectre σ(T ) qui est le complément de ρ(T ) dans Cl
et se partage en deux ensembles.
34
b) Spectre ponctuel de T
½ . ¾
−1
σp (T ) = λ ∈ Cl (T − λI) n’existe pas
(3.31)
c) Spectre continu de T
½ . ¾
σc (T ) = λ ∈ Cl (T − λI)−1 existe, non-borné (3.32)
Dans les ensembles ci-dessus, le domaine des valeurs R(T − λI) est dense dans H. En
toute généralité, on devrait encore distinguer le spectre résiduel σr (T ) pour le cas où
l’inverse (T − λI)−1 existe mais sur un domaine R(T − λI) qui n’est pas dense dans H.
Cependant, on peut montrer que pour des opérateurs autoadjoints, le spectre résiduel est
vide. Avec cette troisième partie du spectre, nous épuisons les possibilités de classifier les
valeurs λ ∈ C.
l Les quatre ensembles ainsi définis sont mutuellement disjoints et couvrent
tout le plan complexe. D’ores et déjà, on peut tirer des renseignements utiles sur l’inverse
de T . Par exemple, si la valeur λ = 0 n’appartient pas au spectre σ(T ), il s’ensuit que
T −1 existe et est borné. Inversément, si λ = 0 est dans le spectre ponctuel, il s’ensuit
que T −1 n’existe pas. Le spectre ponctuel est le plus important. Sa détermination est
essentiellement un problème algébrique. Par contre, la détermination du spectre continu
est un problème souvent plus compliqué relevant de questions topologiques.
Prop. 3.1 Le spectre σ(T ) d’un opérateur autoadjoint T est réel.
Preuve. Pour le spectre ponctuel, on a T u = λu, u 6= 0. De plus, T symétrique donne
(u, T u) = (T u, u) = (u, T u)∗ ∈ IR et donc T u = λu implique λ = (u, T u)/kuk2 réel.
Pour le reste du spectre, on devrait encore montrer que λ ∈ / IR entraı̂ne λ ∈ ρ(T ) qui
par conséquent contient tous les λ imaginaires. Le résultat de Prop. 3.1 a une importance
capitale en mécanique quantique où les observables sont représentées par des opérateurs
autoadjoints. 2
Exemples : Ensemble résolvant et spectre
De plus, le vecteur u n’étant égal à zéro que si tous les αj sont nuls, l’opérateur
(T − λI)−1 existe pour λ 6= λj . Le calcul
ej = (T − λI)−1 (T − λI)ej = (λj − λ)(T − λI)−1 ej (3.36)
35
fournit l’expression (T − λI)−1 ej = ej /(λj − λ) et l’opérateur inverse
∞
X
−1 αj
(T − λI) u = ej (3.37)
j=0 (λj − λ)
36
Déf. 3.6 Un projecteur E : H −→ H est un opérateur linéaire borné, autoadjoint et
idempotent (E 2 = E).
Par exemple, on vérifie que (En u)(x) = (ϕn , u)ϕn (x) est autoadjoint et idempotent.
Déf. 3.7 Une famille de projecteurs orthogonaux (Eλ )λ∈IR est appelée famille spectrale
si les conditions suivantes sont satisfaites :
où v ∈ H. La fonction de λ donnée par par le produit scalaire (Eλ u, v) définit la mesure
de Stieltjes.
37
b) Opérateur position (Qu)(x) = xu(x), u ∈ D(Q) ⊂ L2 (IR)
Pour établir la famille spectrale de Q, on introduit la fonction caractéristique
(
1 si x ∈ I
χI (x) =
0 si x ∈
/I .
Ut = eitT t ∈ IR . (3.45)
Alors, d’après le théorème de Stone, il existe un opérateur autoadjoint unique que l’on
note T = −H/h̄ et tel que
i
Ut = e− h̄ Ht . (3.47)
En dérivant (3.46) par rapport à t on obtient l’expression
d i i
ψ(t) = − HUt ψ(0) = − Hψ(t)
dt h̄ h̄
d’où l’on tire l’équation de Schrödinger
d
ih̄ ψ(t) = Hψ(t) . (3.48)
dt
38
Chapitre 4
Problème de Sturm-Liouville
De plus, des exemples de bases de L2 (U ) telles que les polynômes orthogonaux ou les
séries de Fourier ont été largement discutés. Dans le chapitre 3, on a défini les propriétés
générales des opérateurs linéaires sur H et apporté les précisions essentielles sur les fonc-
tions propres et les valeurs propres de ces opérateurs. On a aussi vu que les opérateurs
linéaires bornés sur H peuvent être représentés de manière simple par des éléments de
matrice. Par contre, la démarche est plus délicate si les opérateurs linéaires ne sont pas
bornés et encore plus complexe si les opérateurs sont non-linéaires.
De nombreuses grandeurs physiques sont représentées par des opérateurs linéaires sur
2
L (U ). Ces opérateurs contiennent des dérivées premières et secondes et ne sont pas
bornés. Ils apparaissent sous la forme d’équations différentielles aux valeurs propres. Les
exemples que nous traiterons dans ce chapitre ont des spectres ponctuels σp (T ). Pour les
opérateurs ayant un ensemble résolvant ou un spectre continu, on se réfèrera aux chapitres
suivants et tout particulièrement au chapitre 7 concernant les fonctions de Green. On
engagera d’abord la discussion sur des équations simples pour aboutir à des équations
différentielles linéaires plus difficiles comme par exemple
f 00 − 2xf 0 + (λ − 1)f = 0 x ∈ IR . (4.2)
Ces équations différentielles contiennent des valeurs propres λ. Elles peuvent être associées
à des opérateurs linéaires sur H que l’on appelle opérateurs de Sturm-Liouville. Ainsi, pour
une équation aux valeurs propres donnée, on aimerait savoir : Quelles sont les propriétés
de l’opérateur linéaire sous-jacent ? Quelles sont les valeurs propres ? Quelle est la forme
des fonctions propres de L2 (U ) ? On tentera avant tout de comprendre les démarches et
de les inclure dans la théorie de Hilbert. Si cette étape est bien franchie, la discussion des
aspects techniques n’est plus nécessaire, car tous les résultats concernant ces équations
différentielles linéaires sont largement présentés dans des livres ou des tables qu’il est
possible de consulter selon le besoin.
39
4.2 Opérateur et équation de Sturm-Liouville
La réponse aux questions posées ci-dessus est donnée par la théorie de Sturm-Liouville
caractérisée par l’équation différentielle linéaire inhomogène
où Aj , Bj ∈ IR, p, q, r, f ∈ L2 ([a, b]) réelles, p(x), r(x) > 0. L’équation (4.3) est l’expres-
sion la plus générale d’une équation différentielle linéaire du deuxième ordre. L’opérateur
de Sturm-Liouville correspondant
Quelles sont les valeurs propres λ et les fonctions propres u ∈ L2 ([a, b]) ?
soumise aux conditions limites u(0) = 0 = u(`). Pour p(x) = 1 = r(x), q(x) = 0,
00
l’opérateur
n .de Sturm-Liouville s’écrit (Su)(x)
o = −u (x) et est défini sur le domaine
D(S) = u u ∈ L2 ([0, `]), u(0) = 0 = u(`) . L’équation aux valeurs propres1
(S − λ)u = 0
40
Avec les deux propositions qui suivent, on montre, de manière générale, que l’opérateur de
Sturm-Liouville (4.6) possède des valeurs propres et des fonctions propres qui permettent
d’établir les solutions de l’équation différentielle correspondante. La simplicité des pro-
priétés de Prop. 4.1 est évidemment liée à la linéarité de l’opérateur de Sturm-Liouville.
Toutefois, le problème de la recherche des valeurs propres et des fonctions propres reste
toujours ouvert.
Prop. 4.1 L’opérateur de Sturm-Liouville
Preuve. L’existence des valeurs propres et des fonctions propres de L2 ([a, b]) est relati-
vement délicate à montrer. Nous la laissons de côté. Toutefois, pour fixer les idées, nous
allons montrer que le spectre est réel et que les fonctions propres relatives à des valeurs
propres différentes sont orthogonales. Considérons l’équation aux valeurs propres
Su = λ ru (4.14)
41
Les conditions limites (4.4) fournissent, pour A1 , A2 ∈ IR, le système homogène
" #" # " #
u1 (a) u01 (a) A1 0
= (4.17)
u2 (a) u02 (a) A2 0
qui possède une solution non-triviale si et seulement si le déterminant est égal à zéro
(S − λr)u = −f La u = 0 = Lb u (4.19)
possède des solutions u(x) qui se développent dans la base ϕn (x), (ϕm , ϕn )r = δmn des
fonctions propres de S et prennent les formes suivantes :
1) Si λ ∈
/ σp (S), il existe une solution unique
∞
X Z b "X
∞
#
(ϕn , f ) 1
u(x) = ϕn (x) = ϕ∗n (ξ)ϕn (x) f (ξ)dξ . (4.20)
n=0 λ − λn a n=0 λ − λn
2) Si λ = λn0 ∈ σp (S), il existe des solutions dans le cas où (ϕn0 , f ) = 0. Pour une
constante c quelconque, ces solutions sont données par l’expression
∞
X (ϕn , f )
u(x) = ϕn (x) + c ϕn0 (x) . (4.23)
n0 6=n=0 λn0 − λn
Preuve. Regardons le cas λ ∈ / σp (S). Dans la base {ϕ0 , ϕ1 , ϕ2 , · · ·} des vecteurs propres
de S, on a le développement de Fourier généralisé
∞
X
u(x) = cn ϕn (x) . (4.24)
n=0
42
En allant dans l’équation (4.19), on obtient l’expression
∞
X
−f = cn (λn − λ)rϕn (4.25)
n=0
Pour λ ∈ / σp (S), on isole les coefficients cn pour les introduire dans (4.24) et déduire
l’expression (4.20). 2
La fontion de Green qui a une grande importance dans la résolution des équations
différentielles linéaires reviendra dans le chapitre 7. A l’aide des séries de Fourier en
sinus, on vérifie (exercice) la convergence de la série vers la fonction
∞ µ ¶ µ ¶ (
2` X 1 nπ nπ x(1 − ξ/`) x ∈ [0, ξ)
G(x, ξ) = 2 sin ξ sin x = (4.31)
π n=1 n2 ` ` ξ(1 − x/`) x ∈ (ξ, `] .
Enfin, en développant u(x) dans la base ϕn et en calculant la dérivée seconde, on
peut donner à l’opérateur S la représentation spectrale
∞ µ ¶ ∞ µ ¶
X nπ 2 X nπ 2
(Su)(x) = (ϕn , u)ϕn (x) = Pn u(x) (4.32)
n=1 ` n=1 `
où les Pn u = (ϕn , u)ϕn (x) sont les projecteurs sur les sous-espaces propres.
43
b) Corde vibrante soumise à une force extérieure
On considère l’équation différentielle
possède le même spectre que (4.28). Alors, à partir de la formule (4.20) et pour
k 2 6= λn , on peut immédiatement écrire la solution de cette équation différentielle
s µ ¶
∞
2X (ϕn , f ) nπ
u(x) = 2 2
sin x
` n=1 (nπ/`) − k `
∞
"Z µ ¶ # µ ¶
2X 1 ` nπ nπ
= sin ξ f (ξ) dξ sin x . (4.34)
` n=1 (nπ/`)2 − k 2 0 ` `
Cette solution est bien définie pour k 2 ∈/ σp (S). Pour k 2 ∈ σp (S), il y a résonance
et une solution (pas unique !) existe si (ϕm , f ) = 0, sinon il n’y a pas de solution.
Comme dans l’exemple précédent, on peut aussi exprimer u(x) à l’aide de la fonction
de Green G(x, ξ) relative à l’opérateur (Su)(x) = −u00 (x) − k 2 u(x)
Z `" X µ ¶ µ ¶#
2 ∞ 1 nπ nπ
u(x) = 2 2
sin x sin ξ f (ξ)dξ
0 ` n=1 (nπ/`) − k ` `
Z `
= G(x, ξ)f (ξ)dξ . (4.35)
0
Dans la section 7.2, cette fonction de Green sera calculée. Le résultat donné par
(7.27) est reporté ci-dessous
(
1 sin k(` − ξ) sin kx x ∈ [0, ξ)
G(x, ξ) = (4.36)
k sin k` sin kξ sin k(` − x) x ∈ (ξ, `] .
D’après Prop. 4.1, une base de solutions de L2 ([0, `]) existe, mais n’est pas connue.
À partir de la solution pour ² = 0, on peut néanmoins la déterminer de manière
approchée, par un calcul de perturbation [voir Courant Hilbert].
44
4.3 Problème de Sturm-Liouville singulier
On considère à nouveau l’équation de Sturm-Liouville (4.3) en prenant aussi en compte
les conditions limites aux points a, b → ±∞. De plus, on admet que
Ces conditions limites, peuvent donner des solutions qui divergent en a ou b. Il s’agit
donc d’imposer les bonnes prescriptions afin de trouver des solutions de L2 (U ). La seule
manière réaliste d’aborder ces problèmes consiste à discuter des exemples bien connus de la
physique. Toutefois, dans la plupart des cas, on ne fera qu’effleurer les difficultés techniques
et citer les résultats que l’on peut d’ailleurs retrouver dans beaucoup de livres ou tables.
Seule l’équation des polynômes d’Hermite sera traitée complètement. Elle permettra de
mettre en évidence l’essentiel des difficultés.
d2
( − x2 + λ)u(x) = 0 . (4.39)
dx2
On recherche des fonctions3 u ∈ L2 (IR) en remarquant d’abord que la fonction asymp-
totique exp(−x2 /2) est solution de (4.39) pour x À 1. On substitue donc dans cette
équation la fonction
2
u(x) = e−x /2 H(x) (4.40)
pour aboutir à l’équation différentielle d’Hermite
3
L’oscillateur harmonique fournit un exemple type de l’isomorphisme (2.34) entre les espaces de Hilbert
L (IR) et l2 . Ici, il est étudié dans le cadre de l’espace L2 (IR). Le plus souvent (voir cours de Mécanique
2
45
En allant dans (4.41), on obtient (exercice) l’équation séculaire
s(s − 1) = 0 (4.44)
et la relation de récurrence
2(k + s) + 1 − λ
ck+2 = ck (4.45)
(k + s + 2)(k + s + 1)
qui fournit deux séries du type (4.43), l’une paire et l’autre impaire. Ces séries sont
dissociées de la manière suivante :
1) pour s = 0, on choisit c0 quelconque et c1 = 0 (série paire)
2) pour s = 1, on peut aussi choisir c0 quelconque et c1 = 0.
Ce choix est équivalent à s = 0, c0 = 0 et c1 quelconque (série impaire).
En étudiant le comportement asymptotique de cette série (exercice), on voit que pour
2
x À 1, on a H(x) ∼ ex . Ainsi, l’expression (4.40) montre que la fonction
2 /2
u(x) ∼ ex
n’est pas de carré intégrable. Pour obtenir des solution u ∈ L2 (IR), on doit donc couper la
série (4.43) en un polynôme de degré n en posant, à partir du terme k = n, la condition
cn+2 = 0. Alors, pour s = 0, la relation (4.45) devient
2n + 1 − λ
cn+2 = 0 = cn (4.46)
(n + 2)(n + 1)
et fournit, pour cn 6= 0 les valeurs propres
λn = 2n + 1 n ∈ IN . (4.47)
H0 (x) = 1 H1 (x) = 2x
H2 (x) = 4x2 − 2 H3 (x) = 8x3 − 12x
H4 (x) = 16x4 − 48x2 + 12 . (4.51)
46
La normalisation choisie correspond au produit scalaire
Z +∞ √
2
e−x Hm (x)Hn (x)dx = π2n n!δmn . (4.52)
−∞
Comme les Hn forment une base de L2 (IR), la solution générale u ∈ L2 (IR) de l’équation
linéaire (4.39) est donnée par le développement
∞
X
2 /2
u(x) = e−x αn Hn (x) . (4.53)
n=0
b) Polynômes de Legendre
Les polynômes de Legendre sont définis par l’équation différentielle
c) Polynômes de Laguerre
Les polynômes de Laguerre sont définis par l’équation différentielle
où p(x) = x e−x , q(x) = 0, r(x) = e−x . En exigeant que les solutions f soient des polynômes
de degré N , on peut déterminer les valeurs propres λN = N N ∈ IN et les fonctions
propres appelés polynômes de Laguerre LN (x). Ils représentent un cas particulier des
polynômes associés de Laguerre LαN (x) qui sont solutions de l’équation
47
où σ 2 est la valeur propre d’énergie. En introduisant dans cette équation la fonction
d) Fonctions de Bessel
Les fonctions de Bessel sont définies par les solutions de l’équation différentielle
à !
1 n2
Zn00 (x) + Zn0 (x) + λ − 2 Zn (x) = 0 . (4.64)
x x
Le calcul des valeurs propres et des fonctions propres des opérateurs de Sturm-Liouville
singuliers se présente sous deux aspects. D’un côté, il s’appuie sur la résolution des
équations différentielles soumises aux conditions de fonctions de carré intégrables et
détermine ces polynômes, comme on l’a fait pour l’équation d’Hermite. D’un autre côté,
il peut emprunter une voie plus simple en utilisant les polynômes orthogonaux donnés
par la section 2.5 et en vérifiant qu’ils sont solutions des équations aux valeurs propres
correspondantes.
48
Chapitre 5
Transformées de Fourier
∂ h̄2 ∂ 2
ih̄ ψ(x, t) = − ψ(x, t) . (5.1)
∂t 2m ∂x2
R
L’intégrale U |ψ|2 dx représente la probabilité de trouver la particule dans l’intervalle
U ⊂ IR au temps t. On cherche donc une solution1 de l’équation (5.1) de carré intégrable
et soumise à la condition initiale
avec ψ0 ∈ L2 (IR) donné. D’après l’équation d’évolution (3.48), on sait que la solution
prend la forme
ψ(x, t) = u(x) e−i(E/h̄)t
où E = p2 /2m. Introduite dans (5.1), elle conduit à l’équation différentielle
p2
u00 (x) + u(x) = 0 (5.3)
h̄2
qui possède les deux solutions
{eipx/h̄ , e−ipx/h̄ } . (5.4)
Pour p ∈ IR et en introduisant la relation de dualité onde-corpuscule E = h̄ω, on arrive à
la famille de fonctions
ψp (x, t) = ei(px/h̄−ωt) (5.5)
R R
qui n’appartiennent pas à L2 (IR) puisque IR |ψp (x, t)|2 dx = IR dx → ∞. Comme l’équa-
tion (5.1) est linéaire, on peut définir une solution par superposition des fonctions ψp (x, t)
sous la forme d’une intégrale appelée paquet d’ondes
Z +∞
ψ(x, t) = c(p) ei(px/h̄−ωt) dp . (5.6)
−∞
1
La solution de cette équation peut aussi être déterminée à l’aide de l’Ansatz ψ(x, t) = u(x)g(t).
49
Dans le cadre de la théorie des transformées de Fourier, on montre qu’une telle fonction
c ∈ L2 (IR) existe et est donnée par
1 Z +∞
c(p) = ψ(x, 0)e−ipx/h̄ dx (5.7)
2π −∞
et que ψ(x, t) appartient aussi à L2 (IR). Enfin, on note l’analogie entre les fonctions c(p)
et les coefficients des séries de Fourier (2.55).
On remarque que fb(p) est bien définie pour tout p ∈ IR puisque f ∈ S(IR) entraı̂ne
f (x) exp(−ipx) intégrable. Le choix du signe de l’exposant et le choix de la constante de
normalisation sont conventionnels. On peut montrer que pour x ∈ IR la transformée de
Fourier inverse appartient aussi S(IR) et s’écrit
1 Z +∞ b
f (x) = √ f (p) eipx dp . (5.10)
2π −∞
La vérification s’effectue par un calcul direct. Pour vérifier (5.11), on dérive sous le
signe intégral pour obtenir
n Z +∞
i
i fb (n) (p) = √
n
f (x) (−ix)n e−ipx dx = (xd
n f )(p) .
2π −∞
R
2
Dans IR3 , la transformée de Fourier s’écrit fb(p) = (2π)−3/2 IR3
f (r) e−ipr d3 r.
50
De même, pour (5.12), le membre de gauche donne
in Z +∞
i p fb(p) =
n n
√ f (x) pn e−ipx dx
2π −∞
i (−i)−n Z +∞
n
dn
= √ f (x) n e−ipx dx
2π −∞ dx
n Z +∞
(−1)
= √ (−1)n f (n) (x) e−ipx dx = (fd
(n) )(p)
2π −∞
51
qui nous conduit à une forme d’intégrale typique que l’on définit comme produit de
convolution des fonctions f et g.
Déf. 5.2 Le produit de convolution5 des fonction f, g ∈ S(IR) est défini par l’intégrale
Z +∞
(f ∗ g)(x) = f (x − y)g(y) dy . (5.14)
−∞
Ainsi, comme on l’a vu ci-desssus, la transfomée de Fourier d’un produit de fonctions est
donnée par le produit de convolution des fonctions transformées
1
(fcg)(p) = √ (fb ∗ gb)(p) . (5.15)
2π
On vérifie facilement les propriétés suivantes du produit de convolution
a) f ∗ g = g ∗ f (5.16)
b) (f ∗ g) ∗ h = f ∗ (g ∗ h) (5.17)
√
c) (fd∗ g)(p) = 2π fb(p)gb(p) . (5.18)
Pour appliquer les transformées de Fourier aux fonctions d’un espace de Hilbert, il
faut prolonger, par continuité, la transformée de Fourier de l’espace de Schwartz S(IR) à
l’espace des fonctions de carré intégrables L2 (IR) en utilisant le fait que l’espace S(IR) est
dense dans L2 (IR). Ce résultat est résumé par le théorème important suivant.
F : L2 (IR) −→ L2 (IR)
52
5.3 Utilisation des transformées de Fourier
a) Calcul d’une transformée de Fourier
La transformée de Fourier de la fonction f (x) = e−a|x| , Re a > 0 est donnée par
1 Z +∞ −a|x| −ipx
fb(p) = √ e e dx
2π −∞
·Z ∞ Z ∞ ¸
1
= √ e−ax eipx dx + e−ax e−ipx dx
2π 0 0
s
2 a
= . (5.19)
π p + a2
2
b) Relation de Parseval
Pour des fonctions fb, gb transformées de Fourier des fonctions f , g, la relation de
Parseval est évidemment satisfaite. En utilisant la transformée de Fourier du produit de
convolution (f ∗d∗ g)(p), on vérifie (exercice) que
Z +∞ Z +∞
f (x)∗ g(x) dx = fb(p)∗ gb(p) dp . (5.20)
−∞ −∞
Cette expression est une généralisation au continu de la relation de Parseval donnée dans
le Th. 2.2. Dans le cas où f = g, on a la relation bien connue
Z +∞ Z +∞
|f (x)|2 dx = |fb(p)|2 dp . (5.21)
−∞ −∞
53
solution de l’équation de Schrödinger de la particule libre
h̄2 2
ih̄ ∂t ψ = − ∂ ψ (5.25)
2m x
où l’on a défini h̄ω = h̄2 k 2 /2m. A l’aide de la transformée de Fourier, on montre (exercice)
que la solution au temps t est donnée par l’intégrale
Z
ψ(x, t) = K(x − x0 , t − t0 )ψ(x0 , t0 ) dx0
IR
qui par définition est a-périodique. Elle peut donc être développée en une série de Fourier
dans la base (2.67)
∞
X 2π
R(x) = cn ei a nx (5.27)
n=−∞
1 Z +a/2 2π
cn = R(x)e−i a nx dx
a −a/2
∞ Z +a/2
1 X 2π
= f (x + ma) e−i a nx dx . (5.28)
a m=−∞ −a/2
54
qui prise au point x = 0 et a = 1 fournit la formule sommatoire de Poisson
∞
X √ ∞
X
f (m) = 2π fb(2πn) . (5.31)
m=−∞ n=−∞
55
À ce stade, il est logique d’évoquer brièvement la transformée de Laplace qui possède
beaucoup de similitudes avec la transformée de Fourier. En tant que transformation uni-
taire, la transformée de Fourier a l’avantage d’avoir une transformation inverse simple.
Elle a cependant le désavantage de générer des fonctions généralisées. La transformée de
Laplace n’a pas cet inconvénient. Son inverse par contre n’est pas simple.
56
Chapitre 6
Distributions
√
6.1 Introduction : transformée de Fourier de 1/ 2π
En considérant la formule de la transformée de Fourier
1 Z +∞ b
f (x) = √ f (p)eipx dp , (6.1)
2π −∞
il est légitime de vouloir calculer la transformée de la fonction constante
1
fb(p) = √ p ∈ IR . (6.2)
2π
On remarque alors que l’expression
1 Z +∞ 1 ipx 1 Z +a ipx 1 2 sin ax
√ √ e dp = lim e dp = lim (6.3)
2π −∞ 2π a→∞ 2π −a 2π a→∞ x
n’a pas de limite. Il n’existe pas de fonction transformée de Fourier de la fonction constante
sur IR. Cependant, pour des fonctions ϕ ∈ S(IR), on peut montrer la limite suivante
1 Z +∞ 2 sin ax
lim ϕ(x) dx = ϕ(0) . (6.4)
a→∞ 2π −∞ x
En effet, en utilisant la normalisation
1 Z +∞ 2 sin ax
dx = 1 , (6.5)
2π −∞ x
en notant g(x) = [ϕ(x)−ϕ(0)]/x et en intégrant par parties, on obtient la limite annoncée
1 Z +∞ [ϕ(x) − ϕ(0)] 1 Z +∞
lim 2 sin ax dx = lim 2 sin ax g(x) dx
a→∞ 2π −∞ x a→∞ 2π −∞
· ¸+∞
cos ax 1 Z +∞ cos ax 0
= lim − g(x) + lim g (x) dx = 0 ,
a→∞ πa −∞ a→∞ π −∞ a
puisque, pour a → ∞, le premier terme tend vers 0 et l’intégrale uniformément bornée
du deuxième terme s’annule. Le calcul de la limite ci-dessus appelle deux remarques :
– le théorème de la moyenne du calcul intégral ne peut pas être utilisé pour évaluer
l’intégrale (6.4) puisque la fonction sin ax/x n’est pas définie positive,
– la fonction ϕ(x)/x n’est pas définie en x = 0 et ne peut par conséquent pas être
prise toute seule dans la limite, par contre la fonction g(x) = [ϕ(x) − ϕ(0)]/x l’est.
57
6.2 Distribution de Dirac
La limite (6.4) introduit le concept de distribution de Dirac, i.e. de fonctionnelle notée
D0 qui à toute fonction ϕ ∈ S(IR) fait correspondre sa valeur au point zéro
1 Z +∞ 2 sin ax
D0 [ϕ] ≡ a→∞
lim ϕ(x) dx = ϕ(0) . (6.6)
2π −∞ x
Le physicien utilise la notation pratique de fonction δ(x) de Dirac1 et écrit
Z +∞
δ(x)ϕ(x)dx = ϕ(0) . (6.7)
−∞
Cette limite se vérifie par exemple (exercice) pour les suites données ci-dessous
n 2 2
dn (x) = √ e−n x
π
n 1
dn (x) = (6.10)
π 1 + n2 x2
1 sin2 nx
dn (x) = .
nπ x2
Toutefois, limn→∞ dn (x) n’existe pas.
Déf. 6.1 La distribution de Dirac Dx0 est une fonctionnelle linéaire définie par
Dx0 : S(IR) −→ IR
ϕ 7−→ Dx0 [ϕ] = ϕ(x0 ) . (6.11)
1
Historiquement, Dirac introduisit (1927) la ”fonction”
½
0 x 6= 0
δ(x) =
∞ x=0
R +∞ R +∞
telle que −∞ δ(x)dx = 1 et −∞ δ(x)ϕ(x)dx = ϕ(0). Cette fonction δ n’a pas de sens puisque δ(x) = 0
R
presque partout implique δ(x)dx = 0. Le symbole δ(x) signifie tout simplement que l’intégrale s’effectue
en prenant la fonction ϕ au point x = 0. C’es l’analogue d’un symbole de Kronecker continu.
58
Exemple : Équation du potentiel
R f (r0 )
Pour une fonction f ∈ S(IR3 ), on considère le potentiel φ(r) = V d3 r0 |r−r0 |
. Le
calcul du laplacien " #
Z
2 3 0 2 1
∇ φ(r) = dr ∇ 0
f (r0 ) (6.13)
V |r − r |
conduit à l’expression singulière
1 (r − r0 )
∇2 = −∇ · =0 (6.14)
|r − r0 | |r − r0 |3
qui s’annule pour r 6= r0 , mais n’est pas définie pour r = r0 . Une manière plus
appropriée de calculer (6.13) pour tout r consiste à faire d’abord le changement de
variable d’intégration u = r0 − r, puis à utiliser la symétrie des variables r et u pour
appliquer le laplacien2
Z Z
1 2 1
∇2 φ(r) = d3 u ∇ f (u + r) = d3 u ∇2u f (u + r) . (6.15)
V u V u
dσ ’
’
V
dσ’ Bε
u ’
59
Le changement de variable u = ²n, |n| = 1 et l’insertion de dσ = ²2 sin ϑdϑdϕ
montrent que la limite du premier terme de (6.18) tend vers zéro
Z Z
u 1 2
lim ∇u f · 2 dσ ≤ lim const. ² sin ϑdϑdϕ = 0 . (6.19)
²→0 ∂B² u ²→0 |n|=1 ²
60
En notation de fonction et avec la transformée de Fourier, cette relation devient
Z +∞ Z +∞
b 1 Z +∞
δ(p)ϕ(p) dp = δ(p)ϕ(p)
b dp = ϕ(0)
b =√ ϕ(x) dx
−∞ −∞ 2π −∞
et, comme on l’a déjà vu en (6.8), implique
b 1
δ(p) =√ . (6.27)
2π
Déf. 6.3 La dérivée D00 d’une distribution de Dirac est définie par la limite
Z +∞
D00 [ϕ] = lim d0n (x)ϕ(x) dx . (6.28)
n→∞ −∞
La dérivée D00 est donc à nouveau une distribution i.e. une fonctionnelle linéaire donnée
par la distribution de Dirac
D00 [ϕ] = − D0 [ϕ0 ] (6.29)
que l’on peut aussi écrire comme fonction généralisée
Z +∞
δ 0 (x)ϕ(x) dx = −ϕ0 (0) .
−∞
Pour une distribution de Dirac considérée comme fonction, on vérifie (exercice) à l’aide
de (6.9) les propriétés suivantes :
a) δ(x) = δ(−x) (6.30)
1
b) δ(ax) = δ(x), a 6= 0 (6.31)
|a|
X 1
c) δ(g(x)) = δ(x − xn ) (6.32)
n |g 0 (x n )|
où g(xn ) = 0, g 0 (xn ) 6= 0 et où l’on somme sur tous les zéros de g(x).
Par exemple, on a
1
δ(x2 − x20 ) = [δ(x − x0 ) + δ(x + x0 )].
2x0
61
Les distributions tempérées appartiennent à l’espace vectoriel
n o
S 0 (IR) = τ /τ : S(IR) −→ C,
l linéaire (6.33)
dual de S(IR). Les distributions Dx0 , Dx0 0 et D c sont évidemment des distributions
x0
tempérées. La transformée de Fourier F[ϕ] ≡ ϕ(p)
b est une distribution tempérée. Comme
pour la distribution de Dirac, on définit, à partir de la suite de fonctions tn et pour tout
ϕ ∈ S(IR), la distribution tempérée par la limite
Z +∞
τ [ϕ] = n→∞
lim tn (x)ϕ(x) dx .
−∞
Le produit de distributions n’est pas défini. On peut cependant définir le produit d’une
fonction v ∈ C ∞ avec une distribution tempérée en considérant la distribution tempérée
τ sur le produit des fonctions vϕ.
Déf. 6.5 Soit τ une distribution tempérée et v ∈ C ∞ (IR) telle que vϕ ∈ S(IR) pour
ϕ ∈ S(IR). Alors
(vτ )[ϕ] = τ [vϕ] ϕ ∈ S(IR) (6.36)
définit une distribution tempérée appelée produit.
62
b) Transformée de Fourier de la fonction égale à 1 sur tout IR.
Elle est définie à l’aide de la distribution tempérée τb1 (ϕ) qui donne
Z +∞ √ √
τb1 [ϕ] = τ1 [ϕ]
b = 1 ϕ(p)
b dp = 2π ϕ(0) = 2π D0 [ϕ] .
−∞
(xD0 ) = 0 (6.42)
xδ(x) = 0 . (6.43)
(xD00 )[ϕ] = D00 [xϕ] = −D0 [(xϕ)0 ] = −D0 [ϕ + xϕ0 ] = −D0 [ϕ] − D0 [xϕ0 ] = −D0 [ϕ]
La théorie des distributions se révèlera utile pous la résolution des équations différen-
tielles à l’aide des fonctions de Green. En introduisant le produit de convolution
Z +∞ ·Z +∞ ¸
τf ∗g [ϕ] = f (t)g(x − t) dt ϕ(x) dx , (6.46)
−∞ −∞
on peut considérer la distribution de Dirac comme l’élément unité de l’algèbre des distri-
butions. En effet, la convolution avec δ donne
Z +∞ ·Z +∞ ¸ Z +∞
τδ∗f [ϕ] = δ(t)f (x − t) dt ϕ(x) dx , = f (x)ϕ(x) dx = τf [ϕ] . (6.47)
−∞ −∞ −∞
On aboutit ainsi au calcul algébrique de Heaviside utilisé dans la résolution des équations
différentielles.
63
6.4 Triplet de Gelfand ou triade hilbertienne
Il existe des états quantiques qui ne sont pas normalisables et par conséquent n’ap-
partiennent pas à H. On évite généralement ce problème mathématique en précisant que
ces états sont une idéalisation de la réalité physique. Toutefois, grâce aux distributions,
on peut donner une définition5 précise à ces états et leur attribuer un produit scalaire.
On prendra comme exemple les états des opérateurs position Q et impulsion P .
a) Opérateur position Q
C’est l’opérateur de multiplication par x, défini pour tout x ∈ IR par
ne possède que la solution triviale ψx0 = 0 pour x 6= x0 , i.e. ψx0 est nulle presque partout
(sauf sur l’ensemble de mesure nulle x = x0 ). Il s’ensuit que Q n’a pas de solution dans
S(IR). Toutefois, l’interprétation symbolique ψx0 (x) ∼ δ(x − x0 ), nous incite à prendre la
distribution de Dirac
Dx [ϕ] = ϕ(x) (6.50)
comme solution de (6.49). Alors, le produit de l’opérateur Q avec Dx0 s’écrit
qui pour tout ϕ ∈ S(IR) possède une solution non-triviale Dx0 ∈ S 0 (IR).
b) Opérateur impulsion P
C’est l’opérateur de dérivation défini pour tout ψ ∈ S(IR) par
1 d
(P ψ)(x) = ψ(x) . (6.53)
i dx
Alors l’équation aux valeurs propres
1 d
− p)ψp (x) = 0
( (6.54)
i dx
√
possède les solutions ψp (x) = (1/ 2π)eipx /∈ S(IR). On introduit ces solutions dans un
produit scalaire représenté par la transformée de Fourier
Z +∞
lp [ϕ] = ψp∗ (x)ϕ(x)dx = (ψp , ϕ) (6.55)
−∞
5
Cette section fait référence à l’article de F. Gieres, quant-ph/9907069.
64
qui définit aussi une distribution tempérée
lp [ϕ] = ϕ(p)
b . (6.56)
Les exemples des opérateurs de position et d’impulsion mettent en évidence le rôle des
trois ensembles qui constituent le triplet de Gelfand ou triade hilbertienne
On parle souvent d’espace de Hilbert équipé (rigged Hilbert space). Les distributions
tempérées telles que la distribution de Dirac ou la transformée de Fourier vont nous
permettre d’interpréter tous les états de la mécanique quantique.
qui revient à identifier les espaces H et H∗ . Attention, cette correspondance qui utilise le
théorème de Riesz n’est pas valable pour tous les vecteurs de la mécanique quantique (voir
triplet de Gelfand dans la section 6.4). La base de Hilbert de H est définie par l’ensemble
n . o
|ni hm|ni = δmn n, m ∈ IN (6.62)
65
P∞
La relation de fermeture hψ|ϕi = n=0 hψ|nihn|ϕi peut être notée symboliquement
∞
X
|nihn| = 1 (6.64)
n=0
L’opérateur linéaire A défini sur D(A) dense dans H est interprété comme l’application
qui à tout ket |ψi fait correspondre le nouveau ket A|ψi
Dans un bracket, cette notation doit être comprise comme une composition d’opérateurs
³ ´
hϕ|A|ψi = hϕ| A|ψi . (6.68)
On applique d’abord l’opérateur A sur |ψi, puis on agit avec la forme linéaire hϕ| pour
constituer le produit scalaire. Alors, l’espérance mathématique s’écrit
³ ´
hϕ|A|ψi = |ϕi, A|ψi . (6.69)
Pour définir comme dans (3.22) l’adjoint de A, on effectue les opérations suivantes
³ ´ ³ ´ ³ ´∗
hϕ|A|ψi = |ϕi, A|ψi = A† |ϕi, |ψi = |ψi, A† |ϕi = hψ|A† |ϕi∗ . (6.70)
La notation de Dirac permet de donner au calcul une structure visuelle simple, comme
par exemple l’insertion de la relation de fermeture (6.64). Il faut cependant se garder de
toute utilisation abusive. La manière la plus simple de contrôler cette notation consiste à
toujours se référer aux correspondances
³ ´
hϕ|ψi = |ϕi, |ψi (6.73)
³ ´
hϕ|A|ψi = hϕ| A|ψi . (6.74)
6
On obtient ainsi une correspondance directe ente le ket A|ψi le bra hψ|A† .
66
En utilisant l’espace des distributions S 0 (IR), il est possible d’interpréter les h...| de
Dirac qui n’appartiennent pas à H∗ . En fait, les distributions tempérées Dx , lp ∈ S 0 (IR)
définies dans la section 6.4 sont des formes linéaires
hx| ≡ Dx (6.75)
hp| ≡ lp (6.76)
Avec ces notations, les définitions (6.48) et (6.53) des opérateurs Q et P donnent
³ ´
hx|Q|ϕi = hx| Q|ϕi = (Qϕ)(x) = xϕ(x) (6.79)
³
d
´ 1ddϕ
hp|P |ϕi = hp| P |ϕi = (P ϕ)(p) = ( )(p) = pϕ(p)
b . (6.80)
i dx
Avec le bra hx|, on obtient en particulier
1 d
hx|P |ϕi = (P ϕ)(x) = ϕ(x) . (6.81)
i dx
Les kets correspondants aux bras définis par (6.75) et (6.76) seront employés comme
n’importe quel élément de H. On obtient cette correspondance en considérant l’expression
et de même pour l’opérateur P . Comme (6.82) est valable pour tout bra hϕ|, on en déduit
les équations aux valeurs propres
qui définissent les kets propres |xi et |pi comme une base continue. On peut ainsi écrire
les relations de fermeture
Z Z
dx0 |x0 ihx0 | = 1 dp0 |p0 ihp0 | = 1 . (6.85)
IR IR
67
qui à tout ϕb fait correspondre la valeur ϕ(p)
b conduit à la relation d’orthogonalité
À l’aide des relations données dans cette section et en utilisant les équations aux valeurs
propres Q|xi = x|xi, P |pi = p|pi, on montre (exercice) que l’opérateur P 2 + V (Q), où V
est une fonction analytique, peut s’écrire
¯ ¯ h d2 i
hx¯¯P 2 + V (Q)¯¯ϕi = − + V (x) ϕ(x) . (6.94)
dx2
68
Chapitre 7
Fonctions de Green
69
a) Fonction de Green relative à l’opérateur d2 /dx2
La fonction de Green relative à l’opérateur de Sturm-Liouville (Su)(x) = −u00 (x)
a déjà été calculée dans l’exemple (4.8). Ici, nous reprenons le problème sous une autre
forme, i.e. sans passer par les valeurs propres qui d’ailleurs n’existent pas pour l’opérateur
dérivée seconde positif et soumis aux conditions de bord habituelles. Pour x ∈ [a, b], on
considère l’équation différentielle linéaire
u00 (x) = f (x) (7.5)
soumise aux conditions limites u(a) = 0 = u(b). On résout cette équation1 , en admettant
d’abord que la partie inhomogène de (7.5) n’agit qu’en un point x = ξ. Ainsi la fonction de
répartition peut être définie par la fonction généralisée f (x) = δ(x − ξ) que l’on interprète
de la manière suivante : δ(x − ξ) = 0 pour x 6= ξ et δ(x − ξ) 6= 0 pour x = ξ. Dans ce
cas, l’équation (7.5) devient G00 (x, ξ) = δ(x − ξ) et reste soumise aux conditions de bord
G(a, ξ) = 0 = G(b, ξ).
d2
Déf. 7.1 La fonction de Green relative à l’opérateur dx2
est la fonction G(x, ξ) solution
de l’équation
G00 (x, ξ) = δ(x − ξ) (7.6)
et telle que
a) G(x, ξ) continue en x = ξ
b) G(x, ξ) satisfait les conditions limites homogènes G(a, ξ) = 0 = G(b, ξ) .
Alors, on voit que la solution de (7.5) est fournie par l’intégrale
Z b
u(x) = G(x, ξ)f (ξ) dξ , (7.7)
a
Les conditions aux bords u(a) = 0 = u(b) sont aussi satisfaites. Résoudre l’équation (7.5)
revient donc à déterminer la fonction de Green définie par l’équation (7.6) et à effectuer
l’intégration (7.7). Une manière simple de construire G(x, ξ) consiste à distinguer les deux
régions définies par les valeurs de x ∈ [a, b] qui se situent au-dessous et au-dessus de ξ.
L’intégration de la deuxième dérivée de G(x, ξ) fournit des droites qui par application des
conditions limites donnent les deux solutions
x < ξ, G00 (x, ξ) = 0 et G(a, ξ) = 0 =⇒ G(x, ξ) = α(x − a) (7.9)
x > ξ, G00 (x, ξ) = 0 et G(b, ξ) = 0 =⇒ G(x, ξ) = β(x − b) . (7.10)
Les coefficients α et β sont à déterminer à l’aide de la condition de continuité de la fonction
de Green au point x = ξ qui donne
α(ξ − a) = β(ξ − b) (7.11)
1
Contrairement au problème (4.8), seule la solution triviale u = 0 satisfait√les conditions aux
√ limites
homogènes. En effet, l’équation u00 = λu possède la solution u(x) = A exp( λx) + B exp(− λx). Les
conditions u(a) = 0 = u(b) entraı̂nent A = 0 = B.
70
et de la propriété de la dérivée seconde de la distribution de Dirac
Z b
G00 (x, ξ)ϕ(x) dx = ϕ(ξ) .
a
Pour cette dernière équation, une intégration par parties donne la relation
Z b ¯b Z b
G00 (x, ξ)ϕ(x) dx = G0 (x, ξ)ϕ(x)¯¯ − G0 (x, ξ)ϕ0 (x) dx
a a a
où le premier terme du membre de droite s’annule pour ϕ ∈ S([a, b]). Alors, avec la
fonction de Green (7.10) dont la dérivée première vaut
(
0 α si x < ξ
G (x, ξ) =
β si x > ξ ,
ξ−b ξ−a
α= β= . (7.13)
b−a b−a
Finalement la fonction de Green (7.10) devient
( 1
b−a
(x − a)(ξ − b) si x ∈ [a, ξ)
G(x, ξ) = 1 (7.14)
b−a
(x − b)(ξ − a) si x ∈ (ξ, b]
x−aZ x x−bZ b
u(x) = (ξ − b)f (ξ) dξ + (ξ − a)f (ξ) dξ . (7.15)
b−a a b−a x
On peut aussi calculer la fonction de Green en prenant la transformée de Fourier des
deux membres de l’équation (7.6). Puis on applique les conditions limites comme ci-
dessus. Cette technique sera utilisée sytématiquement pour la résolution des équations
que nous rencontrerons plus loin. Pour l’instant, nous allons traiter le problème général
de la fonction de Green de l’opérateur de Sturm-Liouville en utilisant plus ou moins la
même démarche que ci-dessus.
71
b) Fonction de Green relative à l’opérateur (Su)(x) = −[p(x)u0 (x)]0 + q(x)u(x)
On considère le problème plus général de Sturm-Liouville défini par l’équation
Toute équation différentielle linéaire du 2ème ordre peut être mise sous cette forme. On
retrouve (4.3) pour q(x) −→ q(x) − λr(x).
Déf. 7.2 La fonction de Green relative à l’opérateur de Sturm-Liouville est la fonction
G(x, ξ) solution de l’équation
et telle que
G0 (ξ + , ξ) − G0 (ξ − , ξ) = −1/p(ξ) . (7.20)
Si l’on connait les deux solutions indépendantes y1 (x) et y2 (x) de l’équation (7.19) pour
x 6= ξ, il est possible d’écrire la fonction de Green qui satisfait aux conditions limites
La G = 0 = Lb G sous la forme
(
c1 y1 (x) x ∈ [a, ξ)
G(x, ξ) = (7.21)
c2 y2 (x) x ∈ (ξ, b] .
En effet, comme les coefficients Aj , Bj ∈ IR sont non triviaux, les conditions limites
homogènes appliquées à y1 (x), y2 (x) et G(x, ξ) fournissent les deux déterminants
c1 y1 (ξ) − c2 y2 (ξ) = 0
1
c1 y10 (ξ) − c2 y20 (ξ) = (7.22)
p(ξ)
72
qui possède une solution unique si le déterminant de Wronski2
est différent de 0. Cette condition est remplie pour autant que les solutions y1 (x) et y2 (x)
ne satisfont pas simultanément les conditions limites. La résolution du système (7.22)
fournit la fonction de Green unique
(
1 y2 (ξ)y1 (x) x ∈ [a, ξ)
G(x, ξ) = − (7.24)
p(ξ)W (ξ) y1 (ξ)y2 (x) x ∈ (ξ, b] .
A l’aide de l’équation (7.16) homogène, on vérifie facilement que p(ξ)W (ξ) est indépendant
de ξ. Finalement la solution générale de l’équation de Sturm-Liouville est donnée par
l’intégrale Z b
u(x) = G(x, ξ)f (ξ) dξ , (7.25)
a
comme on peut le voir en calculant la dérivée première et la dérivées seconde de la fonction
Z x Z b
u(x) = G(x, ξ)f (ξ) dξ + G(x, ξ)f (ξ) dξ .
a x
d 2
2
Exemple : Fonction de Green relative à l’opérateur de Sturm-Liouville −( dx 2 + k )
soumise aux conditions limites u(0) = 0 = u(`). Les solutions indépendantes satis-
faisant respectivement les conditions limites homogènes à gauche et à droite sont
y1 (x) = sin kx
y2 (x) = sin k(` − x) .
73
7.3.1 Fonction de Green relative à l’opérateur de Laplace
L’équation de Poisson3 est une équation différentielle linéaire aux dérivées partielles
où la fonction f ∈ S(IR) est donnée. Nous voulons déterminer la fonction φ(r) en tout point
de l’espace. Pour le faire, on définit la fonction de Green G(r − r0 ) relative à l’opérateur
de Laplace ∇2 par l’équation de distribution4
Alors, comme on peut le vérifier aisément, la solution de l’équation (7.28) est donnée par
l’intégrale
1 Z
Φ(r) = − G(r − r0 )f (r0 ) d3 r0 (7.30)
4π
qui peut être calculée si l’on connaı̂t G(r − r0 ). On détermine G(r − r0 ) en prenant la
transformée de Fourier de chaque membre de (7.29) pour aboutir à l’équation
∇d b
2 G(p) = −4π δ(p). (7.31)
b 4π
(ip)2 G(p) =− . (7.32)
(2π)3/2
0 4π Z ∞ 2 1 Z −1 ip|r−r0 |x
G(|r − r |) = 2π p dp 2 e (−dx)
(2π)3 0 p +1
4π Z ∞ 2 1 sin(p|r − r |)
0
= 4πp dp
(2π)3 0 p2 p|r − r0 |
Z ∞
2 sin u 2 π
= du = . (7.34)
π|r − r0 | 0 u π|r − r0 | 2
3
L’équation de Poisson ∇2 φ(r) = −4πGρ(r) relie, par exemple, le potentiel de gravitation φ(r) à la
densité de matière ρ(r) et aussi le potentiel électrostatique à la densité de charge ∇2 φ(r) = −ρ(r)/²0 .
4
Le facteur −4π est purement conventionnel. On pourrait aussi définir la fonction de Green par
l’équation ∇2 G(r − r0 ) = δ(r − r0 ).
5
Il s’agit ici de la transformée de Fourier à trois dimensions où le facteur de normalisation vaut (2π)−3/2
et où l’exposantR est donné par le produit scalaire ip · (r − r0 ).
∞
6
L’intégrale 0 sinu u du = π/2 peut être calculée (exercice) par une intégration sur un chemin décrit
par une demi-couronne dans le plan complexe.
74
D’où l’on tire la fonction de Green de l’opérateur de Laplace
1
G(|r − r0 |) = , (7.35)
|r − r0 |
déja calculée en (6.23), ainsi que la solution bien connue de l’équation de Poisson
1 Z f (r0 ) 3 0
Φ(r) = − dr . (7.36)
4π |r − r0 |
lorsqu’elle est soumise à des conditions de bord sur une surface fermée ∂V . Pour cela, on
se réfère au problème de Dirichlet7 qui consiste à trouver une solution régulière de
∇2 φ(r) = 0 (7.38)
à l’extérieur de ∂V en exigeant une valeur fixe pour φ|∂V . On peut montrer que si une
telle solution existe, elle est unique.
R α
r0
O r’0
Considérons la situation décrite par FIG. 7.1 où le point r est placé à l’extérieur de la
sphère ∂B de rayon R. On veut trouver une solution G(r − r0 ) de (7.37) qui satisfait la
condition de bord
G(R − r0 ) = 0 . (7.39)
A l’extérieur de ∂B, Dirichlet nous assure qu’il existe une solution régulière unique de
(7.38) qui, en vertu de (7.35), peut s’écrire
1
φ(r) = r00 ∈ ∂V . (7.40)
|r − r00 |
Alors, la solution de l’équation linéaire (7.37) en présence de ∂B est donnée par la com-
binaison linéaire
1 a
G(r − r0 ) = + (7.41)
|r − r0 | |r − r00 |
7
Le problème de Neumann est analogue sauf que les conditions limites sont appliquées à la dérivée de
la solution de l’équation de Laplace.
75
de coefficient a. On choisit r00 = b r0 (dans la même direction que r0 ) afin que la solution
recherchée ne dépende que des deux vecteurs r et r0 . Les constantes a et b doivent être
déterminées par la condition de bord (7.39) qui prend la forme explicite
1 R/r0
G(r − r0 ) = − . (7.45)
|r − r0 | |r − Rr22 r0 |
0
Cette solution8 peut être utilisée pour déterminer le potentiel de deux charges ponctuelles
q et q 0 . La charge q donnée est située à l’extérieur de la sphère à une distance r0 de
l’origine. La charge q 0 = −qR/r0 située à l’intérieur à une distance r00 = R2 /r0 représente
l’effet de charge global de la sphère conductrice et peut être interprétée comme une charge
ponctuelle image. On parle de la méthode des charges images qui est une démarche très
pratique pour étudier l’interaction électrostatique des systèmes constitués d’une charge
ponctuelle en présence d’un milieu matériel à géométrie simple.
8
Cette solution de l’équation (7.37) avec conditions limites permet de résoudre un problème standard
de l’électrostatique : trouver le potentiel Φ(r) d’une charge ponctuelle q située en r0 à l’extérieur d’une
sphère métallique de rayon R. La sphère conductrice est mise à terre afin de maintenir le potentiel
Φ(R) = 0 sur sa surface ∂B. Les relations (7.30) et (7.45) fournissent la solution
q 1 R/r0
Φ(r) = −
4πε0 |r − r0 | |r − Rr22 r0 |
0
q 1 R/r0
= −³ ´1/2
4πε0 (r2 + r − 2rr0 cos α)1/2
2 R4 2
0 r2 + r02
− 2 Rr0 r cos α
telle que Φ(R) = 0. La connaissance du potentiel Φ(r) est l’élément déterminant pour calculer les autres
grandeurs physiques. On pourrait, par exemple, calculer le champ électrique E = −∇Φ ainsi que la force
de Coulomb F = eE. On peut aussi déterminer la charge de polarisation ω induite sur la sphère. En effet,
la condition de continuité du déplacement électrique D au bord ∂B est donnée par (D1 − D2 ) · n = 0
où n est la normale extérieur à la sphère ∂B. Comme D1 = 0 à l’intérieur d’une sphère métalique, on
obtient la relation D2 · n = (ε0 E + P) · n = 0 où P est la polarisation. Alors, la charge de polarisation ω
induite sur la sphère vaut
∂Φ ¯¯ q R (1 − R2 /r02 )
ω ≡ −P · n|R = ε0 E · n|R = −ε0 ¯ =− 2 ³ ´3/2 .
∂r R 4πR r0 R 2 R
1 + ( r0 ) − 2 r0 cos α
76
7.3.3 Fonction de Green de l’équation de Helmholtz
L’équation de Helmholtz qui décrit la diffusion quantique de particules s’écrit
h i
∇2 + k 2 − W (r) ψ(r) = 0 . (7.46)
Les grandeurs k et W (r) sont données9 . L’équation (7.46) peut aussi prendre la forme
h i
∇2 + k 2 ψ(r) = W (r)ψ(r) . (7.47)
1 Z 3 eip·(r−r )
0
0
G(|r − r |) = dp 2 . (7.52)
(2π)3 k − p2
Cette intégrale n’existe que pour des domaines de définition qu’il convient de préciser. On
peut d’abord procéder à l’intégration sur les angles. Pour l’intégration de la partie angu-
laire d3 p = p2 dpdΩ = p2 sin ϑdpdϑdϕ, on choisit l’orientation du système de coordonnées
de telle manière que l’angle entre p et R = (r−r0 ) corresponde à l’angle ϑ des coordonnées
sphériques. Pour le faire, il suffit de choisir la coordonnée d’intégration pz k R. Le calcul
donne Z +∞
1 eipR
G(R) = dp p . (7.53)
(2π)2 iR −∞ k2 − p2
L’intégrant ci-dessus possède deux pôles en
p = ±k .
9
Dans le cas de l’équation de la diffusion quantique, on introduit l’énergie E et le potentiel V (r) par
les relations k 2 = 2mE/h̄2 et W (r) = 2mV (r)/h̄2 .
10
L’opérateur ∇2 + k 2 possède un inverse qui n’est pas borné. En vertu de la définition (3.32), il
représente l’exemple type d’un opérateur à spectre continu.
77
On évite ces pôles en passant d’une intégrale sur l’axe réel à une intégrale sur un chemin
fermé dans le plan complexe grâce au lemme de Jordan11 . On doit distinguer les quatre
choix de chemins illustrés sur FIG. 7.2. Alors le théorème des résidus12 donne (exercice)
G1 (R) = 0 (7.54)
1 h i
G2 (R) = − eikR + e−ikR (7.55)
4πR
1
G3 (R) = − e−ikR (7.56)
4πR
1
G4 (R) = − e+ikR . (7.57)
4πR
On pourrait aussi considérer la valeur principale
" #
1 1 Z −k−² p eipR Z +k−²
p eipR Z +∞
p eipR
P [G] = lim dp 2 + dp 2 + dp 2 . (7.58)
²→0 4π iR −∞ k − p2 −k+² k − p2 +k+² k − p2
Ce choix n’apporte rien de nouveau puisqu’il correspond à une combinaison des chemins
3) et 4).
. . . . . . . .
1) 2) 3) 4)
Le choix d’un chemin d’intégration doit être fixé. En théorie de la diffusion quantique, on
exige par exemple que la grandeur 1i (ψ ∗ ∇ψ − ψ∇ψ ∗ ) qui définit le courant de probabilité
11
Lemme de Jordan :
Soit f (z) une fonction complexe telle que |f (z)| −→ 0 pour |z| −→ ∞. Alors
Z
dz eiλz f (z) −→ 0 pour R → ∞ et λ > 0
∩
Z
dz eiλz f (z) −→ 0 pour R → ∞ et λ < 0
∪
où R est le rayon des demi-cercles ∩ et ∪ qui sont tracés respectivement dans le plan complexe supérieur
si λ > 0 et dans le plan complexe inférieur si λ < 0.
12
Théorème des résidus :
Pour une fonction f (z) méromorphe, on a
I X
f (z)dz = 2πi Resf
si l’on parcourt le chemin d’intégration dans le sens inverse des aiguilles d’une montre. Dans le cas où la
fonction f (z) possède une pôle simple en z = z0 , le résidu est donné par la limite
78
soit de signe positif. Cette condition d’onde sortante impose le chemin 4) et par conséquent
la fonction de Green
1
G4 (R) ≡ G+ (R) = − eikR . (7.59)
4πR
Alors, l’équation intégrale (7.49), appelée équation de Lippmann-Schwinger, s’écrit
1 Z 3 0 eik|r−r |
0
+
ψ (r) = ψ0 (r) − dr 0
W (r0 )ψ + (r0 ) . (7.60)
4π |r − r |
p = ±(k + i²0 )
où le choix du chemin d’intégration est parfaitement défini. On peut aussi définir l’opérateur
de Green
1
G+ = lim+ 2 (7.63)
²→0 (k − h0 + i²)
Son application sur le ket |r0 i et l’utilisation de la relation de fermeture fournissent (exer-
cice) la fonction de Green
Z 0
+ 0 1 + 0 3 eip·(r−r )
G (r − r ) ≡ hr|G |r i = lim d p (7.65)
(2π)3 ²→0+ k 2 − p2 + i²
On peut effectuer le même calcul dans l’espace |pi pour obtenir la fonction de Green
+ 0 hp|p0 i
+ 0
G (p − p ) ≡ hp|G |p i = lim+ 2 (7.67)
²→0 k − p02 + i²
79
7.3.4 Fonctions de Green relative à l’opérateur de d’Alembert
En électrodynamique, le potentiel scalaire Φ(r, t) obéit à l’équation de d’Alembert
1 ∂2
2 = ∇2 − . (7.69)
c2 ∂t2
La fonction de Green G(r − r0 ) relative à l’opérateur 2 est définie par l’équation
comme on le vérifie facilement par simple substitution dans (7.68). Grâce à la linéarité de
(7.70), on détermine G en prenant les transformées de Fourier de chacun des membres de
l’équation, pour aboutir à
d
2G(p, b
ω) = −4π δ(p) b
δ(ω). (7.72)
À l’aide de la formule (5.12) de la transformée de Fourier d’une dérivée, on obtient la
relation
ω2 b 1 1
i2 (p2 − 2 )G(p, ω) = −4π 3/2
√ (7.73)
c (2π) 2π
qui fournit la fonction de Green dans l’espace p
b c2 1
G(p, ω) = − (7.74)
π ω − c2 p2
2
0 01 Z 3 Z b 0 0
G(r − r , t − t ) = 2
d p dω G(p, ω)eip·(r−r ) e−iω(t−t ) . (7.75)
(2π)
Pour des raisons conventionnelles, on choisit le signe moins pour la transformée de Fourier
sur ω et l’on écrit
c2 Z 3 ip·(r−r0 ) Z +∞
0
0 0 e−iω(t−t )
G(r − r , t − t ) = − 3 d p e dω 2
4π −∞ ω − c2 p2
c2 Z 0
= − 3 d3 p eip·(r−r ) I(p) . (7.76)
4π
L’intégrant de I(p) possède des pôles en ω = ±cp et n’est par conséquent pas continu
en tout point de l’axe réel. On peut éviter les pôles en considérant différents chemins
d’intégration que l’on choisit en appliquant les conditions causales ou des conditions limites
fixées par le système physique. Pour calculer les intégrales sur les différents chemins qui
évitent les pôles, on doit passer à une intégrale équivalente dans le plan complexe. Cette
80
opération peut être effectuée grâce au lemme de Jordan13 qui permet de transformer
l’intégrale sur l’axe réel ω en une intégrale équivalente, fermée dans le plan complexe.
Pour l’intégrant de I(p) (7.76) qui possède des pôles en ω = ±cp, FIG. 7.3 illustre deux
choix de contournement des pôle et les deux possibilités de fermer le chemin suivant le
signe de (t − t0 ). Les intégrales dans le plan complexe sont calculées à l’aide du théorème
des résidus14 qui fournit les valeurs :
– si l’on évite les pôles par la gauche comme en a)
0 ½ ¾ pour (t − t0 ) < 0
I(p) = P e−iω(t−t )
0
−2πi ω=±cp Res ω 2 −c2 p2
pour (t − t0 ) > 0 .
(t−t’)<0
. . a)
. .
−cp +cp (t−t’)<0
b)
(t−t’)>0
Il existe d’autres choix possible que nous ne voulons pas considérer ici. Dans l’expression
(7.76) de la fonction de Green, l’intégrant a deux pôles en ω = ±pc. Alors, dans le cas du
chemin a), on obtient
" 0 0 #
(ω − pc)e−iω(t−t )
0 (ω + pc)e−iω(t−t )
I(p) = −2πiθ(t − t ) lim + lim
ω→pc ω 2 − p2 c2 ω→−pc ω 2 − p2 c2
" 0 0 #
e−ipc(t−t ) eipc(t−t )
0
= −2πiθ(t − t ) +
2pc −2pc
0
sin [pc(t − t )]
= −2π θ(t − t0 ) , (7.77)
pc
où θ(x) est la fonction de Heaviside. De même, pour le cas b), on obtient
sin[pc(t − t0 )]
I(p) = 2π θ(t0 − t) . (7.78)
pc
13
Voir note de bas de page11
14
Voir note de bas de page12
81
Pour effectuer l’intégration d3 p de (7.76), on place naturellement l’axe d’intégration pz
parallèle à (r − r0 ) de telle manière que l’angle entre p et r − r0 correspond à l’angle ϑ des
coordonnées sphériques. Alors pour le cas (7.77), le calcul donne
−c2 Z ∞ 2
Z π
0
G = 3
2πdp p dϑ sin ϑ eip|r−r | cos ϑ I(p)
4π 0 0
Z ∞ h i
−c2 1 ip|r−r0 | −ip|r−r0 |
= dp p e − e I(p)
2π 2 i|r − r0 | 0
cθ(t − t0 ) Z ∞
= dp 2i sin [p|r − r0 |] sin [pc(t − t0 )]
iπ|r − r0 | 0
cθ(t − t0 ) Z ∞ h 0 0 0 0
i
= dp cos p [|r − r | − c(t − t )] − cos p [|r − r | + c(t − t )] .
π|r − r0 | 0
cθ(t − t0 ) h ³ 0 0
´ ³
0 0
´i
G= δ |r − r | − c(t − t ) − δ |r − r | + c(t − t ) . (7.80)
|r − r0 |
On a utilisé la propriété δ(ax) = δ(x)/|a| et le fait que la distribution de Dirac est nulle
pour un argument strictement positif. Le cas b) en découle immédiatement, il suffit de
remplacer t − t0 par t0 − t pour obtenir la fonction de Green avancée. Avec la fonction
de Green (7.81), l’intégration de (7.71) sur dt0 est immédiate et la solution retardée de
l’équation de d’Alembert s’écrit
à !
1 Z 3 0 1 0 |r − r0 |
Φret (r, t) = dr ρ r ,t − . (7.82)
4π²0 |r − r0 | c
Sa forme est la même que dans le cas statique (7.36), mais avec un temps t − |r − r0 |/c
de la source retardé par rapport au temps t de la mesure du champ.
82
Chapitre 8
Exemples : Fonctionnelles
a) Aux chemins possibles entre deux points dans le plan, on fait correspondre la
fonctionnelle distance de A à B donnée par l’application
Z B
y 7−→ D[y] = ds (8.2)
A
√
où ds = dx2 + dy 2 . A l’aide de la différentielle dy = y 0 (x)dx, elle peut aussi s’écrire
Z Bq Z xB q
D[y] = dx2 + dy 2 = 1 + y 02 (x) dx. (8.3)
A xA
Cette fonctionnelle fait correspondre à toute courbe y(x) la distance qu’elle parcourt
entre les points A et B dans le plan xy.
b) Aux trajectoires possibles, entre A et B, d’une masse m soumise à la pesanteur, on
fait correspondre le temps nécessaire pour parcourir la trajectoire y(x). Ce temps
est fourni par la fonctionnelle Z B
ds
T [y] = (8.4)
A v
√
où ds = dx2 + dy 2 et la vitesse v est donnée par la relation d’énergie mv 2 /2 = mgy.
La détermination de la trajectoire parcourue dans un temps minimal a été à l’origine
du calcul des variations2 .
1
Pour bien manifester le caractère de la fonctionnelle, on note l’argument entre des crochets.
2
Le problème du brachistochrone fut posé par Johann Bernoulli en 1696.
83
c) Aux courbes possibles tendues entre deux cercles de rayon a et b centrés en 0 et x0
respectivement, on fait correspondre la fonctionnelle de surface de révolution
Z x0
S[y] = 2π y(x) ds . (8.5)
0
1Z B
T [r] = n(r)ds (8.6)
c A
où c est la vitesse de la lumière. Quelle est la trajectoire exigeant le temps minimal ?
e) Aux trajectoires possibles d’un système de points matériels en interaction, on fait
correspondre la fonctionnelle d’action
Z t2
S[q] = L(q1 , · · · , qn , q̇1 , · · · , q̇n , t) dt (8.7)
t1
Comment déterminer les fonctions y(x), r(t), q(t) qui fournissent la distance minimale,
le temps minimal, la surface minimale ou l’action minimale ? Dans le cas du chemin entre
deux points dans le plan la réponse est connue, puisque l’on sait, par expérience, que le
plus court chemin est donné par la droite qui les joint. Il n’en est plus de même si l’on
pose la question pour un chemin sur la surface d’une sphère ou sur toute autre surface non
plane. Beaucoup de phénomènes physiques résultent de situations extrémales. Dans le cas
où la grandeur à optimaliser est représentée par une fonction f (x), le point x0 donnant
l’extremum de la fonction est fourni par la solution de l’équation
df
(x0 ) = 0 . (8.8)
dx
Si la grandeur à optimiser est représentée par une fonctionnelle, nous devons déterminer
la dérivée de la fonctionnelle F ou sa variation. A l’extremum, elle fournira non pas un
point, mais une fonction ou plutôt une équation différentielle dont la solution est cette
fonction. Comment définir la différentielle ou la dérivée d’une fonctionnelle ? On le fait par
le calcul des variations qui est le calcul différentiel sur des espaces fonctionnels. Dans ce
cas, on peut dire en mots simples que les variables sont des fonctions et que les fonctions
sont remplacées par des fonctionnelles3 .
3
Dans le même esprit, on définit les intégrales fonctionnelles ou intégrales de chemin
Z
Z= F [f ] Df
E
où l’intégrant est une fonctionnelle et la somme est prise sur des fonctions et non sur des nombres réels
(ou complexes) comme pour les intégrales ordinaires. Cette intégrale ne doit pas être confondue avec
l’intégrale curviligne qui est définie sur une courbe dans l’espace.
84
8.2 Variation par rapport à un paramètre
Dans une première approche du problème, nous simplifions l’analyse en ramenant la
variation à la dérivée d’une fonction par rapport à un paramètre. Pour cela, on rem-
place l’espace des fonctions par une famille de fonctions f (x, ²) x ∈ [x1 , x2 ] indicées
continûment par le paramètre ² ∈ IR et telles que f (x, 0) = f (x). De plus, on prend des
fonctions dont les valeurs sont indépendantes de ² aux extrémités de l’intervalle, à savoir
pour tout ². Un exemple d’une telle famille est fourni par la famille de paraboles
f(x,ε)
f(x,0) = f(x)
x1 x2
Il faut bien réaliser que la variation δf traduit un changement de fonction prise dans la
famille et non pas une différence infinitésimale dans l’intervalle des x qui donnerait lieu
à la différentielle df = f 0 (x)dx. On peut passer maintenant à une application importante
du calcul des variations : la détermination du minimum (extremum) de la fonctionnelle
Z x2
I[y] = g(y, y 0 , x)dx (8.13)
x1
δI = 0 (8.14)
4
En toute précision, on devrait ajouter le reste R(²) ∼ O(²) qui tend vers zéro pour ² → 0.
85
si la deuxième variation est positive. Pour le calcul de δI, on considère la famille de
fonctions y(x, ²) et l’on utilise la définition (8.12) de la variation. L’application de la règle
de dérivation en chaı̂ne donne
Z x2 Z t2 ¯
Z x2 " #
dg ¯ ∂g ∂y ∂g ∂y 0
δI = dx δg = dx ¯¯ ² = dx + 0 ². (8.15)
x1 t1 d² ¯²=0 x1 ∂y ∂² ∂y ∂² ²=0
∂g
g − y0 = const . (8.20)
∂y 0
Réciproquement, les équations d’Euler-Lagrange impliquent δI = 0. Il suffit pour cela de
remonter le calcul à partir de (8.19). L’action est donnée par la fonctionnelle
Z t2
S[q] = L(q1 , · · · , qn , q̇1 , · · · , q̇n , t) dt (8.21)
t1
où L est la fonction de Lagrange qui dépend des coordonnées généralisées, des vitesses
généralisées et du temps. Les équations de Lagrange résultant de la variation s’écrivent
d ∂L ∂L
− =0 j = 1, · · · , n . (8.22)
dt ∂ q̇j ∂qj
5
Rb
Lemme fondamental du calcul des variations. Soit f : [a, b] − 7 → IR continue et a f (x)η(x)dx = 0
pour tout η de classe C 1 satisfaisant η(a) = 0 = η(b). Alors on a f (x) = 0 pour tout x .
86
Exemples : Courbes optimales
a) Brachistochrone
Comme on l’a vu en (8.4), le temps utilisé par un point matériel soumis à la gravi-
tation pour parcourir une courbe dans le plan vertical est donné par la fonctionnelle
Z B s
ds 1 Z xB 1 + y 02
T [y] = =√ dx (8.23)
A v 2g xA y
dont l’extremum fournit la courbe optimale. Comme l’intégrant ne dépend pas expli-
citement de x, on peut en vertu de (8.20) remplacer l’équation d’Euler par l’équation
s s
1 + y 02 ∂ 1 + y 02
− y0 =C (8.24)
y ∂y 0 y
qui peut aussi s’écrire
dx2 (1 − C 2 y) = C 2 y dy 2 . (8.25)
On vérifie (exercice) que la solution est donnée par les équations de la cycloı̈de
x = a(ϕ − sin ϕ)
1
y = a(1 − cos ϕ) a= . (8.26)
2C 2
qui est représentée sur FIG. 8.2.
A
x
y 1
0
2a
0
y B
Il est intéressant de voir que le temps de parcours sur la cycloı̈de est indépendant du
point y0 d’où le mobile est lâché à vitesse nulle. En effet, en utilisant la différentielle
dx = x0 dy et la dérivée de l’inverse x0 = 1/y 0 , on peut exprimer l’intégrale relative-
ment à dy v
Z yB uu x02 + 1
T = t dy . (8.27)
y0 2g(y − y0 )
De (8.25), on déduit la relation
y
x02 = . (8.28)
2a − y
Alors, avec yB = 2a, on obtient l’intégrale
s
a Z 2a dy
T = q . (8.29)
g y0 (y − y0 )(2a − y)
87
Les changements de variables
u
w= u = 2a − y u0 = 2a − y0 (8.30)
u0
conduisent finalement à une intégrale indépendante de y0
s
aZ 1 dw
T = q . (8.31)
g 0 (1 − w)w
b) Principe de Fermat
Dans un milieu d’indice de réfraction n(r), la lumière parcourt le chemin de A à B
dans un temps minimal. La fonctionnelle à minimaliser est donnée par l’expression
Z B
ds c
T = v= (8.32)
A v(r) n(r)
d dr
[n(r) σ] = ∇n(r) σ= . (8.34)
ds ds
On peut aussi considérer la situation particulière de deux milieux d’indices de
réfraction constants nA et nB , séparés par un plan. Dans ce cas, les chemins parcou-
rus par les rayons incidents et réfractés sont des droites de pentes aA = yA /(xA − x0 )
et aB = yB /(xB − x0 ) respectivement et la fonctionnelle temps (8.32) devient une
fonction du point d’incidence x0
nA Z x0 q 2 n B Z xB q
T (x0 ) = 1 + aA dx + 1 + a2B dx
c xA c x0
nA q nB q
= (x0 − xA )2 + yA2 − (x0 − xB )2 + yB2 . (8.35)
c c
Du minimum donné par la condition
dT
(x0 ) = 0 , (8.36)
dx
on en déduit la loi de la réfraction
sin αA nB
= . (8.37)
sin αB nA
En considérant les rayons incidents et réfléchis, on déduit de même la loi de la
réflexion
αA = αA0 . (8.38)
88
8.3 Variations avec conditions
Parmi les différents problèmes soumis à des conditions supplémentaires, nous allons
discuter les deux situations particulières suivantes :
a) extrémalisation soumise à une contrainte,
b) extrémalisation avec bornes variables.
89
R
soumise aux conditions xx12 ds = ` et y(x1 ) = 0 = y(x2 ). Alors, l’équation d’Euler
(8.42) relative à la fonction
q
E(y, y 0 ) = y + λ 1 + y 02 (8.44)
s’écrit
d y0
1−λ √ = 0. (8.45)
dx 1 + y 02
On en déduit l’équation
(x + C)2 + (y + C 0 )2 = λ2 (8.46)
où C et C 0 sont les constantes d’intégration. L’équation (8.46) décrit des cercles de
rayon λ tels que celui représenté sur FIG. 8.3
x1 x2 x
Fig. 8.3 – Cercle de rayon λ
b) Fil pesant
On considère un fil homogène obéissant au principe de la statique. On veut déter-
miner la courbe de longueur ` donnée, passant par deux points et dont le centre de
gravité est le plus bas possible. Il s’agit donc de trouver l’extremum de la fonction-
nelle centre de gravité
1 Z x2
G[y] = y ds (8.47)
` x1
R
soumise aux conditions xx12 ds = ` et y(x1 ) = 0 = y(x2 ). La solution (exercice) est
donnée par l’équation de la chaı̂nette.
obéissant aux conditions y(x1 ) = y1 et y(x2 ) sur la courbe ψ(x) donnée. Pour y(x) solution
de l’équation d’Euler, on peut écrire la variation
Z x2 " #
∂F d ∂F ∂F ¯¯x2 ∂I[y]
δI[y] = dx − δy + δy ¯ + δx2 (8.49)
x1 ∂y dx ∂y 0 ∂y 0 x1 ∂x2
où δy s’annule en x1 mais pas en x2 car
∂I[y]
= F (y2 , y20 , x2 ) .
∂x2
90
L’intégrale de (8.49) est nulle puisque y(x) est une solution de l’équation d’Euler. De plus,
comme l’extrémité x2 est variable, on a la variation
dy(x2 , ²) ¯¯
δy2 = ¯ ²
d² ²=0
∂y ∂x2 ¯¯ ∂y ¯¯
= ¯ ²+ ¯ ²
∂x2 ∂² ²=0 ∂² ²=0
dy
= δx2 + δy(x2 ) = y 0 (x2 )δx2 + δy(x2 ) . (8.50)
dx2
Il faut faire la disctinction entre la variation δy2 de l’extrémité y2 et la variation δy(x2 )
de y prise au point x2 . On en déduit l’équation de l’extremum
∂F
δI[y] = δy(x2 ) + F δx2
∂y 0
∂F
= (δy2 − y 0 δx2 ) + F δx2
∂y 0
à !
∂F 0 ∂F
= δy2 + F − y 0 δx2 = 0 (8.51)
∂y 0 ∂y
où toutes les fonctions sont prises au point x2 . Ainsi, dans le cas d’une seule extrémité
fixe, en plus de l’équation d’Euler, on a la condition de transversalité
à !
∂F ∂F
0
δy2 + F − y 0 0 δx2 = 0 . (8.52)
∂y ∂y
Pour une fonction y(x) = ψ(x) en x2 , la variation
dψ ¯¯
δy2 = ¯ δx2
dx x2
fournit la condition " #
0 ∂F 0
F − (y − ψ ) 0 =0. (8.53)
∂y x=x2
Résoudre un problème à extrémité libre revient donc à résoudre l’équation d’Euler et à
utiliser la condition de transversalité (8.53) et les conditions limites pour déterminer le
point x2 et les constantes d’intégration.
91
soumise à la condition de transversalité (8.53) au point x2
q y 02 y0 a
1 + y 02 − √ + √ =0. (8.57)
1 + y 02 1 + y 02
On en déduit que y 0 (x2 ) = −1/a et que par conséquent la droite y(x) est perpendi-
culaire à ψ(x) en x2 , puisque sa pente est égale à −1/a. Les constantes d’intégration
et le point x2 sont déterminés à l’aide des conditions limites et de la condition de
transversalité.
92
Exemples : Dérivées fonctionnelles
Pour des fonctions f définies sur un intervalle I, nous calculons les dérivées de différentes
fonctionnelles rencontrées en physique. Les calculs sont effectués de manière formelle. La
fonction O(h) est soumise à la condition habituelle limkhk→0 O(h)/khk = 0.
a) F [f ] = f (x)
Pour la fonctionnelle identité, la définition de la variation
Z
δF
f (x) + h(x) − f (x) − (y) h(y) dy = O(h)
I δf
donne l’égalité valable pour tout h
Z Z
δF
(y) h(y) dy = h(x) = δ(x − y)h(y)dy + O(h)
I δf I
93
montrent que la dérivée fonctionnelle de F est égale à la dérivée partielle de la
fonction F.
δF ∂F
(y) = (y) . (8.63)
δf ∂f
R
d) F [f ] = I V (f (y)) dy
La définition de la variation et un développement limité de V
Z Z Z
δF
V ((f + h)(y))dy − V (f (y))dy − (y) h(y)dy =
I I I δf
Z Z Z Z
0 δF
V (f (y))dy + V (f (y))h(y)dy − V (f (y))dy − (y)h(y)dy = O(h)
I I I I δf
donnent l’égalité valable pour tout h
Z Z
δF
(y) h(y) dy = V 0 (f (y))h(y) dy
I δf I
R 2
e) F [f ] = I (df /dy) dy
La définition de la variation
Z ³ Z Z
d(f + h) ´2 df 2 δF
dy − ( ) dy − (y) h(y) dy| =
I dy I dy I δf
Z Z Z
df df dh dh
( )2 dy + 2 dy + ( )2 dy
I dy I dy dy I dy
Z Z
df δF
− ( )2 dy − (y) h(y) dy = O(h)
I dy I δf
conduit à l’expression
Z Z Z " #
δF df dh d df d2 f
(y) h(y) dy = 2 dy = 2 dy ( h) − 2 h ,
I δf I dy dy I dy dy dy
où l’on a effectué une intégration par parties et où l’on admet que h s’annule aux
bornes de l’intervalle I. De cette égalité valable pour tout h, on tire la dérivée
fonctionnelle
δF d2 f
(y) = −2 2 (y) . (8.65)
δf dy
R 2 2
f) F [f ] = I (d f /dy ) Φ(y) dy
La définition de la variation
Z Z 2 Z
d2 (f + h) df δF
2
Φ(y) dy − 2
Φ(y) dy − (y) h(y) dy =
I dy I dy I δf
Z 2 Z 2 Z 2 Z
df dh df δF
2
Φ(y) dy + 2
Φ(y) dy − 2
Φ(y) dy − (y) h(y) dy = O(h)
I dy I dy I dy I δf
94
conduit à l’expression
Z Z 2 Z " #
δF dh d dh d dΦ d2 Φ
(y) h(y) dy = Φ(y) dy = dy (Φ ) − ( h) + h ,
I δf I dy 2 I dy dy dy dy dy 2
où l’on a effectué deux intégrations par parties et où l’on admet que h s’annule aux
bornes de l’intervalle I. De cette égalité valable pour tout h, on déduit la dérivée
fonctionnelle
δF d2 Φ(y)
(y) = . (8.66)
δf dy 2
R ³ ´
g) F [f ] = I L f, df /dy, y dy
conduisent à l’expression
Z Z Z
δF ∂L ∂L dh(y)
(y) h(y) dy = h(y) dy + dy
I δf I ∂f I ∂(df /dy) dy
Z Z " #
∂L d ³ ∂L ´ d ³ ∂L ´
= dy h + dy h − h .
I ∂f I dy ∂(df /dy) dy ∂(df /dy)
où l’on a effectué une intégration par parties et où l’on admet que h s’annule aux
bornes de l’intervalle I. De cette égalité valable pour tout h, on en déduit la dérivée
fonctionnelle
δF ∂L d h ∂L i
(y) = − . (8.67)
δf ∂f dy ∂(df /dy)
En égalant à zéro cette dernière dérivée fonctionnelle, on retrouve évidemment
l’équation d’Euler.
95
Chapitre 9
Appendices
A Convergence ponctuelle
et convergence en moyenne
Nous donnons ci-dessous deux exemples de suites qui montrent la différence qu’il y a
entre la convergence ponctuelle et la convergence en moyenne.
a) La suite fn (x) = xn de fonctions f ∈ C([0, 1]) a la limite suivante :
(
n 0 0≤x<1
lim x =
n→∞ 1 x=1
i
B Une idée de l’intégrale de Lebesgue
Pour une fonction f intégrable au sens de Riemann dans [a, b], la fonction définie par
Z x
F (x) = f (s)ds x ∈ [a, b] . (B.1)
a
n’est pas nécessairement dérivable et n’est donc plus une primitive, comme le veut le
théorème fondamental du calcul différentiel et intégral1 . Une situation est claire : toute
fonction f continue sur [a, b] possède une primitive. Par contre, pour les fonctions discon-
tinues, les choses se compliquent et il n’est pas facile d’obtenir un critère pour caractériser
une fonction f qui possède une primitive.
D’autre part, il existe des fonctions F qui sont dérivables, mais dont la dérivée F 0 (x)
n’est pas intégrable au sens de Riemann. Cette situation ambigüe doit être corrigée. Avec
la notion de fonction mesurable (c’est une propriété que possèdent pratiquement toutes
les fonctions que l’on rencontre habituellement), l’intégrale de Lebesgue permet, entre
autre, de résoudre ce problème. L’intégrale de Lebesgue permet aussi, sous des conditons
simples et naturelles, d’échanger limite et intégrale, d’intégrer une série terme à terme ou
de démontrer le théorème de la convergence dominée de manière simple.
Par les illustrations ci-dessous, on peut donner une interprétation très élémentaire des
intégrales de Riemann et de Lebesgue
a) Intégrale de Riemann
Pour f : [a, b] −→ IR continue, l’intégrale de Riemann est décrite par FIG. B.1 où
la somme est donnée par l’expression
n
X Z b
f (x0k )(xk − xk−1 ) −→ f (x) dx (B.2)
k=1 a
f(x)
x’1
x
a x x x b
1 2 3
1
Voir par exemple : Cours d’Analyse de S.D. Chatterji.
ii
b) Intégrale de Lebesgue
La présentation de l’intégrale de Lebesgue requiert une bonne connaissance de la
théorie de la mesure. Dans ce qui suit nous n’abordons que quelques éléments qua-
litatifs afin de donner une petite idée de cette notion d’intégration.
Pour f : [a, b] −→ IR mesurable (en mots qualitatifs, qui peut être approchée par des
fonctions simples), l’intégrale de Lebesgue est décrite par FIG. B.2 où la fonction f
est partitionnée de la manière suivante :
f(x)
fk
f
0
x
a b
Fig. B.2 – Lebesgue : partition de la fonction f
³ ´
La mesure µ x : fk−1 ≤ f (x) ≤ fk est donnée par la somme des longueurs des sous-
intervalles de [a, b] pour lesquels fk−1 ≤ f (x) ≤ fk . Comme on le voit, l’intégrale
de Lebesgue repose sur la connaissance des espaces mesurables et des fonctions
mesurables. Enfin, comme on l’a déjà mentionné, l’intégrale de Lebesgue permet de
considérer des fonctions dérivables dont la dérivée n’est pas intégrable au sens de
Riemann ou des fonctions comme
(
1 x rationnel
f (x) = .
0 x irrationnel
R
Pour ce dernier cas, on obtient f (x) dµ(x) = µ( Q) l = 0, puisque Q
l dénombrable
et donc de mesure nulle. On dit qu’une propriété est valable presque partout si
l’ensemble des points où elle est fausse est de mesure nulle.
iii
C Phénomène de Gibbs
L’approximation de la fonction
(
−1 −π ≤ x < 0
f (x) =
1 0≤x≤π
donne les résultats numériques décrits par FIG. C.3. Les effets de bord qui se produisent à
proximité des points de discontinuité {0, ±π}, nettement visibles pour S99 (x), sont connus
sous le nom de phénomène de Gibbs.
iv
Chapitre 10
Annexe : exercices
1. Soit V un espace vectoriel de dimension n. Montrer que toute forme linéaire f sur
V est donnée par le produit scalaire
f (v) = (v, u)
où u ∈ V est uniquement déterminé par f . En déduire que les composantes cova-
riantes du vecteur u ∈ V sont données par
xj = (ej , u) .
Calculer les composantes gjk dans le cas où les q j sont les coordonnées sphériques.
1
5. Dans IR2 , on considère le changement de base
e01 = e1 + 2e2
e01 = e1 − 2e2
n o
6. Montrer que les vecteurs ej ⊗ ek forment une base de l’espace vectoriel V ∗ ⊗ V ∗ .
7. a) Sur IR3 , vérifier que les composantes Tjk d’un tenseur antisymétrique peuvent
s’écrire à l’aide du pseudovecteur
1
T̃ j = ²jkl Tkl .
2
b) On considère le moment cinétique d’un corps rigide Lj = Θj k ωk . Si le moment
cinétique L et la vitesse angulaire ω sont des vecteurs, montrer que le moment
d’inertie Θ est un tenseur mixte d’ordre 2.
det(ej , ek ) 6= 0 .
(x, y) = x1 y 1 − x1 y 2 − x2 y 1 + 4x2 y 2 .
2
10. a) Vérifier que les expressions suivantes sont des produits scalaires :
P∞ ∗
1) (u, v) = j=0 ξj ηj u, v ∈ l2
Rb
2) (f, g) = a f (x)∗ g(x) dx f, g ∈ L2 ([a, b])
³ ´
3) [u1 , u2 ], [v1 , v2 ] = (u1 , v1 )G + (u2 , v2 )G
G×G
où (u, v)G est le produit scalaire dans G.
b) Montrer que le produit scalaire est une fonction continue.
n o
14. A partir de la suite 1, x, x2 , . . . d’éléments de L2 (X, r) déterminer, à l’aide du
procédé d’orthonormalisation de Gram-Schmidt,
a) les l = 0, 1, 2, 3 polynômes de Legendre Pl (x) dans l’intervalle X = [−1, 1] et
avec r(x) = 1. La normalisation conventionnelle est donnée par
Z +1
2
Pl (x)Pl0 (x) dx = δll0 ,
−1 2l + 1
b) les n = 0, 1, 2, 3 polynômes d’Hermite Hn (x) dans l’intervalle X = IR et avec
r(x) = exp [−x2 ]. La normalisation conventionnelle est donnée par
Z +∞ √
2
Hm (x)Hn (x)e−x dx = π 2n n! δmn .
−∞
3
15. Développer en série de Legendre la fonction
(
0 −1 ≤ x < 0
f (x) =
1 0≤x≤1
et calculer les coefficients du développement pour les valeurs l = 0, 1, 2, 3.
16. Pour des fonctions f ∈ L2 ([a, b]), écrire la base complexe, la relation d’orthonorma-
lité, la série de Fourier et les coefficients de Fourier.
20. Une corde vibrante de longueur l, fixée à ses extrémités, obéit à l’équation
∂ 2y 1 ∂ 2y
− =0.
∂x2 c2 ∂t2
Calculer la solution dans les trois cas de conditions initiales suivantes :
1) y(x, 0) = A sin nπ
l
x ∂t y|t=0 = 0
2) y(x, 0) = f (x) ∂t y|t=0 = 0
3) y(x, 0) = 0 ∂t y|t=0 = g(x) .
4
21. Sur une plaque métallique carrée de côté a, déterminer la distribution stationnaire
de la température T (x, y) si l’un des bords est à 100◦ et les trois autres à 0◦ .
22. Une poutre de longueur L et de rigidité α repose sur un support à chacune de ses
extrémités. Sa déformation y(x) produite par une répartition de charge q(x) est
donnée par l’équation
d4 y 1
4
= q(x) .
dx α
a) A l’aide d’un développement de Fourier en sinus, déterminer la déformation y(x)
lorsque la répartition de charge q est uniforme sur la poutre.
b) Calculer la déformation pour x = L/2 .
P
24. a) Pour cj ∈ Cl et {e0 , e1 , e2 , · · ·} une base de Hilbert, montrer que ∞j=0 cj ej est
P
convergente si et seulement si ∞ |c
j=0 j | 2
est convergente.
b) Si Φ est une fonctionnelle linéaire continue, montrer, à l’aide de a), qu’il existe
un vecteur ∞
X
h= Φ(ej )∗ ej
j=0
25. a) Montrer que l’adjoint T † d’un opérateur linéaire borné T est linéaire et borné.
b) Montrer que l’opérateur linéaire U défini sur D(U ) = H est unitaire si et seule-
ment si U U † = U † U = I.
d
26. On considère l’opérateur d’impulsion (P u)(x) = −i dx u(x) défini sur le domaine
.
D(P ) = {u ∈ L2 ([a, ∞)) u continu, u0 ∈ L2 , u(a) = 0} .
Vérifier que P est symétrique, déterminer D(P † ) et déduire que D(P ) ⊂ D(P † ).
5
27. Soit l’opérateur linéaire T : IR2 −→ IR2 qui dans la base othonormale {e1 , e2 } est
représenté par la matrice symétrique
" #
5 −2
T= .
−2 2
a) Exprimer la base {f1 , f2 } des vecteurs propres de T en fonction de la base {e1 , e2 }
2
X
fj = αjk ek .
k=1
h i
b) Vérifier que la matrice D = (ej , fk ) est orthogonale.
c) Calculer la matrice DT TD.
28. Pour une particule de spin 21 , l’opérateur de spin S = h̄2 σ est représenté, dans la
base des vecteurs propres {e1 , e2 } de σz , par les matrices de Pauli
" # " # " #
0 1 0 −i 1 0
σx = σy = σz = .
1 0 i 0 0 −1
montrer que les fonctions propres ϕn (x) ∈ IR relatives à des valeurs propres diffé-
rentes sont orthogonales
Z b
ϕm (x)ϕn (x) r(x) dx = 0 .
a
H 00 − 2xH 0 + (λ − 1)H = 0 .
P∞ k
a) À l’aide de l’Ansatz H = k=0 ck x , déterminer la relation de récurence
2k + 1 − λ
ck+2 = ck .
(k + 1)(k + 2)
b) Afin d’obtenir des fonctions de carré intégrables, on coupe la série en posant
cn+2 = 0. Déterminer les polynômes Hn , n = 0, 1, · · · , 5 en choisissant la normali-
sation cn = 2n .
6
31. En mécanique quantique, l’équation radiale de l’atome d’hydrogène s’écrit
" #
d2 l(l + 1) 2 1
2
− 2
+ − 2 u(%) = 0 n ∈ IN+ l ∈ IN .
d% % % n
À l’aide de l’Ansatz
u(%) = %(l+1) e−%/n f (%) ,
vérifier qu’elle conduit à l’équation des polynômes associés de Laguerre
xLαN 00 (x) + (α + 1 − x)LαN 0 (x) + N LαN (x) = 0
où α = 2l + 1, N = n − l − 1 et x = 2%/n.
7
35. Vérifier que les fonctions f (x) et g(x) de transformées de Fourier fb(p) et gb(p),
satisfont la relation
Z Z
f (x)∗ g(x) dx = fb(p)∗ gb(p) dp .
IR IR
satisfait la relation
1 1
g(x) = √ g( ).
x x
37. Pour une particule libre de masse m, on considère l’équation de Schrödinger unidi-
mensionnelle
h̄2 2
ih̄ ∂t ψ(x, t) = − ∂ ψ(x, t)
2m x
dont l’amplitude de probabilité au temps t0 est donnée par
Z
ψ(x, t0 ) = c(k)ei(kx−ωt0 ) dk .
IR
38. Vérifier que les fonctions f (x) et g(x) de transformées de Fourier fb(p) et gb(p),
satisfont la relation
Z Z
∗
f (x) g(x) dx = fb(p)∗ gb(p) dp .
IR IR
satisfait la relation
1 1
g(x) = √ g( ).
x x
8
40. a) Caculer la transformée de Laplace de la fonction
f (t) = tk e−at k∈N Re(a + s) > 0 .
b) À l’aide de la transformée de Laplace, résoudre l’équation linéaire
ÿ + 4ẏ + 4y = t2 e−2t .
où l’on choisit les conditions initiales y(0) = 0 = ẏ(0).
41. Montrer que la distribution de Dirac D0 peut être définie par la limite
Z +∞
n 2 2
D0 [ϕ] ≡ n→∞
lim √ e−n x ϕ(x) dx = ϕ(0) .
−∞ π
42. Pour une fonction généralisée de Dirac, vérifier les propriétés suivantes :
1
a) δ(ax) = δ(x)
|a|
n
X 1
b) δ(g(x)) = δ(x − xi )
i=1 |g 0 (x i )|
43. Vérifier que la transformée de Fourier τb d’une distribution tempérée est linéaire et
qu’elle peut s’écrire Z
τ [ϕ] = lim
b sn (x)ϕ(x) dx
n→∞ IR
où sn ∈ S((IR).
44. Montrer que la transformée de Fourier d’une distribution tempérée τ possède les
propriétés suivantes :
a) τd
(n) = (ix)n τ b
n τ = in τ
b) xd b(n) n ∈ IN.
9
46. soit l’opérateur
H = P 2 + V (Q)
où V (Q) est une fonction analytique. En utilisant les équations aux valeurs propres
verifier que
¯ ¯ h d2 i
¯ ¯
hx¯P 2 + V (Q)¯ϕi = − + V (x) ϕ(x) .
dx2
R
ε x
10
49. La déformation statique d’une membrane rectangulaire de côtés a, b peut être décrite
par l’équation de Poisson
à !
∂2 ∂2
+ u(x, y) = f (x, y)
∂x2 ∂y 2
soumise aux conditions limites u(0, y) = 0 = u(a, y) et u(x, 0) = 0 = u(x, b).
La fonction f (x, y) représente le poids par unité de surface divisé par la tension
de la membrane par unité de longueur. À l’aide de l’équation aux valeurs propres
correspondante et de la définition de la fonction de Green, déterminer G(x, x0 ; y, y 0 ).
On obtient
∞
4 X sin(mπx/a) sin(mπx0 /a) sin(nπy/b) sin(nπy 0 /b)
G(x, x0 ; y, y 0 ) = − .
ab m,n=1 m2 π 2 /a2 + n2 π 2 /b2
1 Z 3 eip·(r−r )
0
0
G(r − r ) = dp 2 .
(2π)3 k − p2
. . . . . . . .
1) 2) 3) 4)
On obtient
(x−x0 )2
Z +∞ Z t −
a e 4a2 |t−t0 |
u(x, t) = dx0 q σ(x0 , t0 ) dt0 .
−∞ 0 2 π|t − t0 |
11
52. On considère l’opérateur de Green
+ h̄2 1
G = lim+
2m ²→0 E − H0 + i²
53. Déterminer la courbe décrite par un fil pesant de longueur ` et de densité homogène
supendu entre deux points x1 et x2 .
12