M4 Phys 2007
M4 Phys 2007
M4 Phys 2007
Bahram Houchmandzadeh
Bahram Houchmandzadeh
http://houchmanddzadeh.net/cours/Math/math.htm
First Version : Septembre 2008
Present Version : December 11, 2014
2
Table des matières
1 Introduction. 7
5 Les distributions. 55
5.1 Ce qu'il faut savoir. . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2 Un peu de décence. . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
5.3 Manipulation et utilisation des distribution. . . . . . . . . . . . . . 60
5.4 Exercices. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6 Convolution et corrélation. 67
6.1 Les convolutions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
6.2 Auto-corrélation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3
Table des matières
4
Table des matières
5
Table des matières
19 Bibliograhie. 250
6
1 Introduction.
Durant les deux premières années de l'université, on apprend les bases essen-
tielles des mathématiques : calcul diérentiel et integral, algèbre linéaire, équa-
tions diérentielles linéaires, etc. L'objet de ce cours est d'utiliser ce corpus pour
introduire les méthodes mathématiques dites supérieures utilisées pour résoudre
les problèmes classiques de la physique.
Les mathématiques ne sont pas une collection de méthodes juxtaposées et sans
relation : il existe des concepts extremement généraux qui nous permettent de
porter le même regard sur des notions à priori disparates. Le concept qui reviendra
tout au long de ce cours est celui de l'espace vectoriel. Ainsi, tourner un vecteur du
plan d'un angle quelconque ou appliquer un opérateur integro-diérentiel à une
fonction sont fondamentalement la même chose ; de même que trouver les valeurs
propres d'une matrice ou résoudre une équation à dérivée partielle linéaire. C'est
bien pour cela que l'étudiant apprend un tel volme d'algèbre linéaire dans les
cours de mathématiques élémentaires.
Le plan du cours est le suivant : Après une introduction (un rappel) des espaces
vectoriels, nous verrons que les fonctions elles mêmes peuvent être considérées
commes des points (des vecteurs) dans un grand espace des fonctions, et que
nous pouvons dénir des bases orthogonales dans cet espace presque comme on
le fait dans l'espace tri-dimentionnel.
Le chapitre suivant est consacré aux séries de Fourier, le premier exemple pra-
tique que nous verrons de bases dénombrables dans l'espace des fonctions sur
un intervalle ni. Nous verrons entre autre comment cette base nous permet de
résoudre les équations classique de la physique comme celle de diusion de la
chaleur ou des cordes vibrantes.
Nous avons souvent aaire à des fonctions dénies sur des intervalles innis. Les
transformées de Fourier nous permettent de disposer de bases pour l'espace de ces
fonctions. Comme souvent cependant, les innis posent des problèmes particuliers
et nous auront allors à dénir les distributions, une généralisation des fonctions
qui introduit en mathématique le concept de charge (ou force) ponctuelle si cher
aux physiciens. Nous verrons alors le nombre incroyable de problèmes que ces
nouvelles méthodes nous permettent d'aborder : de la résolution des équations
diérentielles à celle d'équations stochastiques (comme le mouvement brownien)
en passant par la diraction par les cristaux etc.
Le cousin germain des transformées de Fourier est la transformée de Laplace :
nous verrons comment l'utiliser pour tous les problèmes où les conditions initales
7
1 Introduction.
sont importantes.
Finalement, un complément util à tous ces outils est la méthode de Green (ou
fonctions de Green) qui à nouveau a à voir avec la généralistation des charges
ponctuelles : si on connait l'eet d'une charge (ou d'une force ou ...) ponctuelle,
on peut alors facilement calculer l'eet d'une distribution de charge (de force ...).
Nous allons revenir sur le concept général d'operateur integro-diérentiel. Une
rotation ou une homotetie transforment de façon linéaire un vecteur dans un
autre. Un opérateur diérentielle linéaire comme (∂t − D∂x2 ) fait la même chose
pour les fonctions, considérées comme des vecteurs d'un grand espcace. Nous sa-
vons qu'étudier une application linéaire est toujours beacoup plus simple dans sa
base propre. La même chose est vrai pour les vecteurs et valeur propres des opé-
rateurs. Les transformées de Fourier nous fournissaient une base très particulière
bien adapté à certains problèmes de physique, nous verrons d'autres bases comme
celle des polynomes othogonaux et nous généraliserons le calcul des opérateurs.
Quelques chapitres sont consacrés aux notions plus avancées qui devront néan-
moins être connues des étudiants à la n de leur Master. Nous abordons le calcul
des perturbations, outil indispensable dès que nous tentons la résolution de vrai
problèmes, c'est à dire ceux qui s'écartent un peu des exemples classiques que
nous savons résoudre. Par exemple, nous savons résoudre une équation diéren-
tielle d'une certaine forme, le calcul de perturbation nous permettra d'obtenir
une solution approchée quand la forme change légèrement.
Un chapitre est consacré aux claculs des variations qui est une généralisation
des problèmes d'extrémum à l'espace des fonctions et des fonctionnelles qui y
agissent. La plupart des problèmes de physique sont formulée dans ce langage ou
gagne à être formulé dans ce langage.
Nous aborderons également la théorie des formes diérentielles. Souvent ces
objets sont enseignés dans le cadre de la théorie des tenseurs et vue comme des
tenseurs alternés. Il est cependant beacoup plus simple de les aborder directement
et en donner une image géométrique, surtout que ce sont des objets très simple
à manipuler et qui donnent de la cohérence aux divers operateurs diérentiels
comme le gradient, rotationnel et divergence. Nous verrons comment certaines
lois de la physique comme les équations de Maxwell acquiert une signication
géométrique intuitive.
La théorie des tenseurs sera également dans un chapitre. Nous nous contente-
rons essentiellement des tenseurs dans un espace euclidien où il n'y a pas à faire
de diérence entre les vecteurs et les covecteurs.
Enn un petit chapitre est consacré aux nombres. Nous les manipulons depuis
si longtemps que nous avons oublié comment on les a construit. Ce chapitre tente
de remedier à cet oubli.
Bon, susement disgressé, voyons du concret.
8
2 Éléments d'analyse
fonctionnelle.
Les espaces vectoriels jouent un rôle unicateur fondamental en mathéma-
tiques. Peut-être cela rappelle au lecteur des souvenirs de matrices, de bases
et de ses changements, ... Nous allons revoir tout cela de façon assez legère mais
surtout appliquée à l'ensemble extrémement vaste des fonctions. Nous allons voir
que nous pouvons décrire les fonctions comme des vecteurs dans des espaces de
dimensions innies, en utilisant pratiquement les mêmes outils que pour des vec-
teurs à trois dimensions. Cela s'appelle analyse fonctionnelle et a été formalisé
par Hilbert au début des années 1900. Le reste de ce cours s'appuie constemment
sur les résultats de ce chapitre dont la lecteure est indispensable.
N'oublions pas que quand on parle de sa, on parle bien d'un vecteur et non
d'un scalaire. L'ensemble des maisons d'une ville par exemple n'a pas vraiment
une structure d'espace vectoriel. Par contre, l'ensemble des vecteurs dans un
plan, l'ensemble des polynômes, ou l'ensemble des fonctions dénies sur [0, 1]
3
ont une structure d'espace vectoriel. L'intérêt majeur est que tout ce que l'on
peut armer pour l'un de ces ensembles (en rapport avec son caractère vectoriel)
pourra être généralisé aux autres.
9
2 Éléments d'analyse fonctionnelle.
Bases d'espace vectoriel. Une base est l'ensemble de certains éléments de notre
espace E qui nous permet de décrire tout les autres. Pour être plus rigoureux,
supposons que e1 , e2 , e3 , ..., ei ∈ E, soit une base. Dans ce cas, pour n'importe
quel élément
P a
E , on peut trouver des scalaires ( des chires donc) si tel que
de
a = s e
i i i . On dit que a est une combinaison linéaire des vecteurs ei . Bien
sûr, il faut prendre le minimum de ei qui rende cette description faisable. Pour
cela, il sut d'exiger qu'aucun des ei ne puisse être une combinaison linéaire des
autres (on dit alors que ces vecteurs sont linéairement indépendant). Les scalaire
si qu'on aura trouvé pour la description de a sont alors unique. On les appelle
les composantes du vecteur a dans la base {e}.
Le grand intérêt des bases est qu'elles nous permettent de manipuler les vec-
teurs comme des collections de chires. Pour les vecteurs dans le plan, nous ne
sommes pas obligé de faire des dessins, nous pouvons les représenter par des du-
plets (x1 , x2 ) si nous nous sommes xés à l'avance deux vecteurs de références.
A partir du moment où on peut représenter les objets par des chires, on peut
pratiquement tout faire (hem).
Pour l'espace vectoriel des polynômes, les polynômes 1, X, X 2 , ... constituent
2
une base. Une autre serait {1, (1 − X), (1 − X) , ...}. Bien sûr, le choix de la
base n'est pas unique. On peut cependant remarquer que l'ensemble des vecteurs
du plan est de dimension 2 (il sut de deux vecteurs pour dénir une base),
tandis que l'ensemble des polynômes est de dimension innie. Ce n'est pas une
très grande innie, le nombre d'éléments dans la base qui couvre les polynômes
est le même que celui des nombres dans N. On dit alors que c'est une innie
4
dénombrable .
Quand est il de l'espace des fonctions ? A priori, c'est un espace d'une très
grande dimension. On verra par la suite que si on se donne quelques restrictions,
on peut également dénir une base dénombrable pour cet espace. C'est un des
théorèmes les plus fascinants d'analyse.
4. C'est le plus petit des innis. Sans rentrer dans les détails, l'inni qui ensuite est vraiment
plus grande que N est celui de R. L'ensemble de toutes les fonctions est une innie encore plus
grande.
5. (., .) : E × E → S.Si l'espace vectoriel est associé aux réels (complexes), le scalaire est un
réel (complexe).
10
2 Éléments d'analyse fonctionnelle.
L'orthogonalité. Nous nous souvenons que pour les vecteurs dans Rn , deux
vecteurs (6= 0) sont perpendiculaires (qu'on note a⊥b ) ssi leur produit scalaire
est nul. Nous acceptons cette dénitions pour tout espace vectoriel. On appelle
une base orthogonale une base telle que tout ses éléments soit perpendiculaire l'un
à l'autre. Nous avons un avantage fantastique à utiliser des bases orthogonales.
D'abord, si les vecteurs e1 , e2 , ... sont orthogonale les uns aux autres, ils sont
linéairement indépendant. Si notre espace vectoriel est de dimension n, il nous
sut donc de trouver n vecteurs tous ⊥les uns aux autres et le tour est joué :
nous disposons d'une base !
6. Un exemple intéressant de produit scalaire qui ne respecte pas (iii) est donné par la
relativité restreinte. On repère un événement par ses quatre coordonnées spatiotemporelles
(x, y, z, t) et le produit scalaire de deux événement est déni par x1 x2 + y1 y2 + z1 z2 − t1 t2 .
Deux événement distincts peuvent donc être à distance nulle l'un de l'autre.
11
2 Éléments d'analyse fonctionnelle.
On peut exiger encore plus d'une base : qu'elle soit orthonormée, c'est à dire
que la norme de tous ses éléments soit l'unité. Si nous disposons d'une base
orthonormé, on peut trouver les composantes d'un vecteur quelconque de façon
extrêmement simple : si
P a est un vecteur et (e1 , ...en ) une base orthonormée, alors
a= (a, ei )ei , c'est à dire que la composante de a selon ei est (a, ei ). Comme
n
exemple, prenez le cas des vecteurs dans R .
Exercices.
1. Démontrer que les deux vecteurs (1, 0) (0, 1) forment une base pour l'espace
vectoriel C2 associé à C. Même chose pour les deux vecteurs (i, 0) et (0, i).
2. Démontrer que si ka − bk = 0, alors a = b.
P
3. Démontrer que pour l'espace des matrices n × n, ai,j bi,j est un produit
scalaire. Ce produit scalaire est souvent utilisé en analyse matricielle numé-
rique pour l'évaluation de la stabilité des méthode itératives.
5. Démontrer que si {e1 , ..., en } est une base orthonormée, alors n'importe quel
vecteur a peut s'écrire sous la forme
n
X
a= (a, ei )ei
i=1
6. En réalité, une norme pour pouvoir légalement porter ce nom, doit respecter
l'inégalité triangulaire :
ka + bk ≤ kak + kbk
Démontrez que la norme dénie par le produit scalaire vérie cette inégalité.
Pour cela il faut d'abord démontrer l'inégalité de Cauchy-Schwarz :
12
2 Éléments d'analyse fonctionnelle.
8. Un operateur linéaire est une fonction linéaire de l'espace vectoriel dans lui
même : il prend un vecteur en entrée et produit un vecteur en sortie. La
linéarité veut dire que si L est un opérateur linéaire, a, b deux membres
quelconques de l'espace vectoriel et λ, µ deux scalaires, alors
Les nombres Lij sont les comosantes de l'application L dans la base des
{ei }. En général, pour les représenter, on les dispose dans un tableau (appelé
matrice) où la i−ème ligne et la j−ème colonne contient le nombre Lij .
Démontrez que les composantes de deux vecteurs quelconque a et b tel que
b = L(a) sont relié par la relation (noter l'ordre des sommations)
X
bi = Lij aj
j
P (ei ) = fi i = 1, 2, ..., n
P −1 (fi ) = ei
P est couramment appelé l'application de passage. Soit A une application
linéaire quelconque dont les éléments dans la base des {fi } sont données
par la matrice aij . Soit maintenant l'application linéaire P −1 AP . Calculer
ses éléments de matrice dans la base des {ei }.
13
2 Éléments d'analyse fonctionnelle.
R→R dénies sur un intervalle donnée I. Les fonctions sont en faite des boites
noire qui prennent des chires en entrée et produisent des chires en sortie. La
fonction sin(.) par exemple, à une valeur x∈I associe le nombre sin x. On peut
voir les fonctions comme des points dans un espace immensément grand où en se
baladant, on rencontrerai de temps en temps des fonctions connues comme log(.),
7
exp(.), exp(2.) et la plupart de temps des fonctions qui n'ont pas de nom .
Le produit scalaire. Il est évident que F possède une structure d'espace vecto-
riel. On ne sait pas encore si nous pouvons étendre la notion de base à cet espace,
mais on peut parfaitement dénir des produits scalaires. Le produit scalaire que
l'on utilisera abondamment est le suivant :
Z
(f, g) = f (x)g(x)dx
I
On démontrera dans un exercice que ce produit scalaire a toute les bonnes pro-
P
priétés. Mais on peut noter que cette dénition généralise la somme xi yi du
produit scalaire dans Rn , quand n→∞ (souvenez vous de la dénition de l'in-
tégral).
Bien, nous disposons d'un produit scalaire, on peut donc dénir la norme d'une
fonction. Z
kf k2 = [f (x)]2 dx
I
Cette norme, appelée L2 , est très populaire. voyons quelques exemples, pour
l'intervalle [0, 2π],
2 R 2π
1. kexp(.)k = 0 exp2 (x)dx = (exp 4π − 1)/2.
√
2. ksin(.)k = π
3. klog(.)k =??? à faire en exercice.
n
4. k1/(.) k = ∞ si n > 1.
On voit ici les premières bizarreries des ces grands espaces ( de dimension inni)
apparaître : un élément à priori sympathique peut avoir une norme innie.
Le lecteur a remarqué que jusque là, nous avons utilisé une notation particulière
pour distinguer une fonction (un point dans l'espace vectoriel des fonctions) de
la valeur que prend cette fonction pour une entrée particulière : la première est
notée f (.) est la deuxième f (x). Comme cette notation est quelque peu lourde
et que nous espérons que le lecteur est maintenant habitué à cette distinction,
nous emploierons à partir de maintenant indiéremment la notation f (x) pour
les deux notions. Le contexte détermine si on parle de la fonction ou de sa valeur.
14
2 Éléments d'analyse fonctionnelle.
Nous avons mentionné plus haut que disposer d'une norme nous permet de
savoir si deux fonctions sont proches ou même identique si kf − gk = 0. Consi-
dérons alors les deux fonctions, dénies sur [0, 1] : f (x) = 1 et g(x) = 1 si x 6= 0
et g(x) = 0 si x = 0. Au sens de notre norme L2 , ces deux fonctions sont iden-
8
tiques ! Grossièrement parlant, notre norme est une lunette pas trop précise et
ne distingue pas les diérences subtiles entre deux fonctions. Elle ne va retenir
9
que les traits les plus importants . Ainsi, quand n → ∞, la suite des fonctions
n
fn (x) = x converge vers f (x) = 0 sur l'intervalle [0, 1] au sens L2 , mais ne
converge pas au sens des convergences uniformes.
Notons enn que si nous manipulons l'ensemble des fonctions qui associent à
une valeur réelle un nombre complexe, i.e. f : R → C, nous devons légèrement
modier la dénition du produit scalaire :
Z
(f, g) = f (x)g(x)∗ dx
I
8. C'est même pire : Si la fonction g est dénie par g(x) = 0 si x∈Q et g(x) = 1 sinon, au
sens de notre norme, elle est identique à la fonction f. Bien sûr, on aurait besoin de redénir
ce que l'on entend par une intégrale.
9. Il existe bien sûr des normes aux pouvoirs de résolutions beaucoup plus grande, comme
celle utilisée pour la convergence uniforme des suites de fonctions.
15
2 Éléments d'analyse fonctionnelle.
suite clarier un peu mieux les choses, sans les démontrer. Mais avant cela, voyons
le côté étrange de ce théorème.
Comme nous l'avons indiqué, l'inni dénombrable, celui des nombres entiers, et
le plus petit des innis. Il a cette particularité que pour un nombre donné, on peut
indiquer celui qui est juste avant et celui qui est juste après. L'inni des nombres
rationnels n'est pas vraiment plus grand, ni celui des nombres algébriques. Par
contre, l'inni des nombre réels est vraiment plus grand. On peut dire grossière-
10
ment que R = 2N (bien sûr, on parle en faite du cardinal, de la taille, de ces
ensembles) : pour représenter un nombre réel, nous avons absolument besoin de N
nombre entier. L'ensemble des fonctions est beaucoup, beaucoup plus vaste. Ima-
ginez que pour représenter une seule fonction, nous avons besoin de R nombre
réel. Le théorème ci-dessus nous dit que si la fonction est de carré sommable, nous
n'avons alors besoin pour la représenter que de N nombre réel ! Une exigence a
priori anodin, que les fonctions soient de carré sommable, réduit sérieusement la
taille de l'ensemble des fonctions.
Après ces digressions philosophicales, un peu de concret. D'abord, qu'est ce
que ça veut dire une base dans ces espaces innis ? intuitivement, ça doit être la
même chose que les espaces de dimensions ni : un ensemble d'objet élémentaire
qui nous permet de décrire tous les autres. Supposons que, dans l'espace des
fonctions, E = {e1 , e2 , ...} constitue une base orthonormée. Dans ce cas, une
fonction quelconque f doit pouvoir s'écrire, de façon unique,
∞
X
f (x) = fn en (x)
n=1
où les fn sont des scalaires qu'on appelle les composantes de f sur la base {en }.
Elle sont données, comme pour des espaces de dimensions nis, par la projection
de f sur les vecteurs de base en utilisant le produit scalaire :
Z
fn = f (x)en (x)dx
I
10. le cardinal de N est noté ℵ0(aleph zéro), celui de R ℵ1 si on accepte l'axiome de choix. En
pensant aux nombres réels entre 0 et 1 comme une succession (innie ) de bits 0 et 1 (comme
en informatique), la relation ℵ1 = 2ℵ0 paraît assez raisonnable. Nous devons tous ces résultats
sur les innis aux travaux de Georg Kantor, à la n du dix-neuvième siècle.
16
2 Éléments d'analyse fonctionnelle.
fonctions qui peuvent être couvert par un développement de Taylor est cepen-
dant beaucoup plus petit que L2 . Les mathématiciens ont été amené à trouver
donc d'autres bases. Chaque base est bien adapté aux traitements d'un certain
nombres de problèmes, essentiellement la résolution d'une certaine classe d'équa-
tions diérentielles. La base la plus populaire, est de loin, et celui proposé par
ème
monsieur Fourier, préfet de l'Isère en son temps, au tout début du XIX siècle.
Ce sera l'objet du prochain chapitre.
Exercices.
2. montrer que la fonction f (x) = xn dénie sur [0, 1] converge vers la fonction
g(x) = 0 au sens L2 .
3. Démontrer que la convergence uniforme implique la convergence au sens
L2 . L'exemple précédent montre bien sûr que le contraire n'est pas vrai.
6. Démontrer que les polynômes de Legendre que vous avez trouvé obéissent
à l'équation diérentielle
En réalité, c'est souvent pour cela que l'on cherche les polynômes ortho-
gonaux : ils sont solution d'équations diérentielles intéressante pour la
physique.
7. Même question que 5 pour le poids w(x) = e−x et l'intervalle [0, ∞[. Ces
polynômes sont associés à la solution de l'équation de Schroedinger pour
l'atome d'hydrogène.
17
2 Éléments d'analyse fonctionnelle.
8. L'opération D = d/dx est une opération linéaire dans l'espace des fonc-
tions inniment dérivable (C
∞
) : (i) elle prend une fonction en entrée
et donne une fonction en sortie ; (ii) elle fait cela de façon linéaire, i.e.
D(λf + µg) = λDf + µDg , où λ, µ sont des scalaires et f, g des fonc-
tions. Supposons que des fonctions orthonormées fn (x) constituant une base
obéissent à la relation dfn (x)/dx = fn (x) + an fn+1 (x). Pouvez-vous donner
la représentation matricielle de D dans la base des fn ?
18
3 Les séries de Fourier.
Nous allons dans ce chapitre étudier les Séries de Fourier. On ne peut pas
sérieusement toucher un sujet de physique sans utiliser d'une manière quelconque
ces séries (ou leur généralisation, les transformées de Fourier). Nous en verrons de
nombreux exemples à travers ce cours. Les séries de Fourier ont également joué
un grand rôle dans le développement des mathématiques. Quand Joseph Fourier
présenta la première fois le résultat de son analyse de l'équation de la chaleur à
l'Académie des Sciences, l'accueil était loin d'être enthousiaste et beaucoup, parmi
les plus grands ( Laplace et Lagrange ) s'y sont violemment opposé : Comment la
somme d'une suite de fonctions toutes continues peut être égale à une fonction
discontinue ? Le pragmatisme a fait avancer l'usage des ces suites bizarres jusqu'à
ce que d'autres mathématiciens comme Lebesgue (pour justier ces pratiques un
peu sales) redénissent la théorie de la mesure et fassent faire un bond à l'analyse
mathématique. De tout cela, on ne parlera pas ici. Notre approche sera beaucoup
plus pratique : Qu'est ce qu'une série de Fourier, à quoi elle sert, comment on
fait pour l'obtenir.
3.1 Introduction.
Les premiers travaux sur la décomposition en série de Fourier viennent en faite
du grand Lagrange lui même dans les années 1780 et son étude de l'équation
des cordes vibrantes. Supposons une corde tendu entre 0 et L qu'on déforme à
l'instant initial et que l'on relâche. Soit y(x, t) l'écart à l'équilibre à la position x
et à l'instant t. On démontre alors que
∂2y 2
2∂ y
− v =0 (3.1)
∂t2 ∂x2
où v est un coecient qui dépend de la densité et de la tension de la ligne.
Cherchons la solution de cette équation sous la forme y = Ak,ω cos ωt. sin kx. En
injectant cette forme dans l'équation (3.1), on trouve que cette forme ne peut
être une solution que si il existe une relation entre ω et k : ω = vk . Ensuite,
la fonction y doit satisfaire les conditions aux bords y(0, t) = y(L, t) = 0. La
première condition est automatiquement satisfaite. La deuxième condition impose
sin kL = 0, c'est à dire k = nπ/L, où n = 0, 1, 2, 3, ....On déduit de tout cela
que les fonctions fn (x, t) = An cos(nπvt/L) sin(nπx/L) sont solution de notre
19
3 Les séries de Fourier.
équation d'onde avec ses conditions aux bords. On les appelle les modes propres
de vibration. Le principe de superposition nous dit (le démontrer) que si f et g
sont solution, alors f +g l'est aussi. La solution générale de l'équation d'onde
(3.1) est donc de la forme
∞
X
y= An cos(nπvt/L) sin(nπx/L)
n=1
Jusque là, nous n'avons rien dit des coecients Ak , puisqu'elle ne peuvent pas
être obtenus de l'équation d'onde directement. Ils doivent sortir de la condition
y(x, 0) = y0 (x), c'est à dire de la déformation originale que nous avons imprimé
à notre corde à l'instant t = 0. Nous devons donc avoir :
∞
X
y0 (x) = An sin(nπx/L)
n=1
Est-il possible de trouver des coecient An pour satisfaire cette équation ? Nous
verrons la réponse plus bas. A priori, trouver la réponse paraît assez compliquée.
Notons que si y0 a une forme simple, on peut trouver une solution. Par exemple,
si y0 (x) = 4 sin(11πx/L), alors A11 = 4 et tous les autres An sont nul.
Théorème. Dans l'espace vectoriel L2 [0, L], c'est à dire celui des fonctions de
carré sommable dénies sur l'intervalle [0, L], les fonctions
L
L
Z
L
(1, sin n(.) ) = sin(2πnx/L)dx = − [cos(2πnx/L)]0 = 0
0 2πn
1. La démonstration est due à Weierstrass dans les années 1880. Elle ne pose pas de diculté
majeure. Disons que pour qu'une suite fn de vecteurs orthogonaux constitue une base, il faut
que si un élément g est orhogonal à tous les fn , alors g = 0. C'est pour cela par exemple que la
suite des sin(.) seul ne peut constituer une base : on peut trouver toujours des cos(.) qui soit
orthogonal à tous les sin(.).
20
3 Les séries de Fourier.
la fonction 1 est orthogonale à toutes les sinus, et de même à toutes les cosinus.
Ensuite, comme
les fonctions sin n(.) et sin m(.) sont orthogonales, sauf si n = m, auquel cas,
k sin n(.)k = k cos n(.)k = L/2.
Ensuite, une fonction f quelconque de L2 [0, L] peut s'écrire sous la forme
∞
X
f (x) = a0 + an cos(2πnx/L) + bn sin(2πnx/L)
n=1
et comme notre base est orthogonale, les coecient an et bn sont donnés par le
produit scalaire de f par les éléments de la base :
Z L
a0 = (1/L) f (x)dx (3.2)
0
Z L
an = (2/L) f (x) cos(2πnx/L)dx (3.3)
0
Z L
bn = (2/L) f (x) sin(2πnx/L)dx (3.4)
0
1 1
−1 1 1
Z Z
x=1
bn = 2 x sin(2πnx)dx = [x cos(2πnx)]x=0 + cos(2πnx)dx = −
0 πn πn 0 πn
1 1
1 1
Z Z
x=1
an = 2 x cos(2πnx)dx = [x sin(2πnx)]x=0 + sin(2πnx)dx = 0
0 πn πn 0
∞
1 X 1
x= − sin(2πnx) x ∈ [0, 1] (3.5)
2 n=1 πn
21
3 Les séries de Fourier.
1
n=0 n=1 n=2
0.5
0
1
n=4 n=8 n=32
0.5
0
0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1 0 0.2 0.4 0.6 0.8 1
dont l'amplitude décroît ; (ii) l'approximation prend les mêmes valeurs aux deux
bords, ce qui n'est pas le cas de la fonction originale ; (iii) cette valeur est 1/2 dans
le cas présent, ce qui est la moyenne des valeurs que prend la fonction originale
aux deux bords.
Le point (ii) est dû à la périodicité de nos fonctions sin et cos : chaque fonction
dans la somme, étant de période au moins 1, prend obligatoirement la même
valeur sur les deux bords, donc la somme doit également prendre la même valeur
sur les deux bords. Le point (iii) est plus troublant : la fonction originalef (x) = x
prend la valeur 0 en x = 0 et 1 en x = 1. La somme par contre, prend la valeur 1/2
sur les deux bords : la somme ne converge donc pas en tout point vers la fonction
originale (adieu la convergence uniforme ou point par point), mais seulement
pour la majorité des points sur l'intervalle. Ils se trouvent que cette majorité est
largement susante : si on prend une innité de terme dans la somme, alors la
somme et la fonction originale ne dièrent qu'en deux points. Deux comparé à la
taille de R donne tous son sens à la notion de majorité. On dit que la diérence
entre la fonction originale et la série est de mesure nulle.
Tout ce que nous avons dit ci-dessus se généralise immédiatement aux inter-
valles quelconques [a, b]. Il sut simplement dans les formules, poser L = b−a
qui représente comme avant la longueur de l'intervalle.
22
3 Les séries de Fourier.
Exemple 2. Prenons cette fois la même fonction f (x) = x, mais sur l'intervalle
[−1/2, 1/2]. Le même calcul que précédemment nous mène à
∞
X (−1)n −1 1
x=− sin(2πnx) x ∈ [ , ] (3.6)
n=1
πn 2 2
Nous voyons que les coecients dépendent également de l'intervalle sur lequel la
fonction est dénie.
Notons enn qu'en prenant des valeurs de x particulier, nous disposons d'un
moyen intéressant de trouver la limite de certaines sommes. Dans l'équation (3.5)
par exemple, si on pose x = 1/4, nous trouvons que
∞
X (−1)n+1 1 1 π
= 1 − + − ... =
n=1
2n − 1 3 5 4
L
1 1X 2
Z
f (x)2 = a20 + (a + b2n ) (3.7)
L 0 2 n=1 n
Exercices.
2. Soit la fonction palier f sur [0, 1] tel que f (x) = −1/2 si x < 1/2 et
f (x) = 1/2 si x ≥ 1/2. Trouver sa décomposition en série de Fourier.
23
3 Les séries de Fourier.
3. Même question que précédemment, mais la fonction f est dénie par f (x) =
0 si x < 1/2 et f (x) = 1 si x ≥ 1/2. En comparant ce résultat au résultat
précédent, pouvez en tirer des conclusions générales ?
4. Décomposer la fonction triangle, f (x) = 1−2 |x| sur l'intervalle [−1/2, 1/2].
5. Trouver la série de Fourier de sin(x/2) sur l'intervalle [0, 2π].
7. Une fonction paire est tel que f (−x) = f (x), c'est à dire que l'axe y consti-
tue un axe de symétrie. Démontrer alors que sur un intervalle [−L, L], les
coecients bn de la série de Fourier sont nuls. On peut généraliser cette
armation : si la fonction f, sur l'intervalle [0, L], est symétrique par rap-
port à son milieu, c'est à dire telle que f (L − x) = f (x), alors ses coecient
de Fourier bn sont nuls (à démontrer bien sûr).
24
3 Les séries de Fourier.
0.2
0.1
0
bn
-0.1
-0.2
-0.3
-0.4
0 5 10 15 20
n
fonctions égale la fonction f sur une intervalle de longueur L, elle égale la fonction
f partout !
Comme nous le savons, si ces fonctions sont de carré sommable sur une période,
elle peuvent se décomposer en série de Fourier. Représenter leurs coecients de
Fourier an et bn en fonction de n est aussi bien que de les représenter en fonction
de x. Cette représentation est appelé le spectre d'une fonction, et ses composantes
de Fourier les harmoniques. C'est un vocabulaire issue de la musique. La gure
3.2 représente le spectre de la fonction f (x) = x sur [−1/2, 1/2]. En réalité, pour
des raisons que nous verrons plus tard, on n'est même intéressé qu'aux coecients
p
sn = a2n + b2n et c'est ce dernier qu'on appelle couramment le spectre. Ce qui
distingue le Do 240 Hz du piano de la même note d'une ûte n'est pas leurs fré-
quence de base, mais l'amplitude de leurs harmoniques (la forme de leur spectre).
On appelle cela le timbre d'un instrument. L'oreille à une capacité fantastique
à distinguer les timbres, et les meilleurs synthétiseur doivent sommer plus d'une
vingtaine d'harmonique pour pouvoir imiter une note d'un vrai instrument.
L'oreille humain d'ailleurs ne fait que décomposer les sons en leurs harmo-
niques : la forme intérieure de l'oreille fait qu'une vibration pure (sinusoïdale)
de fréquence donnée met une région particulière de l'oreille en oscillation, ce qui
stimule les neurones à cet endroit. Chaque harmonique d'un son excite donc une
région diérente de l'oreille, et la carte de ces régions permet au cerveau de dé-
terminer très précisément la nature du son et distinguer ainsi le piano du violon.
La compression JPEG des photos numériques utilise le principe des transfor-
mées de Fourier : un image est divisé en plusieurs régions et les composantes
de Fourier de chaque sous régions sont calculées, mais seulement l'amplitude des
premières harmoniques sont conservées, puisque l'oeil humain n'est pas sensible
aux petits détails.
25
3 Les séries de Fourier.
Exercices.
+∞
X
f (x) = cn exp(2iπnx/L)
n=−∞
Exercices.
26
3 Les séries de Fourier.
Les séries de sinus. Prenons d'abord une fonction f (x) dénit sur [−L, L] (un
intervalle de longueur 2L donc). Sa série de Fourier est donnée par
X nπx nπx
f (x) = a0 + an cos + bn sin
n=1
L L
Supposons maintenant que la fonction f est impaire, c'est à dire f (−x) = −f (x).
En écrivant les intégrales ci-dessus comme la somme de deux intégrales (de −L
à 0 et de 0 à L) il est alors évident que tous les coecient an sont nuls, et les
coecients bn sont données par
Z L
bn = (2/L) f (x) sin(nπx/L)dx (3.8)
0
Considérons maintenant une fonction f (x) dénit sur [0, L]. On peut toujours
trouver une extension g de f telle que sur l'intervalle [0, L] les deux fonctions
coincident (g(x) = f (x) ) et que sur l'intervalle [−L, L], la fonction g est impaire.
Il est donc évident que sur l'intervalle [0, L], nous pouvons développer f en série
de sinus seulement X nπx
f (x) = bn sin
n=1
L
où les coecients bn sont donnés par la relation (3.8). La gure (3.3) montre les
trois premiers vecteurs de la base de fourier et de la base des sinus.
Exercice.
27
3 Les séries de Fourier.
1.5
(a) (b)
1
0.5
-0.5
-1
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
Figure 3.3 Comparaison des trois premières fonction de la base de fourier (a)
et celle des sinus.
28
3 Les séries de Fourier.
X nπx
y(x; t) = bn (t) sin (3.10)
n=1
L
Notons que nous faisons ici le choix de rechercher la solution sous la forme de
fonction de sinus, puisque chaque terme de la série respecte les conditions aux
bords y(0, t) = y(L, t) = 0. En injectant (3.10) dans (3.9) est en identiant terme
à terme (puisque les fonctions sont orthogonales), nous trouvons une équation
diérentielle pour l'amlitude de chaque mode :
00
bn (t) + n2 ω 2 bn (t) = 0
où ω = πv/L. Comme la corde est relaché avec une vitesse nulle, nous avons
simplement
bn (t) = Bn cos(nωt)
où les coecient Bn sont les coecient de la série des sinus de la fonction y0 (x).
L'image est donc la suivante : la déformation initiale est la superposition d'un
certain nombre de mode, chacune avec une amplitude bn . Une fois qu'on relache la
corde, l'amplitude de chaque mode oscillera dans le temps. Remarquez cependant
qu'il n'y a pas de transfert entre les modes : si un mode n'était pas présent dans la
déformation initiale, il ne sera pas excité dans la suite. Chaque mode se comporte
comme un oscillateur indépendant, non couplé aux autres. En langage plus chic,
on dira que la base de Fourier est une base propre pour l'operateur Laplacian :
dans cette base, la représentation matricielle de cet opérateur est diagonale.
Nous avons, lors de cette résolution, inversé l'ordre des operations de dérivation
et de sommation. Nous savons qu'il existe des conditions très contraignantes pour
pouvoir eectuer cette inversion, et elles sont loin d'être réunies à priori (voir ci-
dessous). Notons enn que la diérence entre un clavecin et un piano, qui excitent
pratiquement les même cordes tendues, est dans la façon de former la déformation
initiale, donc de produire des coecients Bn diérents.
∞
X
f (x) = a0 + an cos(2πnx/L) + bn sin(2πnx/L)
n=1
29
3 Les séries de Fourier.
∞
X
f 0 (x) = α0 + αn cos(2πnx/L) + βn sin(2πnx/L)
n=1
L
1 1
Z
α0 = f 0 (x)dx = (f (L) − f (0))
L 0 L
L
2
Z
αn = f 0 (x) cos(2πnx/L)dx
L 0
L
2 2πn 2
Z
= (f (L) − f (0)) + f (x) sin(2πnx/L)dx
L L L 0
2 2πn
= (f (L) − f (0)) + bn (3.11)
L L
Finalement, pour les termes en sinus, on trouve, en suivant le même chemin,
2πn
βn = − an
L
Nous voyons donc que si f (L) = f (0), nous pouvons dériver la serie de Fourier
terme à terme. Sinon, des termes additionnelles apparaissent quand on dérive les
termes en sinus dont il faut en tenir compte.
On peut généraliser ce résultat aux series de sinus et de cosinus pures :
1. Si f (x) est continue et dérivable par morceau, sa série de cosinus est déri-
vable terme à terme sans restriction.
2. Si f (x) est continue et dérivable par morceau, sa série de sinus est dé-
rivable terme à terme si f (L) = f (0) = 0 ! Sinon, des termes addition-
nelles apparaissent dans la série de sinus de la dérivée, qui sont de la forme
2( (−1)n f (L) − f (0) )/L.
Nous voyons maintenant dans quelles conditions nous avons pu dériver terme à
terme la serie de la corde vibrante. Comme nous avions la condition u(0, t) =
u(L, t) = 0, nous pouvions dériver la série de sinus pour obtenir une série de cosi-
nus. Nous avons pu ensuite dériver cette dernière encore une fois sans restriction
particulière.
Une hérésie saute aux yeux dans l'équation (3.11) : la suite αn comporte un
terme qui ne dépend pas de n et ne tend pas vers 0. Cela n'est pas de plus bel
30
3 Les séries de Fourier.
eet pour la convergence de la série ! La réponse est dans le coecient bn , qui doit
forcément avoir un terme en −∆/πn pour annuler exactement le terme constant.
C'est ce que l'on va voire plus bas dans un cas particulier.
En pratique, au lieu de dériver terme à terme et prendre en compte les termes
additionnels dus aux conditions au bords, il est préférable de régulariser les condi-
tions aux bords pour ne pas avoir de termes additionnels du tout. Supposons par
exemple que les conditions aux bords soit u(0, t) = a, u(L, t) = b. Il est alors
préférable d'utiliser la fonction
b−a
w(x, t) = u(x, t) − x−a (3.12)
L
Les dérivées temporelles et les dérivées seconde spatiale de u et w coincide évi-
dement. w(x, t) est satisfait donc à la même équation que u si il s'agit d'une
équation de chaleur ou de corde vibrante. Par ailleurs, de par sa construction,
w(0, t)= w(L, t) = 0. Nous pouvons donc d'abord rechercher w(x, t) et ensuite
recouvriru à l'aide de la relation (3.12). Nous verrons un exemple plus bas.
Quand est il pour la dérivation par rapport à une autre variable ? En écrivant
∞
X
u(x, t) = bn (t) sin(nπx/L)
n=1
nous avons concentré toute la dépendance temporelle dans l'amplitude des har-
moniques bn (t). Pour avoir le droit de dériver par rapport à t sous la somme,
nous devons pouvoir écrire ( le démontrer )
L L
∂ ∂u
Z Z
u(x, t)dx = dx
∂t 0 0 ∂t
31
3 Les séries de Fourier.
leur. Cette dernière décrit les phénomènes diusives (de la chaleur, de la concen-
2
tration, ...) et est de la forme
∂u ∂2u
=D 2 (3.13)
∂t ∂x
où u représente la température, la concentration, etc... Si x désigne l'espace et t
le temps, nous voyons que D doit avoir la dimension d'une longueur au carré par
unité de temps [L2 /T ].
Remarquez la diérence avec l'équation d'onde, où la dérivée par rapport au
temps est de deuxième ordre. Nous voulons traiter le cas d'une barre ( comme
d'habitude, de longueur L ) dont les extrémités sont maintenues à deux tem-
pératures diérentes , disons 0 et T. Nous avons donc les deux conditions aux
limites
u(0, t) = 0 (3.14)
u(L, t) = T (3.15)
Voilà, le problème est maintenant bien posé. Avant de commencer son traitement
total, voyons voir si il existe une solution stationnaire, c'est à dire une solution
tel que ∂t u = 0. Dans les processus diusive, c'est la solution qui est atteinte au
bout d'un temps plus ou moins long et correspond à une sorte d'équilibre. Il est
évident ici que us (x) = T (x/L) satisfait parfaitement aux équations (3.13-3.15)
et est la solution stationnaire recherchée. Sa série de sinus est donnée par
∞
2T X (−1)n+1 nπ
us (x) = sin( x)
π n=1 n L
X
u(x, t) = bn (t) sin(nπx/L) (3.17)
Nous dérivons une première fois par rapport à x. Mais attention, la fonction u
prend des valeurs diérentes sur les deux bords, il faut donc ajouter des termes
2 2T
((−1)n u(L, t) − u(0, t)) = (−1)n
L L
2. Voir le chapitre correspondent pour la signication de cette équation.
32
3 Les séries de Fourier.
à la série dérivée :
T X nπ 2T n
∂x u(x, t) = + bn (t)( ) + (−1) cos(nπx/L)
L L L
Nous sommes maintenant en présence d'une série de cosinus, que nous redérivons
encore une fois par rapport à x
X nπ 2T
nπ
∂x2 u(x, t) = − bn (t)( ) + (−1)n ( ) sin(nπx/L)
L L L
La dérivation par rapport au temps nous donne une série de sinus dont les co-
ecients sont b0n (t). En égalant terme à terme, nous obtenons une équation de
premier ordre pour les coecients
nπ 2 2T nπ
b0n (t) = −D bn (t) − D (−1)n
L L L
dont la solution est
2T (−1)n+1
bn (t) = Bn exp −n2 (π 2 D/L2 )t +
(3.18)
π n
Notons d'abords que quand t → +∞, les coecients bn tendent vers les coef-
cients de sinus de la solution stationnaire : au bout d'un temps assez long, la
distribution de température dans la barreau devient linéaire. Ensuite, les ampli-
tudes des harmoniques sont de la forme exp(−n2 t/τ ), où τ ∼ L2 /D. L' harmo-
nique d'ordre n disparait donc sur une echelle de temps ∼ L2 /(n2 D). (i) Plus
L est grand, plus le temps de thermalisation est grand. Si on multiplie par 2 la
longueur du barreau, on doit mulitplier par 4 le temps nécessaire à la thermali-
3
sation ; (ii) Plus le coecient de diusion D est grand, plus la thérmalisation
est rapide : le cuivre est plus rapide à thermaliser que le verre ; (iii) plus l'ordre
d'un harmonique est important, plus il disparaît rapidement, est ceci est prop-
portionnel au carré de l'odre. Très rapidement, il ne restera pratiquement que
l'harmonique d'ordre 1, qui sera le plus lent à mourir (voir gure 3.4).
Nous avons réussi à nous en sortir même quand la dérivation sous la somme
posait problème. Mais était-il vraiment nécessaire de faire appel à une telle ar-
tillerie lourde, qui numériquement n'est pas entièrement satisfaisant ? Et si au
lieu de chercher la fonction u(x, t) qui satisfait aux équations (3.13-3.16), nous
cherchions la fonction
φ(x, t) = u(x, t) − us (x) (3.19)
3. Sachant qu'un gigot de 1 kg cuit en une heure au four, quel est le temps de cuissons d'un
gigot de 2 kg ?
33
3 Les séries de Fourier.
t=0.1
t=0
0.5 t
t=0.25
0 t=1
Figure 3.4 Solution de l'équation de la chaleur par les séries de sinus avec
L = 1, u(0, t) = 0 ; u(1, t) = 1, et condition initiale une fonction
pallier. La solution est tracée pour 4 temps diérents. Nous avons
représenté la série par simplement ses 64 premiers harmoniques.
Notez les oscillations articielles : les séries de sinus ont du mal a
reproduire les discontinuités.
Cette fonction obéit bien sûr à l'équation (3.13). Ces conditions aux limites sont
Les équations pour φ sont donc maintenant bien posées, et nous pouvons les
résoudre par la technique habituelle des séries de sinus sans la complications
des termes additionnels. Une fois φ trouvée, nous avons évidemment trouvé u. La
gure (3.5) montre l'avantage (entre autre numérique) de cette dernière méthode.
34
3 Les séries de Fourier.
0.5
0
0 0.2 0.4 0.6 0.8 1
35
3 Les séries de Fourier.
Problèmes avancés.
L'exemple de la corde vibrante que nous avons considéré plus haut peut être
complété de bien des façons. Si la corde est soumise à un frottement visqueux,
il faut ajouter un terme en −λ∂y/∂t (proportionnel à la vitesse locale) à droite
de l'équation (3.9). Si la corde est en plus soumis à une force par unité de lon-
gueur f (x, t), il faut également l'ajouter à droite. Résoudre l'équation de la corde
vibrante (i) en présence d'un frottement (ii) en présence de la force de gravité
f = −ρg (iii) en présence d'une force de rappelle harmonique f = −ky . Les
conditions aux bords sont toujours les mêmes : corde xée à ses deux extrémités
et avec une déformation initiale y0 (x).
∂2y ∂4y
2
=α 4
∂t ∂x
Discuter les solutions de cette équation. Que pensez vous des conditions initiales ?
∂ψ ~2 ∂ 2 ψ
i~ =−
∂t 2m ∂x2
avec les condition aux limites ψ(−L, t) = ψ(L, t) = 0 et ψ(x, 0) = f (x). Discuter
de la solution de cette équation en suivant l'exemple de la corde vibrante.
4. Equation de la Chaleur I.
36
3 Les séries de Fourier.
Si une source de chaleur est présente dans le milieu (sous forme de résistance
électrique ou de particule radioactive ...), l'équation de la chaleur prend la forme
∂u ∂2u
= D 2 + Q(x)
∂t ∂x
où Q est la quantité de chaleur produit en x. Prenez une source constante localisé
autour de L/2, et resolvez alors l'équation de la chaleur.
∂u ∂2u
=D 2
∂t ∂x
avec les conditions aux limites u(0, t) = 0 ; u(L, t) = g(t). Nous supposons une
condition initiale homogène u(x, 0) = 0 et bien sûr g(0)=0. Notez que vous avez
interêt à chercher plutôt la fonction φ(x, t) = u(x, t) − g(t)x/L pour régulari-
ser les conditions aux limites. Si vous n'aimez pas cette façon de faire, il faut
faire attention aux dérivations terme à terme (qui donneront, bien sûr, la même
reponse).
Reprenons le cas de la corde vibrante xée à ses deux extrémités. Quelle est son
4
énergie libre F quand elle est maintenue à une température T ? Ce problème a
ème
joué un rôle majeur dans l'évolution de la physique au tournant du XIX siècle
et a donné lieu à la première formulation de la mécanique quantique.
Avant d'attaquer de front ce problème, quelques rappels sur un cas simple.
Prenons un oscillateur harmonique (une boule au bout d'un ressort ) dont l'am-
plitude à un instant est x(t). L'énergie élastique enmagasinée dans l'oscillateur
est E(x) = (k/2)x2 . L'énergie libre est une sorte de moyenne pondérée par la
température de toutes les énergies disponible :
X
Z = e−F/T = e−E(x)/T (3.22)
{x}
37
3 Les séries de Fourier.
et la somme (3.22) pour obtenir l'énergie serait cette fois une double intégrale
qui se calcule tout aussi facilement. Un calcul élémentaire nous montre alors que
l'énergie élastique moyenne est
Au lieu de représenter la corde par u(x), nous pouvons le repéresenter sur la base
de Fourier :
+∞
X
u(x) = cn exp[(2iπn/L)x]
n=−∞
L 2 ∞ 2
∂u 2πn
Z X 2
E= k dx = k |cn |
0 ∂x n=−∞
L
p
5. Le résultat s'obtient facilement en eectuant le changement de variable x→x T /k ; la
√
constante C est juste une intégrale dénie qui vaut 2π
6. Pour la signication de cette expression, voir les deux chapitres sur le calcul variationnel
et le sens des équations de la physique.
38
3 Les séries de Fourier.
+∞
X
hEi = T /2
n=−∞
Aïe .. Une simple corde à température non nulle emmagasine une énergie innie.
La raison principale pour cette divergence est la forme (3.24) de l'énergie de la
corde : elle n'est valable pour des petites déformations de la corde. Les modes à n
grand (les hautes fréquences) imposent cependant de très fortes déformations. Il
est évident que vous ne pouvez pas plier en 10000 une corde de 1m. Il doit donc
exister une sorte de longueur minimum qui limiterait les hautes fréquences, et on
parle alors de longueur de cut-o.
Par contre, la forme (3.24) décrit parfaitement l'énergie du champ électrique
(poser E = ∇u) dans une cavité. Bien sûr, il faut prendre un champs électrique
tridimentionnel et prendre en compte les diverses polarisations ; cela est légère-
ment plus long à calculer mais c'est exactement le même genre de calcul. Ce
problème que l'on appelle divergence ultra-violet (pour les hautes fréquence spa-
tiale) a été résolu par Planck et Einstein en supposant que l'energie d'un mode
n ne pouvait pas prendre des valeurs continues mais varie par palier discret.
8. Le mouvement Brownien.
39
3 Les séries de Fourier.
compte ces deux phénomènes, on obtient une équation qu'on appel maîtresse :
1 dP (n)
= P (n − 1) + P (n + 1) − 2P (n) (3.25)
α dt
Ceci est en faite une innité d'équations diérentielles de premier ordre, avec la
condition initiale P (n = 0, t = 0) = 1,P (n 6= 0, t = 0) = 0. La série de Fourier est
devenue une célébrité en résolvant en particulier ce genre d'équation. La méthode
que l'on va suivre est une méthode extrêmement générale. Supposons que les P (n)
sont les coecients de Fourier d'une fonction φ(s, t)
+∞
X
φ(s, t) = P (n, t) exp(ins) (3.26)
n=−∞
et essayons de voir à qu'elle équation doit obéir φ. Notons tout d'abord que
φest 2π -périodique en s. La fonction φ est appelée la fonction génératrice des
probabilités et caractérise entièrement le processus stochastique. Par exemple, on
obtient la moyenne très facilement :
X ∂φ
hni = nP (n) = −i
∂s s=0
π
1
Z
In (z) = ez cos θ cos(nθ)dθ
π 0
40
3 Les séries de Fourier.
1
0.8
0.6 n=0
0.4
0.2 n=1
n=2
n=3
2 4 6 8 10
Figure 3.6 Les fonctions e−x In (x) pour n = √0, ..., 3. Pour z 1, In (2z) ≈
z n /n!, et pour z → ∞, In (z) ≈ ez / 2πz .
P (0, t) = t/(1 + t)
P (n, t) = tn−1 /(1 + t)n+1
41
3 Les séries de Fourier.
Discutez ce résultat.
d2 un
= (C/m) (−2un + un+1 + un−1 ) (3.28)
dt2
2
Dorénavant, nous poserons ω0 = C/m.
+∞
X
φ(q, t) = un (t) exp (iaqn) (3.29)
n=−∞
42
3 Les séries de Fourier.
P+∞ P+∞
[Help : Utilisez et justiez n=−∞ un±1 exp(iaqn) = n=−∞ un exp (iaq(n ∓ 1))
].
d2 un
= ω02 (−2un + un+1 + un−1 )
dt2
+ αω02 (−2un + un+2 + un−2 )
43
4 Les transformations de Fourier.
4.1 Entrée en matière.
Nous avons vu plus haut que si une fonction était dénie sur un intervalle
ni de taille L, elle pouvait être approximée aussi précisément qu'on le veuille
par les séries de Fourier exp(2iπnx/L). On peut, pour clarier la notation, poser
q = 2πn/L et écrire pour notre fonction :
X
f (x) = feq exp(iqx) (4.1)
q
où q varierait par pallier discret de 1/L. Notez également que les coecients sont
donnés de façon fort symétrique
Z L
feq = (1/L) f (x) exp(−iqx)dx (4.2)
0
C'est en quelque sorte une formule d'inversion que nous devons à l'orthogonalité.
Cela est fort sympathique, mais si on voulait approcher notre fonction sur toute
l'intervalle ]−∞, ∞[ ? La réponse simple (simpliste) serait que q deviendrait alors
une variable continue, la somme se transforme en une intégrale, et nous avons :
+∞
1
Z
f (x) = fe(q) exp(iqx)dq (4.3)
2π −∞
Z ∞
fe(q) = f (x) exp(−iqx)dx (4.4)
−∞
44
4 Les transformations de Fourier.
2. La fonction Π(x), appelé porte, est dénie par Π(x) = 0 si |x| > 1 et Π(x) = 1
si x ≤ 1. Sa TF est donnée par f˜(q) = 2 sin(q)/q . Cette fonction joue un rôle
important dans la théorie de la diraction.
Nous n'avons pas énoncé dans quelle condition les TF existent. Une condi-
tion susante évidente serait que f doit être sommable. Nous ne rentrons pas
plus dans le détail, disons simplement qu'en général, les résultats obtenus sont
radicalement aberrants si on a violé les limites permises.
Exercices.
45
4 Les transformations de Fourier.
Z Z
−iqx −iqa
f (x − a)e dx = e f (x)e−iqx dx
46
4 Les transformations de Fourier.
Un ltre ne laisse passer que certaines fréquences. Par exemple, pour la récep-
tion radio de France Info, on règle un circuit électrique pour ne laisser passer que
le 105.5 MHz. En optique, on fait souvent un ltrage spatial pour nettoyer un
faisceau laser et enlever les speackles. Le principe est toujours le même : nous
avons un signal x(t) en entrée et un signal y(t) en sortie. Dans le cas d'un circuit
RLC, ils sont reliés par une équation diérentielle
d2 y dy
2
+α + ω02 y = x(t)
dt dt
Une habitude veut que la variable réciproque est notée q (ou k ) quand la variable
directe est x, et ω (ou ν) quand la variable directe est t. En prenant la TF des
deux côtés de l'équation, on obtient
x̃(ω)
ỹ(ω) = (4.5)
(−ω 2 + iαω + ω02 )
Le signal en entrée x(t) est la superposition d'oscillations pures exp(iωt),
chaque oscillation ayant un poids x̃(ω). L'équation (4.5) montre comment le poids
de chacune de ces oscillations est modié en sortie. Le signal (temporel) en sortie
est la superposition de ces oscillations avec le poids ỹ(ω). L'amplitude du poids
de la fréquence ω en entrée est donc divisée par [(ω 2 − ω02 )2 + α2 ω 2 ]1/2 . Chaque
2 2
composante de sortie subit également un déphasage φ = arctan[(ω0 − ω )/αω].
47
4 Les transformations de Fourier.
Il existe bien sûr autant de ltre que de problème à traiter. Les images issues
de la microscopie éléctronique sont souvent brouillées par des pixels aléatoires.
Pour nettoyer ces images, on ltre les hautes fréquences : on prend la TF de
l'image (c'est une TF à deux dimensions) et on coupe les hautes fréquences, en
mulitpliant la TF par une fonction d'Heaviside H(q0 − q) où q0 est la fréquence
(spatiale) de coupure. On prend alors la TF inverse et l'image résultantes a été
nettoyé du bruit aléatoire. Bien sûr, dans l'opération, on a aussi perdu peut-
être quelques informations. L'opération peut-être résumé comme suit : In (x) =
-1
TF [H(q0 − q)TF[I(x)] ].
∞
1
Z
f˜ν (ω) = e−(ν−iω0 )t + e−(ν+iω0 t) e−iωt dt
2 0
ν + iω
=
(ν + iω)2 + ω02
ω
f˜(ω) = i
ω02 − ω 2
Bien sûr, si on voulait prendre la TF inverse, on aurait à nouveau des problèmes
pour l'intégration autour des singularités ω = ±ω0 . On s'en sort en prenant la
valeur principale des intégrales. Quelques connaissances de la théorie d'integra-
1
tion dans le plan complexe nous montre alors qu'on trouve bien le bon résultat .
Le lecteur peut démontrer, en suivant une démarche analogue, que
ω0
TF [H(t) sin(ω0 t)] =
ω02 − ω2
48
4 Les transformations de Fourier.
AB l
φ = ω0 ∆t = 2πf = 2π
c λ
où λ est la longueur d'onde de la lumière (entre 0.3 et 0.8 micron pour la lu-
mière visible). Le lecteur connaît sans doute tout cela depuis le premier cycle
universitaire.
Chaque point d'un objet recevant une onde luminueuse peut être considéré
comme une source secondaire. Si a exp(iω0 t) est le champs qui arrive au point P ,
le champs émis est ar exp(iω0 t + iφ). Le coecent r (≤ 1) désigne l'absorption
de la lumière au point P . Le coecient φ est le déphasage induit au point P si
par exemple en ce point, le matériaux a un indice diérent de son environnement.
Le coecient complexe T = r exp(iφ) est le coecient de transmission du point
P. Un objet est donc caractérisé par une fonction complexe f (x) qui est son
coecient de transmission pour chacun de ses points x.
Considérons maintenant une onde plane arrivant sur un objet (qui pour plus
de simplicité, nous considérons unidimensionnel) et un point P à l'inni dans la
direction θ (Fig. 4.1(a)). Le champ récu en ce point est la somme des champs
secondairse émis par les divers points de l'objet. Par rapport au rayon OP que
l'on prend comme référence, le rayon AP aura un déphasage de φ = −2πAA0 /λ =
−(2π/λ)x sin(θ). En appelant q = (2π/λ) sin(θ), et en appelant f (x) la fonction
de transmission de l'objet, nous voyons que le champs au point P vaut
Z
f (x) exp(−iqx)dx
49
4 Les transformations de Fourier.
d'une lentille. Voir des objets transparents, comme par exemple des cellules dans
l'eau n'est pas possible en microscopie classique. Zerniké, dans les années 1950,
a inventé une technique appelé contraste de phase, qui consiste à introduire des
ltres dans le pfa de l'objectif et permet la visualisation des objets transparents
sous microscope.
Soit une particule dans un puits harmonique (Ep = (1/2)kx2 ) soumis à une
force extérieure F (t). Nous désirons savoir quelle énergie cette force transfert à
la particule. L' équation du mouvement s'écrit :
d2 x
+ ω02 x = (1/m)F (t) (4.6)
dt2
où ω02 = k/m est la fréquence propre d'oscillation de la particule. Nous supposons
qu'au temps T1 du début, l'osciallateur est au repos. L'énergie totale transférée
à l'oscillateur est donc la somme de son énergie cinétique et potentielle au bout
d'un temps T2 (que nous prendront égale à +∞ par la suite).
Notons tout de suite que la gauche de l'équation (4.6) peut s'écrire (d/dt −
iω0 )(d/dt + iω0 )x. Comme nous allons voir, cette décomposition a son utilité. En
mécanique quantique, on appellerai l'analogue de ces termes des opérateurs de
création et d'annihilation qui sont fréquemment utilisé. Par ailleurs, H , L'énergie
2
totale du système (cinétique + potentielle ), s'écrit :
50
4 Les transformations de Fourier.
Il nous sut maintenant d'eectuer une integration par partie du côté gauche
T1 pour
de l'intégrale et d'utiliser le fait que l'oscillateur est au repos à l'instant
trouver que ce côté vaut z(T2 ) exp(−iω0 T2 ). Comme en plus l'oscillateur est au
repos avant T1 , on peut étendre l'intégrale à −∞. Quand T2 → +∞, le côté droit
devient égale à la TF de F évaluée pour la fréquence ω0 , et nous avons
1
∆E = F̃ (ω0 )F̃ ∗ (ω0 )
2m
Pour connaître l'énergie totale transférée à l'oscillateur, nous n'avons pas à ré-
soudre l'équation diérentielle de second ordre avec second membre, évaluer sim-
plement la TF de la Force appliquée à la fréquence propore de l'oscillateur nous
sut.
Vous pouvez donc facilement calculer l'énergie transférée dans les cas suivants :
51
4 Les transformations de Fourier.
fonction f (x) sur l'intervalle [−L/2, L/2]. Ses coecients de Fourier (complexe)
sont donnés par
L/2
1
Z
cq = f (x)e−iqx dx
L −L/2
où pour plus de simplicité, nous notons q = 2πn/L. Désignons par I(q) l'intégrale
ci-dessus (sans le facteur 1/L donc). Par dénition, nous avons pour f (x) :
X
f (x) = (1/L)I(q)eiqx
q,2π/L
+∞
1
Z
f (x) = I(q)eiqx dq
2π −∞
Par ailleurs, il est évident que quand L → ∞, I(q) tend vers f˜(q) donnée par
l'équation (4.4).
x = (x1 , x2 , ..., xd )
1
Z
f (x) = f (k)eik.x dk
(2π)d Rd
52
4 Les transformations de Fourier.
1.0
0.8
0.6
0.4
0.2
5 10 15 20
-0.2
-0.4
53
4 Les transformations de Fourier.
π
sin(kr)
Z
e−ikr cos θ sin θdθ = 2
0 kr
et donc nalement
∞
4π
Z
f˜(k) = rf (r) sin(kr)dr
k 0
En faisant le même chemin pour la TF inverse, nous avons
∞
−1
Z
f (r) = kf (k) sin(kr)dk
πr 0
au dimension d = 1, 2, 3.
54
5 Les distributions.
5.1 Ce qu'il faut savoir.
Les transformées de Fourier nous posent quelques problèmes quant à la dé-
nition de base orthogonale. Nous avons vu que, sur l'intervalle ] − ∞, +∞[, la
fonction f (x) peut être représentée comme la superposition des fonctions exp(iqx)
avec le poids f˜(q). Pour en revenir à notre image de base dans l'espace des fonc-
(q ∈ R) forment une base, et les coecients f˜(q) sont les
iq(.)
tion, les fonctions e
projections du vecteur f (.) sur les vecteurs de cette base.
Nous avions aux sections précédentes basé nos démonstrations sur le concept
d'orthogonalité. Mais peut on dire que exp(iq1 x) et exp(iq2 x) sont orthogonales ?
Le produit scalaire a t'elle encore un sens ? En eet, comment dénir la valeur de
Z +∞
exp(iq1 x) exp(−iq2 x)dx (5.1)
−∞
55
5 Les distributions.
ponctuelle au point considéré. Pour une charge ponctuelle Q, quel que soit la taille
de la sphère autour, la quantité totale de la charge à l'intérieur reste constante.
En gros, pour une charge ponctuelle placé en x0 , la densité de charge est nulle
partout, sauf en x0 où elle vaut innie ! Ce genre de densité innie en un point,
nulle partout et dont l'intégrale est nie est justement un delta de Dirac. Les
mathématiciens nous exécuteraient si on appelait ces objets des fonctions et nous
obligent à les nommer des distributions. La propriété de delta de Dirac est la
suivante : Z
δ(x)dx = 1 ∀I 3 0 (5.3)
I
Du moment que l'intervalle I contient 0, l'intégrale vaut 1, sinon elle vaut zéro.
L'objet de ce chapitre est de se familiariser avec les distributions, et en particulier
avec la distribution de Dirac.
On peut voir δ(x) comme un processus de limite. Prenons le cas de la fonction
1 2
fa (x) = √ e−(x/a)
a π
C'est une gaussienne centrée sur 0, et son intégrale vaut 1. Quand a → 0, elle
devient de plus en plus piquée, avec une extension de moins en moins large, mais
l'intégrale reste constante. On peut dire la même chose de la fonction ga (x) =
(1/2a)Π(x/a) ou en faite de n'importe quelle fonction qui, lors d'un processus de
passage à la limite, réduit son extension, augmente l'amplitude de son pique, et
garde son intégrale constante. La distribution δ(x) est la limite de ce genre de
fonction.
La dénition (5.3) nous permet quelques généralisations. Par exemple, on peut
dénir 3δ(x), la distribution dont l'intégrale vaut 3 sur des intervalles contenant
0. On peut même dénir f (x)δ(x) où on suppose f (x) continue en 0. L'intégrale
vaut : Z +∞ Z +
f (x)δ(x)dx = lim f (x)δ(x) = f (0)
−∞ →0 −
Z
f (x)δ(x)dx = f (0) ∀I 3 0 (5.4)
I
δ(x) est
R une distribution centrée sur 0. δ(x − x0 ) est une distribution centrée sur
x0 et δ(x − x0 )f (x) = f (x0 ). Finalement, les règles pour manipuler les δ ne sont
pas vraiment compliquées.
56
5 Les distributions.
La TF de δ(x)est la fonction constante 1. Cela veut dire que δ(x) est la superpo-
sition, à poids égal, de toutes les modulations exp(iqx) ! Cela n'est pas vraiment
étonnant : comme δ(x) varie vraiment très rapidement, toutes les modulations
doivent y être présent. Inversement,
1
Z
exp(iqx)dq = δ(x) (5.5)
2π R
57
5 Les distributions.
(1/a) exp(−x2 /a2 ) quand a → 0. Voilà, il faut avoir cela en tête à chaque fois que
l'on veut vérier la cohérence des équations qui impliquent des δ .
δx0 [f ] = f (x0 )
Voilà, le tour est joué. Cette fonctionnelle est bien le delta de Dirac δ(x − x0 )
dénie plus haut. Noter bien l'opération : on peut identier une partie de l'espace
F avec l'espace E via ces Lg que nous avions construit : à chaque élément de E
nous pouvons faire correspondre un élément de l'espace F. Mais l'espace F est
plus vaste, et quelques uns de ces éléments en plus constituent les distributions
inhabituelles. C'est un peu comme enrichir l'ensemble des nombres rationnels Q
pour arriver à l'ensemble des nombres réel R.
1. En réalité, l'espace des fonctions à support bornés et inniment dérivable, mais nous ne
sommes pas à notre premier délit.
58
5 Les distributions.
On peut dénir des opérations sur les distributions. Il est toujours plus simple
de partir des distributions du genre Lg dont le sens est familier pour dénir
ensuite les mêmes opérations sur les distributions du genre δ. Par exemple, que
veut dire Lg0 ?
Z Z
0
L [f ] =
g0 g (x)f (x)dx = − g(x)f 0 (x)dx = −Lg [f 0 ]
R R
(N'oublions pas que comme f et g sont au moins sommable, elle tendent vers zéro
pour x → ∞). On peut donc dénir :
De même, nous pouvons démontrer que H 0 (x) = δ(x). Nous ne continuerons pas
plus le développement formel des distributions. Mais la constructions de Schwarz
est extrêmement élégante et nous conseillons au lecteur de voir au moins une fois
les bases rigoureuses de cette construction.
Nous voyons cependant que l'espace plus large des distributions nous permet de
manipuler aisement des objets qui nous semblaient interdit. Une force ponctuelle
a un sens. Une discontinuité également. En physique, une fonction ne peut pas
être discontinue. La densité de l'eau ne saute pas de ρl à ρv à l'interface liquide
solide, il existe une couche d'épaisseur petite (très petite devant les autres echelle
de longueur) où la densité varie continuellement d'une valeur à une autre. La
lumière rééchit par un mirroir pénetre sur une petite longueur dans le mirroir
où son intensité décroît exponentiellement et ainsi de suite. Nous pouvons donc
caractériser les discontinuité des fonctions par des distribtion. Soit la fonction
f (x) = g(x)+∆H(x−x0 ) , où la fonction g est une fonction continue est dérivable
− +
en x0 . La fonction f par contre, saute de la valeur g(x0 ) à x0 à ∆ + g(x0 ) à x0 .
0 0
Au sens des distributions, la dérivé de f est donnée par f (x) = g (x) + δ(x − x0 ).
0
Imaginez donc f comme une fonction normale, avec une èche positionnée en
x0 .
Exercices.
59
5 Les distributions.
P+∞
4. Une peigne de Dirac est déni par Ξ(x) = n=−∞ δ(x − n). C'est comme
si nous avions posé un delta de Dirac sur chaque nombre entier. Quelle est
la TF de Ξ(x/a) ?
5. Démontrer que δ(x + a) = δ(x) + aδ 0 (x) + (1/2)a2 δ 00 (x) + ... On peut faire
un développement de Taylor des δ comme pour les fonctions usuelles. Pour
pouvoir démomntrer cette égalité, appliquer les deux côtés de l'égalité à
une fonction f
6. Démontrer que δ(−x) = δ(x) et δ(ax) = (1/|a|)δ(x).
7. Considérons une fonction g(x) avec un zéro simple en x0 : g(x0 ) = 0,
g 0 (x0 ) 6= 0. Prenons un intervale I = [x0 − a, x0 + a] autour de x0 (on
peut supposer a aussi petit que l'on veut). En développant g autour de sa
racine à l'ordre 1, démontrez que
1
Z
δ(g(x))f (x)dx = f (x0 )
I |g 0 (x 0 )|
8. En supposant que la fonction g(x) n'a que des racines simples, et en utilisant
le résultat ci-dessus, démontrer :
X 1
δ (g(x)) = δ(x − xi )
i
|g 0 (xi )|
où les xi sont les racines simples de g(x). Donner comme application l'ex-
pression de δ(x2 − a2 ).
9. En vous inspirant du résultat de la question 5, pouvez indiquer pouquoi
dans la question 7, nous pouvions nous restreindre à un développement
d'ordre 1 ?
2πAδ(ω − ω1 )
x̃(ω) =
ω02 − ω 2
R
comme x(t) = (1/2π) x̃(ω) exp(iωt)dω , nous trouvons
A exp(iω1 t)
x(t) =
ω02 − ω12
Nous connaissions ce résultat depuis l'exercice sur le ltrage.
60
5 Les distributions.
1 1
F(t) y(t)
0.5 0.5
0 0
-2 -1 0 1 2 3 4 -2 -1 0 1 2 3 4
t
d2 y dy
m +λ + ky = F (t)
dt2 dt
Nous souhaitons connaître la reponse de l'oscillateur à une force impulsionnelle
F (t) = F0 δ(t). Ceci est l'idealisation d'un coup de marteau très bref et très puis-
sant sur l'oscillateur. Pour simplier le problème, nous supposons dans un premier
temps que la masse est négligeable ( que les forces d'inertie sont petites devant
les forces de frottement ) et que l'osciallateur est au repos. En renormalisant nos
coecient, l'équation prend la forme :
dy
+ νy = f0 δ(t) (5.6)
dt
et en prenant la TF des deux cotés, nous trouvons que ỹ(ω) = f0 /(ν + iω). Il
sut maintenant de prendre la TF inverse. Il se trouve que dans ce cas, si l'on se
souvient de l'exercice (†4.1 :2), nous pouvons directement écrire
Ce résultat est représenté sur la gure (5.1). Nous suggérons au lecteur de discuter
les limites λ→0 et λ → ∞.
Equation de la chaleur avec une source ponctuelle. Une goutte d'encre extré-
mement concentrée, déposé en un point de l'espace va se diluer en diusant. De
même pour un pulse ponctuel de chaleur. Comme nous l'avons vu précédemment,
61
5 Les distributions.
∂u ∂2u
= D 2 + Q(x, t)
∂t ∂x
où u désigne la température ou la concentration et Q est un terme de source.
Dans le problème qui nous interesse ici, Q(x, t) = Q0 δ(x)δ(t). En prenant la TF
par rapport à la variable d'espace x, nous avons :
Mais cette équation est exactement eq.(5.6), celle qu'on a écrit pour l'oscillateur
amorti. C'est bien une équation diérentielle ordinaire par rapport à la variable
temps, et q peut être considerer comme une constante : Pour chaque mode q , nous
avons une EDO indépendante. La solution est donc analogue à (5.7), et s'écrit :
+∞
1
Z
u(x, t) = ũ(q, t).eiqx dq
2π −∞
x2
Q0 1
= √ √ exp −
2 π Dt 4Dt
La dernière integrale s'obtient facilement par les techniques que nous avons déjà
utilisé. L'évolution de u(x) pour diérente valeur de t sont représenter sur la
gure (5.2).
Extension (dicile) : si la source n'est pas ponctuelle dans le temps, mais
seulement dans l'espace, i.e. Q(x) = Q0 δ(x), quel est le comportement de la
solution ? Help : Essayez comme avant d'obtenir une expression pour ũ(q, t). Cette
expression est trop compliquée pour inverser, mais ∂t ũ(q, t) l'est beaucoup moins.
-1
En changeant alors l'ordre des operation TF et ∂t , vous pouvez obtenir une
expression pour ∂t u(x, t). Il vous sut alors d'evaluer
Z τ
u(x, τ ) = ∂t u(x, t)dt
0
Equation d'onde avec source ponctuelle. Considérons une corde tendue innie
et au repos à l'instant initial. A l'instant t = 0, on la soumet à une force ponctuelle
62
5 Les distributions.
0.8
0.6
0.4
0.2
0
-4 -2 0 2 4
x
dans le temps et dans l'espace (l'idéalisation d'un marteau de piano tapant sur
la corde). l'équation d'onde s'écrit
∂2u 2
2∂ u
− v = γδ(x)δ(t)
∂x2 ∂x2
En suivant la même démarche que ci-dessus, vous devriez pouvoir obtenir la pro-
pagation de l'onde. Vous pouvez notemment montrer que l'extension du domaine
ou u 6= 0 croit à la vitess v.
Par la suite, sans perte de généralité, nous supposons notre signal normée :
u2 (x, t)dx = 1. Supposons par exemple que notre signal se propage sans se
R
I
déformer u(x, t) = u0 (x − ct) et nous avons alors
Z Z
x̄(t) = xu20 (x) + ct u20 (x)
I I
= x̄0 + ct
63
5 Les distributions.
En rempalçant dans l'expression (5.9), nous voyons que cela nous donne
Z
x̄(t) = x̄0 + ct ũ0 (q)ũ∗0 (q)dq
I
=x̄0 + ct
dω
c=
dq
Prenons maintenant le cas plus général de signaux se déformant en se propageant.
Il existe un cas très important appelé milieu dispersif, où la déformation du signal
64
5 Les distributions.
c'est à dire que le mode q est pondéré par un facteur de phase ω(q)t au temps
t, avec une forme ω(q) quelconque, sans plus nécessairement être proportionnel
au mode q. Dans le cas d'un cristal par exemple, on peut démontrer (voir le
problème correspondant au chapitre sur les séries de fourier) que ω(q) = A sin(q).
Nous pouvons néanmoins calculer la vitesse du baricentre du signal comme avant :
Z
dω
x̄(t) = x̄0 + t ũ0 (q)ũ∗0 (q)dq
I dq
Si ω(q) varie de façon lente par rapport à ũ0 (q)ũ∗0 (q), et que ce dernier possède
un pic étroit en q0 , alors une bonne approximation pour la vitesse du baricentre
serait
dω
c=
dq q=q0
Ceci est ce qu'on appelle la vitesse du groupe. L'expression ω/q , ayant un sens
pour les signaux se propageant sans déformation, s'appelle la vitesse de phase.
d2 x dx
m +ν = ξ(t)
dt2 dt
ν est la viscosité et ξ(t) une force aléatoire. Nous ne connaissons de cette force que
ses caractéristique stochastique : La moyenne de cette force est nulle, hξ(t)i = 0
2
et sa variance est proportionnelle à la température : ξ (t) = αT . D'autre part,
c'est un bruit blanc : si nous connaissons la valeur de cette force à un instant,
nous ne pouvons rien dire sur sa valeur à quelque temps que ce soit après.
5.4 Exercices.
1. Que valent les distributions δ(x) cos(qx), δ(x) sin(qx) et δ 0 (x) sin(qx) ?
2. En dérivant directement la fonction y(t) = (f0 /ω0 )H(t) sin(ω0 t), démontrer
qu'elle est la solution de ÿ + ω02 y = f0 δ(t).
3. Démontrer que tH(t) est la primitive de H(t). En utilisant une integration
par partie, trouver la primitive de tH(t).
65
5 Les distributions.
y y
f f
a a
x x
(a) (b)
Figure 5.4 la èche d'un pont sous l'eet d'une force ponctuelle.
7. Démontrer que Z Z
xu2 (x)dx = ũ0 (q)ũ∗ (q)dq
I I
où ũ(q) est la TF de u(x). Help : écrire ũ0 (q) et ũ∗ (q) par leurs dénition
des TF, former leurs produit et intégrer sur q . Il sura juste de remarquer
R
que
I
exp(iq(x − y))dq = 2πδ(x − y).
66
6 Convolution et corrélation.
Deux concepts abondemment utilisé en physique ( et bien d'autres endroist )
sont les convolutions et les correlations. Les TF nous permettent de calculer ces
choses de façon assez simple.
Z +∞
h(x) = (f ∗ g)(x) = f (s)g(x − s)ds
−∞
Z x+`
h(x) = f (s)ds
x−`
Z +∞
x−s
= f (s)Π( )ds
−∞ `
= (f ∗ Π` )(x)
Ici, Πl (x) = Π(x/`) est la fonction de l'appareil. Les fonctions d'appareil peuvent
avoir des formes plus compliquées, comme par exemple une gaussienne. Le facteur
limitant la précision du signal est le pouvoir de résolution ` de l'appareil qui
lisse et rend ou le signal original. Par exemple, un objectif de microscope est
67
6 Convolution et corrélation.
1.5 l=0.1
l=0.3
l=0.5
1 l=0.7
0.5
0
-3 -2 -1 0 1 2 3 4
un appareil de mesure dont le signal mesuré est l'image formée . Ernst Abbe,
physicien de la compagnie Carl Zeiss dans les années 1890, a developpé la théorie
de la formation d'image et démontré que le pouvoir de résolution des objectifs et,
au mieu, ` = λ/2N A, où λ est la longueur d'onde utilisée et N A est l'ouverture de
l'objectif (le sinus de l'angle maximum de capture de la lumière). Les microscopes
optiques ne peuvent donc pas voir les echelles plus petites que 0.2 micron.
Exercice : soit le signal f (x) = δ(x) + δ(x − x0 ), c'est à dire deux piques de dirac
distant de x0 . Calculer et tracer le signal mesuré si la fonction de l'appareil
est (i)Πl ; (ii) Gl = exp(−x2 /2`2 ). Traiter particulièrement les cas x0 `
, x0 ` et x0 ≈ ` (voir gure 6.1). Pouvez vous determiner dans le cas de
la gaussienne, à partir de quelle `, nous ne pouvons plus distinguer deux
piques séparées ?
Z +∞ Z +∞
h̃(q) = dx e−iqx ds f (s)g(x − s)
−∞ −∞
Z +∞ Z +∞
= ds f (s) dx e−iqx g(x − s)
−∞ −∞
Z +∞ Z +∞
−iqs
= ds f (s)e dx e−iqx g(x)
−∞ −∞
= f˜(q)g̃(q)
68
6 Convolution et corrélation.
x2
1 1
√ p exp − 2
2π l2 + p2 2(l + p2 )
pour vraiment apprecier les TF, faire le calcul d'abord dans l'espace direct,
et ensuite à l'aide des TF. Une gaussienne de largeur l est la fonction
1
√ exp(−x2 /2l2 )
2πl
Les resultats ci-dessus sont important. Supposons que nous ayons deux variables
aléatoires gaussienne de largeur l. Leur moyenne est alors également une variable
√
aléatoire gaussienne, mais de largeur l/ 2. Ce résultat se généralise
√ à N variables
aléatoires : la moyenne est alors une gaussienne de largeur l/ N . La moyenne de
√
N variables aléatoires est également une variable aléatoire, mais qui uctue N
fois moins que les variables originales. C'est pour cette raison par exemple qu'un
expérimentateur, pour caractériser un phénomène physique, prend plusieurs me-
sure et calcule leur moyenne (voir les problèmes avancés).
69
6 Convolution et corrélation.
Exercices :
Z ω+1/T
H̃(ω) = 2T f˜(ν)Ã(ν)dν
ω−1/T
On voit donc que l'intervalle de temps ni mélange les fréquences. Que
trouve t'on à la limite T → ∞?
6.2 Auto-corrélation.
Un outil indispensable en physique est le concept d'auto-corrélation. Cela joue
un rôle important dans les processus stochastiques, la diraction, ...Supposons
que nous avons une fonction x(t). Pour plus de simplicité, nous considérons notre
signal de moyenne nulle, c'est à dire
t+T
1
Z
lim x(t)dt = 0
T →∞ T t
Nous désirons savoir combien d'information nous pouvons avoir sur x(t + τ ) si
nous connaissons le signal en t. Cette quantité est contenu dans la fonction d'auto-
corrélation Z +∞
G(τ ) = x∗ (t)x(t + τ )dt
−∞
Le complexe conjugué est nécessaire si l'on veut que pour τ = 0 G(τ ) soit réelle.
Dans beaucoup de cas, le signal est réel et le complexe conjugué dans l'espace
réelle n'a pas d'importance. Concrètement, nous prenons notre signal au temps
70
6 Convolution et corrélation.
Exercice : le démontrer.
71
6 Convolution et corrélation.
Problèmes avancés.
Soit une fonction (représentant par exemple une concentration ou une proba-
bilité, ...) obéissant à l'équation de diusion
∂c ∂2c
=D 2
∂t ∂x
Et soit la fonction d'auto-corrélation spatiale
Z ∞
G(y; t) = c(x; t)c(x + y; t)dx
−∞
d2 x dx
m +ν + kx = f ξ(t) (6.5)
dt2 dt
m est la masse de la particule, ν est la force visqueuse et k la constante du
ressort. Ceci constitue une équation diérentielle stochastique, et le formalisme a
été développé par Langevin vers 1910. La partie gauche de l'équation est celle du
mouvement classique d'une particule attaché à un ressort. La partie droite tient
compte des chocs aléatoires des molécules du uide qui entourent la particule et
qui font subir à cette dernière une force. La fonction ξ est une fonction aléatoire,
c'est à dire qu'on ne connaît pas vraiment la valeur qu'elle peut prendre, mais
seulement la probabilité qu'elle prenne une certaine valeur. Cela généralise le
72
6 Convolution et corrélation.
10
8
6
4
2
0
0 1 2
f est l'amplitude
concept de variable aléatoire utilisé en calcul des probabilités.
KB T /a, où a est la taille de la particule.
des chocs aléatoires et vaut
On suppose que la fonction ξ est de moyenne nulle, c'est à dire qu'il y a autant
de chance, en moyenne, que les chocs mènent vers la gauche que vers la droite. De
plus, on suppose que la connaissance de la valeur de ξ(t) ne nous donne aucune
information sur ξ(t + τ ), quelque soit τ. On exprime cela par
Z
G(τ ) = ξ(t)ξ(t + τ ) = δ(τ ) (6.6)
où bien sûr, δ désigne le delta de Dirac. Cela n'est pas trop dur à imaginer :
comme ξ(t + τ ) est complètement indépendant de ξ(t), il y'a autant de chance
qu'il soit de signe contraire que de même signe. A la longue, l'intégral doit tendre
vers 0. Par contre, ξ 2 (t) > 0, son intégrale tend donc vers l'inni (reportez vous
à notre discussion sur ce genre d'objet au chapitre précédent). En prenant la TF
de l'éq.(6.6), on obtient :
˜ ξ˜∗ (ω) = 1
G̃(ω) = ξ(ω)
˜
(ω02 − ω 2 + iνω)x̃(ω) = (f /m)ξ(ω)
˜ 2 (f /m)
|x(ω)| = (6.7)
(ω02 − ω 2 )2 + ν 2 ω 2
Cette fonction présente un pique à ω ≈ ω0 , comme on peut le constater sur la
gure 6.2.
1
On peut faire beaucoup de chose à partir de là. En physique, on réalise souvent
des ressorts de taille micrométrique pour exercer des forces sur des bactéries où
73
6 Convolution et corrélation.
Une variable aléatoire X est une fonction qui produit un nombre aléatoire à
chaque réalisation. On peut se donner l'image d'un boitier éléctronique qui ache
un nombre à chaque fois qu'on appuie sur un bouton (une réalisation). C'est par
exemple, le jeté d'un dés ; ou le temps entre l'arrivé de deux particules sur notre
senseur ; ou la direction prise par une amibe au fond d'une boite de petri quand on
la photographie toute les 30 secondes ; ou le cours de la bourse à chaque seconde ;
...
On caractérise une variable aléatoire (que l'on suppose continue) par sa densité
de probabilité f (x) : la probabilité d'observé une réalisation de X entre x et x+dx
est égale à f (x)dx . Cela veut dire concrétement que si on eectue par exemple 106
réalisations (mesurons l'arrivé d'un million de particule sur notre senseur), une
proportion f (x)dx des réalisation tomberont dans l'intervalle [x, x + dx[. D'après
ce que nous venons de dire, il est évident que f (x) ≥ 0 et
Z +∞
f (x)dx = 1
−∞
74
6 Convolution et corrélation.
Z +∞
hXi = xf (x)dx
−∞
Z +∞
hV (X)i = V (x)f (x)dx
−∞
Exercices. La suite des exercices suivantes vous entraine à manipuler les pro-
babilités. Si vous les suivez dans l'ordre jusqu'au bout (bravo), cela vous ménera
à la démonstration du théorème de la limite centrale : quelque soit la densité de
probabilité de la fonction X (pourvu qu'elle est une variance nie), la densité de
probabilité de la moyenne de
√ N de ces variables est une gaussienne, de largeur
σ/ N , où σ2 est la variance de X. L'ensemble de ces exercices constitue un bon
cours de probabilité.
6. Que valent φaX (t) et φX+Y (t) ? Que vaut φZn (t) ?
7. Démontrer que de façon générale, φX (t) a un maximum absolue à t = 0.
2
8. On suppose que hXi = 0 et V ar(X) = σ . Développer φZn (t) à l'ordre√2 en
t autour de son maximum, et démontrer qu'elle tend vers exp(−σ 2 t/2 N ).
n
[Help : (1 + x/n) → exp(x)]. En déduire la densité de probabilité de Zn .
Généraliser ce résultat au cas hXi =
6 0.
75
6 Convolution et corrélation.
D'abord, un peu de géométrie diérentielle. Soit une courbe dans le plan. Nous
pouvons par exemple la décrire par l'équation y(x) ou par ses coordonnées para-
métrique x(t), y(t). Si nous appelons l'extrémité de la courbe A, la longueur d'arc
à partir de A jusqu'à un point P est dénie par
Z tp
s= ẋ2 (t) + ẏ 2 (t)dt
0
Appelons l'angle θ(s) l'angle que fait la tangente à la courbe au point P avec
l'axe y. En faite, nous pouvons parfaitement dénir la courbe par la donnée
de la fonction θ(s). Par exemple, θ = Cte décrit une droite, θ = s/R décrit
un cercle de rayon R. Cette description d'une courbe s'appelle semi-intrinsèque.
La courbure de la courbe à la position s est donnée par κ = (dθ)/ds)2 . Nous
pouvons également décrire une courbe dans le plan par la donnée de κ(s) de
façon totalement intrinsèque, sans réference à aucun système d'axe.
Soit maintenant un polymère (à deux dimensions) de longeur L (L → ∞ à
l'échelle moléculaire, comme l'ADN par exemple) baigant dans un bain à tempé-
rature T. L'énergie emmagasinée dans le polymère par unité de longeur dépend
de la courbure de sa conformation et s'écrit
Z L
E= Bκ2 (s)ds
0
76
7 Les transformées de Laplace.
7.1 Entrée en matière.
Les mathématiciens ont inventé de nombreux transformation intégrale d'une
fonction, parmi lesquels nous avons vu les transformées de Fourier. Une autre
transformation extrêmement utilisée est celle de Laplace. Les transformées de
Laplace sont les cousins des transformées de Fourier. Leur relation est celle de
la fonction exponentielle et de la fonction sinus ou cosinus. Comme vous vous
souvenez, pour prendre la TF, on multiplie la fonction f (t) par exp(iωt) et on
intègre entre, notez le bien, −∞ et +∞. Pour les TL, on multiplie la fonction par
exp(−st) et on intègre entre, cette fois, 0 et +∞
Z ∞
f˜(s) = TL[f (t)] = f (t) exp(−st)dt
0
1. TL[1] = 1/s
2. TL[exp(−at)] = 1/(s + a)
77
7 Les transformées de Laplace.
3. TL[t] = 1/s2 . Pour le démontrer, il sut d'eectuer une intégration par partie :
Z +∞
1 +∞ −st
Z
te−ωt dt = 0 + e dt
0 s 0
1
=
s2
Translation. TL[ exp(−at)f (t)] = f˜(s + a) Multiplier l'originale par une expo-
nentielle revient à translater l'image. Par exemple, TL[1] = 1/s, donc TL[exp(−at)] =
1/(s + a).
1. Vous remarquerez que nous avons souvent été négligent avec l'orthodoxie des convergences
et des dérivations sous le signe somme. Mais vous pouvez facilement démontrer qu'ici au moins,
nous n'avons pas enfreint de règles ( démontrez le).
78
7 Les transformées de Laplace.
0
TL[f (t)] = −f (0) + sTL[f (t)]
En généralisant cela, nous voyons que TL[f ”(t)] = s2 f˜(s) − sf (0) − f 0 (0), et ainsi
de suite.
α
−x0 + (s + ν)x̃(s) =
s2
Nous avions déjà, à l'exemple 3 ci-dessus, calculé la TL[t], et nous avons juste
utilisé ce résultat. En général, les TL des fonctions les plus connues sont entrepo-
sées dans des tables et on ne fait souvent que les consulter au lieu de recalculer la
TL (comme pour les tables de logarithme). En décomposant en fraction simple,
nous avons
ν 1 11 1 1
= 2− +
s2 (s + ν) s ν s ν s+ν
et la solution de notre équation s'écrit :
α 1 11 1 1 x0
x̃(s) = 2
− + + (7.2)
ν s ν s ν s+ν s+ν
Bon, nous connaissons la TL de la solution, et il faut inverser le processus pour
calculer x(t). Or, nous savons que l'originale de 1/s2 est t, l'originale de 1/s est 1
, l'originale de 1/(s + ν) est exp(−νt) (souvenez vous de la règle de translation).
Nous avons donc
α α
x(t) = t − 2 (1 − e−νt ) + x0 e−νt (7.3)
ν ν
On peut vérier, en l'injectant directement dans l'équation (7.1) que ceci est bien
la solution. Notez avec qu'elle facilité la condition initiale a été prise en compte
dans la solution.
79
7 Les transformées de Laplace.
f (t) f˜(s)
f (t/a) ˜
af (as)
exp(−at)f (t) f˜(s + a)
d ˜
tf (t) − ds f (s)
f 0 (t) ˜
sf (s) − f (0)
f ”(t) s2 f˜(s) − sf (0) − f 0 (0)
f (n) (t) n˜ Pn
s f (s) − k=1 sn−k f (k−1) (0)
Rt 1 ˜
0
f (τ )dτ s f (s)
1 1/s
t 1/s2
exp(−at) 1/(s + a)
sin(at) ou cos(at) a/(s2 + a2 ) ou s/(s2 + a2 )
sinh(at) ou cosh(at) a/(s2 − a2 ) ou s/(s2 − a2 )
−t cos(at) + √(1/a) sin(at) 2a2 /(s2 + a2 )2
√ √
1/
√ t π/ s
√
t ( π/2)s−3/2
1/(t + 1) exp(s)Γ(0, s)
Cas des racines simples. Soit f˜(s) = p(s)/q(s), où p(s) et q(s) sont des poly-
nômes et qu'en plus, q(s) n'a que des racines simples, i.e. q(s) = (s − a1 )(s −
a2 )...(s − an ). Nous voulons écrire f (s) comme
A1 A2 An
f˜(s) = + + ... +
s − a1 s − a2 s − an
80
7 Les transformées de Laplace.
Soitqi (s) = q(s)/(s − ai ). Nous voyons que qi (s) n'a pas de zero en s = ai . Quand
s → ai , le terme dominant dans f (s) est
p(s) 1 p(a) 1
f˜(s) = . = . + O(1)
qi (s) s − ai qi (a) s − ai
q(s) − q(ai )
lim qi (s) = lim = q 0 (ai )
s→ai s→ai s − ai
X p(an )
f (t) = exp(an t)
n
q 0 (an )
Exemple : f˜(s) = (3s2 −3s+1)/(2s3 +3s2 −3s−2). Nous avons p(s) = 3s2 −3s+1
3 2 0 2
, q(s) = 2s + 3s − 3s − 2 et q (s) = 6s + 6s − 3. Les zéro du dénominateur
0 0
sont aux s = 1, −2, −1/2. Comme p(1)/q (1) = 1/9, p(−2)/q (−2) = 19/9 et que
0
p(−1/2)/q (−1/2) = −13/18, nous avons
1 1 19 1 1 1
f˜(s) = + −
9s−1 9 s + 2 6 s + 1/2
Cas des racines multiples. Soit maintenant f˜(s) = R(s)/(s − a)n où R(s) est
un quotient de polynôme qui n'a pas de pôles en a. Nous voulons l'écrire sous
forme de
A0 A1 An−1
f˜(s) = + + ... + + T (s)
(s − a)n (s − a)n−1 (s − a)
où T (s) contient le développement en fractions simples autour des autres pôles.
Pour déterminer les coecients Ai nous avons à nouveau à calculer le comporte-
ment de ˜
f (s) pour s → a. Comme R(s) est tout ce qui a de plus régulier autour
de a, nous pouvons le développer en série de Taylor autour de ce point :
A0 = R(a)
A1 = R0 (a)
...
81
7 Les transformées de Laplace.
A0 A1 B0 B1
f˜(s) = 2
+ + 2
+
(s − ia) (s − ia) (s + ia) (s + ia)
Nous pouvons bien sûr tout calculer, mais remarquons simplement que dans l'ex-
pression de f˜(s), le changement de s en −s laisse ce dernier invariant. Pour avoir
cette même invariance dans l'expression de f˜(s) une fois décomposée en fraction
simple, nous devons avoir B0 = A0 et B1 = −A1 . Or, d'après ce qu'on vient de
2
dire, autour de la racine s = ia, R(s) = 1/(s + ia) et
1 1
A0 = =−
(s + ia)2 s=ia 4a2
De même,
−2 1
A1 = =
(s + ia)3 s=ia 4ia3
2
Comme l'originale de 1/(s ∓ ia) est t exp(±iat) et que l'originale de 1/(s ∓ ia)
est exp(±t), en regroupant correctement les termes, on trouve que
1 1
f (t) = − t cos(at) + 3 sin(at).
2a2 2a
1 π t cos θ
Z
In (t) = e cos(nθ)dθ
π 0
2
et il n'est pas dicile de démontrer que la trasnformée de Laplace de I0 (t) est
√
Iˆ0 (s) = 1/ s2 − 1. Cette tranformée nous
√ permet facilement d'approximer, pour
t 1, la fonction de bessel par exp(t)/ 2πt (gure 7.1). Voyons voir le comment
du pourquoi.
Nous nous sommes peu intéressé jusque là au domaine d'existence de la Trans-
formée de Laplace. Il est évident que pour que la TL ait un sens, il faut que
R∞
0
f (t) exp(−st)dt existe. Pour certaines fonctions comme exp(−t2 ), cette condi-
2
tion est toujours réalisé. Pour d'autres, comme exp(t ), elle ne l'est jamais. Enn,
82
7 Les transformées de Laplace.
0.4
I0HtL expH-tL
0.3
0.2
1 , H2 Π tL
0.1
3
pour la plupart de fonctions usuelles , la condition est réalisée si Re(s) > s0 ,
où s0 est un réél. Par exemple, pour toutes les fonctions polynomiales ou toute
pouissance positive de t, s0 = 0. Pour la fonction cosh(t), s0 = 1.
Souvent, nous nous interessons surtout au comportement de f (t) pour t grand :
nous voulons savoir rapidement si notre particule revient à une position donnée
ou si au contraire, elle part à l'inni, et si elle part à l'inni, à quelle vitesse
elle le fait. Nous allons voir dans la suite que le comportement de f˜(s) autour
de son pôle le plus à droite s0 nous renseigne directement sur le comportement
assymptotique de l'originale. Sans perte de généralité, nous allons supposer par
la suite que Re(s0 ) = 0, puisque si la TL de la fonction f (t) à un pôle en s = a,
la fonction exp(−at)f (t)a un pôle en s = 0. Le comportement assymptotique de
la fonction f (t) s'en déduit donc immediatement.
R∞
Revenons maintenant à notre fonction f (t). Si I = f (t)dt < +∞, c'est que
0
f (t) → 0 quand t → +∞ et nous n'avons pas trop de questions à nous poser
pour son comportement assymptotique. Supposons donc que I n'existe pas, mais
que la TL de f (t) est bien dénie pour Re(s) > 0. Nous pouvons toujours écrire
f (t) = g(t) + h(t), où g(t) contient le terme dominant de f (t) √ quand t → ∞
et h(t) tous les autres. Par exemple, le terme dominant de 1/ t + exp(−5t) +
√
1/(1 + t2 ) est 1/ t. Nous pouvons formellement écrire que h(t) = o(g(t)) 4 . Il
est évident que pour s → 0, la transformée de laplace est dominée par la TL
de g(t), c'est à dire h̃(s) = o(g̃(s)) quand s → 0 (exercice : le démontrer). Un
simple développement autour du pôle le plus à droite de la TL nous donne donc
directement le comportement assymptotique de l'originale.
83
7 Les transformées de Laplace.
Exemple 2. f˜(s) = 1/s(s − a)2 pour a > 0. Le pôle le plus à droite est en
s = a. f˜(s) ≈ (1/a)(s − a)−2 quand s → a et donc f (t) ≈ (t/a) exp(−at) quand
t → ∞. Remarquer que nous aurions pû pousser l'approximation un peu plus loin :
f˜(s) ≈ (1/a)(s − a)−2 − (1/a2 )(s − a)−1 et donc f (t) ≈ (t/a − 1/a2 ) exp(−at).
Exemple 3. f˜(s) = 1/(s2 + a2 )2 . La, nous avons deux pôles de même partie
réelle s = ±ia, et nous devons tenir compte des deux. Nous laissons le soin au
lecteur de démontrer que le terme dominant doit être −t cos(at)/2a2 .
Nous avons en faite souvent recours au developpement assymptotique parce que
nous ne savons pas calculer exactement l'originale. Prenons l'équation
√ ẍ + ẋ =
t avec des conditions initiales nulles. C'est l'équation du mouvement d'un
corps soumis à un frottement visqueux et à une force qui grandit comme la
racine du temps. La solution est facilement trouvée en terme de TL :
√ x̃(s) =
( π/2)s−5/2 (s + 1)−1 . Nous ne savons pas calculer
5
l'originale de cette fonction.
Par contre, comme il existe un pôle à zero, le développement assymptotique s'écrit
√
x(t) ≈ (4/3 π)t3/2 (Le démontrer. Pouvez vous calculer les deux prochaines cor-
rections à ce développement ? ).
Or, quand s → ∞, l'intégrale tend vers zéro, d'où l'égalité (7.4). Nous pouvons
aller bien sûr plus loin. Le développement de Taylor de f (t) proche de t = 0
s'écrit
f (t) = f (0) + f 0 (0)t + (1/2)f 00 (0)t2 + ...
et résulte de la TL inverse du développement assymptotique de sf (s) pour s → ∞.
(voir l'exercice 9).
84
7 Les transformées de Laplace.
On note cela par h(t) = (f ?g)(t). Il est facile de démontrer, en échangeant l'ordre
d'intégration, que
h̃(s) = f˜(s).g̃(s)
La solution de beaucoup d'équation diérentielle se met naturellement sous la
forme (7.5).
1 ˜ x0
x̃(s) = f (s) +
s+a s+a
Comme l'originale de 1/s + a est exp(−at), en utilisant le résultat sur les produit
de convolution, nous trouvons
Z t
x(t) = e−at x0 + eaτ f (τ )dτ
0
Dans le cas où le noyau K est symmetrique, c'est à dire qu'il s'écrit sous la forme
K(t − τ ), ces équations admettent une solution simple en terme de transformées
de Laplace. En prenant la TL des deux cotés, on trouve :
λ
f˜(s) = f˜(s)K̃(s) +
s
85
7 Les transformées de Laplace.
c'est à dire que f˜(s) = λ/s(1 − K̃(s)). C'est ensuite un exercice de trouver
l'orginale ou en tout cas son développement assymptotique.
où cette fois, nous sommons sur les energies disponibles au système ; n(E) désigne
le nombre d'états ayant l'énergie E. Si la diérence entre les niveaux d'énergie
est faible par rapport à notre mesure, nous pouvons réecrire la somme ci-dessus
sous forme d'une intégrale
Z ∞
Z(β) = e−βE f (E)dE (7.6)
0
86
7 Les transformées de Laplace.
où f (E)dE est le nombre d'état avec une énergie entre E et E + dE ; toutes les
énergies sont mesurées par rapport à l'énergie minimum du système E0 que nous
choisissons comme référence : E0 = 0.
Ce que nous voyons là est très simple : la fonction de partition est la transformée
de Laplace de la densité d'énergie.
r
π −1/2
Z(β) = β
k
7.9 TL inverse.
Pour pouvoir eectuer les TL inverse, il faut connaître un minimum de la
théorie d'intégration dans le plan complexe. Pour les lecteurs qui en sont familier,
mentionnons la procédure qui est juste une adaptation des TF. Considérons la
fonction f (t) telle que f (t < 0) = 0. Nous pouvons écrire la fonction e−ct f (t)
comme la TF inverse de sa TF :
∞ Z ∞
1
Z
e−ct f (t) = e−ct f (t)e−iωt dt eiωt dω
2π −∞ 0
87
7 Les transformées de Laplace.
c+i∞
1
Z
f (t) = fˆ(s)est ds
2πi c−i∞
7.10 Exercices.
1. Trouver la TL des fonctions suivantes : sin(at) ; cos(at) ; sinh(at) ; cosh(at) ;
2 2 2 2
2. Trouver, par la méthode de votre choix, l'original de a /(s + a ) . Help :
2 2 2
Remarquez que vous pouvez écrire cette fonction comme (s + a )/(s +
a ) −s /(s +a ) , et que le dernier terme vaut (1/2)s(−d/ds)(1/(s +a2 ).
2 2 2 2 2 2 2
1/s(1 − e−s ).
P
5. La TL de la fonction escalier n=0 H(t − n) est
1
I˜0 (s) = √
2
s −1
√ √
Démontrez que I0 (t) ≈ (1/ 2π) t exp(t) quand t → +∞. Help : Pour
R
Calculer des R(cos θ, sin θ)dθ, on a interêt à eectuer le changement de
variable u = tan(θ/2)
88
7 Les transformées de Laplace.
1 6
0.8 5
4
0.6
3
0.4
2
0.2
1
1 2 3 4 5 1 2 3 4
p
û(s) = C0 + C1 / s2 − 1
89
7 Les transformées de Laplace.
13. La fonction de Bessel J d'ordre 0 est dénie par J0 (z) = I0 (iz),et sa TL est
(s2 +1)−1/2 (Pouvez vous le démontrer ?).
p Démontrer que son comportement
assymptotique est donnée par J0 (z) ≈ 2/πz cos(z − π/4).
14. Résoudre ẍ+ω 2 x = b sin(ωt) avec des conditions initales x(0) = x0 et ẋ(0) =
v0 . Notez que c'est l'équation d'un oscillateur harmonique à la résonnance.
15. Résoudre x(3) + 3ẍ + 3ẋ + x = 1 avec les conditions initiales nulles.
16. Résoudre x(4) + 2ẍ + x = sin t avec les conditions initiales nulles.
17. Le mouvement d'une particule dans un champs magnétique peut être ra-
mené à la résolution du système suivant :
ẋ = αy ; ẏ = −αx
18. Resoudre
ẍ − x + y + z = 0
x + ÿ − y + z = 0
x + y + z̈ − z = 0
90
7 Les transformées de Laplace.
Nous avons vu que les TL sont très bons quand il s'agit d'avoir un début des
temps.
∂2u ∂2u
2
− c2 2 = 0 (7.7)
∂t ∂x
u(x, 0) = f (x) (7.8)
x+ct
1
Z
u(x, t) = f (x − ct) + f (x + ct) + g(ξ)dξ (7.10)
2c x−ct
Nous allons établir la même chose, mais en utilisant de façon combiné les TF
et les TL, ces derniers ayant l'avantage de gérer automatiquement les condi-
tions initiales. Le schéma de la résolution que nous allons mener est la suivante :
−1 −1
TL TF
˜ s) TL
u(x, t) → û(x, s) → û(q, → ũ(q, t)
TF
→ u(x, t). Noter que t ∈ [0, +∞[,
donc nous allons eectuer des TL par rapport à cette variable. Par contre,
x ∈] − ∞, +∞[, donc nous allons procéder à des TF pour cette dernière.
˜ s) = s 1
û(q, f˜(q) + 2 2 g̃(q)
c2 q 2 + s2 c q + s2
sin(ctq)
ũ(q, t) = f˜(q) cos(ctq) + g̃(q) (7.11)
cq
x+a
2 sin(aq)
Z
TF
g(ξ)dξ −→ g̃(q)
x−a q
91
7 Les transformées de Laplace.
Problème : le théorème H.
−c(x) = 0 (7.12)
1. Nous pouvons eectuer l'intégrale triple ci-dessus dans l'ordre que nous
voulons. Nous commencerons par intégrer sur x2 . Démontrer alors que l'intégrale
triple se transforme en une intégrale double
Z 1 Z ∞
(1/p) c(x1 )c(x/p − x1 )dx1 dp (7.14)
p=0 x1 =0
Z x/p
I1 (x) = c(x1 )c(x/p − x1 )dx1
x1 =0
92
7 Les transformées de Laplace.
TL TL TL
et passons en Transformé de Laplace x → β , c(x) → ĉ(β), I1 (x) → Iˆ1 (β).
Nous savons, d'après la règle des dilatation en TL, que TL[f (x/p)] = pfˆ(βp). En
utilisant cette relation, et le résultat sur les produits de convolution, démontrer
que
Iˆ1 (β) = pĉ(βp)2
Et donc que l'équation du bilan (7.12) se met sous la forme
Z 1
ĉ(βp)2 dp − ĉ(β) = 0
p=0
R∞
4. Soit T = 0
xc(x)dx ; T représente l'énergie totale du gaz. Démontrer que
∂ĉ(β)
T =−
∂β β=0
1 −x/T
c(x) = e
T
On prétend que cette formule est gravée sur la tombe de Boltzmann.
93
7 Les transformées de Laplace.
94
8 Les fonctions de Green.
8.1 Entrée en matière
(insister sur le faite que les CI changent la tête de Green. Surtout, faire une
gure qui serait parlant.). Les fonctions de Green constituent une méthode assez
général de résolution d'équations diérentielles, ou de transformation d'équations
diérentielles en équations intégrales. Elles sont extrêmement utilisée en méca-
nique quantique, où on les appelle des propagateurs, et en théorie des processus
stochastiques. Nous n'aborderons ce sujet que très légèrement ici, juste pour rap-
peler les grands principes de la méthode.
Supposons que nous voulons résoudre l'équation diérentielle
d2 x dx
a +b + cx = f (t) (8.1)
dt2 dt
avec des conditions initiales données x(0) = x0 et x0 (0) = x̃0 . Ceci est par
exemple l'équation du mouvement d'une particule soumise à une force f (t). a et
b peuvent être fonction du temps. Pour résoudre cette équation diérentielle, il
nous faut trouver la solution de l'équation homogène, et lui ajouter une solution
particulière. Nous cherchons justement une solution particulière.
Supposons que nous savons calculer la réponse de la particule à une force
impulsionnelle (genre δ de Dirac) appliquée au temps t0 . Saurions nous calculer
la réponse de la particule à une force générale f (t) ? La réponse est oui : la force
f (t) peut être vue comme une superposition d'impulsion appliquée à diérents
temps. Il sut donc de superposer les réponses aux divers impulsions pour obtenir
la réponse à la force f (t). Plus exactement, on peut écrire
Z ∞
f (t) = f (t0 )δ(t − t0 )dt0 (8.2)
0
ce qui veut dire que la force f (t) est la superposition d'impulsions appliquées au
temps t0 , avec le poids f (t0 ). Revenons à notre équation diérentielle, et appelons
Gt0 (t) la réponse à l'impulsion appliquée au temps t0 . Comme mettre les indices
est un peu lourd comme notation, nous noterons cette fonction plutôt G(t, t0 ). De
par sa dénition, elle doit satisfaire à
d2 G(t, t0 ) dG(t, t0 )
a 2
+b + cG(t, t0 ) = δ(t − t0 )
dt dt
95
8 Les fonctions de Green.
Notez que toutes les dérivations sont faites par rapport à t. Multiplions les deux
côtés de l'équation par f (t0 ). Comme f (t0 ) ne dépend pas de t, on peut la rentrer
à l'intérieur de l'opérateur diérentiel, et écrire :
∞ ∞ Z ∞
d2 d
Z Z
a f (t0 )G(t, t0 )dt0 + b f (t0 )G(t, t0 )dt0 + c f (t0 )G(t, t0 )dt0 =
dt2 0 dt 0 0
Z ∞
δ(t − t0 )f (t0 )dt0 (8.3)
0
Nous remarquons, d'après (8.2), que la droite de l'équation ci-dessus est juste
f (t). Appelons
Z ∞
y(t) = f (t0 )G(t, t0 )dt0 (8.4)
0
et nous voyons donc, d'après (8.3), que y(t) est solution de l'équation (8.1) !
Remarquez l'élégance, nous devons calculer une seule fois la fonction de green
pour une équation diérentielle. Ensuite, quelque soit le membre de droite, la
solution s'obtient par une simple intégration. La solution générale de l'équation
diérentielle s'écrit maintenant
où C1 et C2 sont choisit pour satisfaire les conditions initiales. Nous avons occulté
pas mal de point important. Voyons quelques exemple.
dx/dt + αx = f (t)
exp(−iωt0 )
G̃(ω, t0 ) =
iω + α
H(t)étant la fonction de Heaviside, nulle pour t<0 et 1 pour t > 0, comme vous
vous souvenez, la TF de H(t) exp(−αt) est justement 1/(iω + α). Donc,
96
8 Les fonctions de Green.
Comme vous le remarquez, G(t, t0 ) = 0 si t0 > t. Cela est normal, puisque G(t, t0 )
est la réponse, au temps t, à une impulsion au temps
0
t. Si t 0
est plus tard que t,
la réponse est nulle. Prenons maintenant plusieurs formes de f.
1. f (t) = H(t)t. Alors,
Z ∞
y(t) = H(t0 )t0 H(t − t0 ) exp(−α(t − t0 ))dt0
0
Z ∞
= t0 H(t − t0 ) exp(−α(t − t0 ))dt0
0
Z t
= t0 exp(−α(t − t0 ))dt
0
= (1/α2 )(exp(−αt) − 1) + (1/α)t
Z t
y(t) = sin(βt0 ) exp(−α(t − t0 ))dt
0
1 −αt
= βe + β cos(βt) + α sin(βt)
α2 +β 2
Vous voyez ici comment on résout une fois l'équation diérentielle pour la fonction
de Green, et qu' ensuite, il sut d'appliquer une intégration pour trouver la
solution générale.
En langage opératoriel, on écrirai une équation diérentielle comme
L[x] = f
d2 x dx
a +b + cx = f (t, x)
dt2 dt
97
8 Les fonctions de Green.
1 1
G(r, r0 ) = (8.6)
4π0 |r − r0 |
Si maintenant nous avons une distribution de charge ρ(r0 ) dans l'espace, le po-
tentiel crée par elle au point r vaut
Z
φ(r) = G(r, r0 )ρ(r0 )dr0 (8.7)
Nous utilisons cette formule depuis la première année du DEUG. Nous savons
par ailleurs que le potentiel obéit à l'équation de Poisson
− ∆φ = ρ/0 (8.8)
Nous oublierons dorénavant le facteur 0 pour alléger les notations.. Il n'est pas
dicile, vue les équations (8.6-8.8) de suspecter que G(r, r0 ) est la fonction de
Green de l'équation de Poisson, c'est à dire qu'elle obéit à
Démontrons ce résultat. Jusque là, nous n'avions manipuler que des TF et des
distributions à une dimension. Leurs généralisation à trois dimension n'est pas
98
8 Les fonctions de Green.
0
0 e−iq.r
G̃(q, r ) = (8.10)
q2
puisque le numérateur est la TF de la fonction δ translaté de r0 , et que la TF du
2
laplacien d'une fonction est −q fois la TF de la fonction (pouvez vous démontrez
ce résultat ? ). Il nous faut maintenant inverser la TF pour retrouver la fonction
de Green :
0
1 eiq(r−r )
Z
G̃(r, r0 ) = dq (8.11)
(2π)3 q2
Pour eectuer l'intégration, passons aux coordonnées sphériques, où nous prenons
l'axe qz parallèle à (r − r0 ). Dans ce cas, q(r − r0 ) = q|r − r0 | cos θ et dq =
2
q sin θdqdθdφ. L'intégrale (8.11) s'écrit alors
Z 2π Z π Z ∞
0 1 0
G̃(r, r ) = 3
dφ dθ dq sin θ.eiq|r−r | cos θ
(2π) 0 0 0
Une première intégration sur φ ne mange pas de pain et nous sort un facteur 2π .
Ensuite, en posant u = cos θ, le reste s'écrit
∞ +1
1
Z Z
0
G̃(r, r0 ) = dq eiq|r−r |u du
(2π)2 0 −1
99
8 Les fonctions de Green.
d2 y
+ ω02 y = f0 δ(t) (8.12)
dt2
En faisant un allerretour dans l'espace de Fourier, nous voyons que la solution
est
f0
y(t) = H(t) sin(ω0 t)
ω0
Nous somme maintenant bien outillé pour calculer la réponse d'une corde vibrante
(initialement au repos) à une force impulsionnelle. Nous notons u(x, t) la hauteur
de la corde à l'abscisse x et au temps t :
∂2u 2
2∂ u
− c = f0 δ(x)δ(t)
∂t2 ∂x2
En prenant la TF par rapport à la variable x, nous trouvons pour ũ(q, t)
∂ 2 ũ
+ c2 q 2 ũ = f0 δ(t)
∂t2
Mais cela est justement l'équation (8.12) que l'on vient de résoudre, et nous avons
donc
sin(ct q)
ũ(q, t) = f0 H(t)
cq
100
8 Les fonctions de Green.
1
2
3
4
Figure 8.1 La solution u(x, t) en fonction de x pour les temps t0 , 2t0 ,...
f0 x
u(x, t) = H(t)Π( )
c ct
(Exercice : Est-ce tout cela dimensionnellement correct ?) Cette solution est re-
présenté sur la gure 8.1 .
Il est évident que si au lieu d'appliquer la force f0 en x = 0 nous avions appliqué
la force fx0 en x = x0 , la solution, qui est la fonction de Green de la propagation,
s'écrit
fx0 x − x0
G(x, t; x0 , 0) = H(t)Π( )
c ct
Si la corde était initialement au repos et on y appliquait la force distribuée
f (x)δ(x), la déformation de la corde est donnée par
+∞
x − x0
Z
u(x, t) = c−1 H(t) f (x0 )Π( )dx0
−∞ ct
Z x+ct
= c−1 H(t) f (x0 )dx0
x−ct
101
9 Les opérateurs linéaires.
9.1 Introduction
Une des tâches que l'on rencontre régulièrement en physique est de résoudre des
équations diérentielles linéaires. De façon générale, nous pouvons représenter ces
équations par L† = {, où y est la fonction inconnue à rechercher, f une fonction
connu, et L un opérateur diérentiel.
Par exemple, l'équation de la chaleur peut
s'écrire Lu = q(x, t), où L = ∂t − D∂§∈ et q(x, t) est le terme de source. A
priori, la recherche des solutions est du domaine de l'analyse. Nous allons voir
cependant que nous pouvons ramener la solution de ces équations dans le domaine
de l'algèbre matricielle des systèmes à n équations et n inconnus 1 du genre AX =
B. Le très grand avantage est que pour faire de l'algèbre, nous n'avons, en gros,
2
que besoin d'addition et de multiplication . Les transformées de Fourier et de
Laplace que nous avons rencontrés dans ce cours étaient des exemples particuliers
d'outils qui nous permettaient de ramener l'analyse à l'algèbre, bien adaptées à
une certaine classe d'équations. Nous allons généraliser cette approche et voir
toute la puissance de feu que cela nous procure.
Depuis le début de ce cours, nous insistons fortement sur le concept de vecteur.
Au premier chapitre, nous avons vu que dans un espace vectoriel, nous pouvons
dénir des bases : cela nous permet de manipuler les vecteurs à l'aide de colonnes
(ou de lignes) de nombres. Nous avons également vu que si nous disposons d'un
produit scalaire, cela facilite grandement la tache de trouver les coecient d'un
vecteur dans une base orthogonale.
Un vecteur peut être un objet aussi simple qu'un vecteur usuel du plan eu-
clidien, ou un objet beaucoup plus complexe tel qu'une fonction. Prenons le cas
d'une fonctions f . Une fonction est une machine qui prend un nombre en entrée
et produit un nombre en sortie. Nous pouvons choisir plusieurs représentations
pour une même fonction. Par exemple, si nous choisissons la base de fourier avec
les vecteurs de la base exp(iqx), f s'écrira comme une superposition de ces fonc-
tions, chacun avec un poids f˜(q) (nous avons absorbé ici le facteur 1/2π dans la
dénition de f˜ ) :
Z +∞
f (x) = f˜(q) exp(iqx)dq
−∞
102
9 Les opérateurs linéaires.
L'intégral ici n'eectue rien d'autre que la superposition des vecteurs de base avec
leurs poids correspondants. Il est également usuel de représenter la fonction f par
un tableau qui à chaque entrée numérique, associe un nombre, et on note cela
f (x) (la notation est un peu confuse). En réalité, cela revient à représenter une
fonction f sur la base des δ de dirac, où chaque valeur f (x) est le poids associé
à un dirac centré sur x :
Z +∞
f (x) = f (y)δ(x − y)dy
−∞
Note sur les notations. Pour manipuler les opérateurs linéaires, la coutume
est de laisser tomber les signes du genre () et []. Ainsi, nous écrivons Of où
même pire, Of (x) à la place de O[f (x)]. La confusion est gênante quand on écrit
par exemple, Xf (x) = xf (x). X ici est un opérateur, f (x) et xf (x) sont des
103
9 Les opérateurs linéaires.
3
fonctions ; Xf (x) est la fonction qui résulte de l'application de X à f. Pour
éviter un peu ces confusions, la convention que nous suivrons dans ce cours et de
toujours noter les opérateurs par des lettres majuscules.
a + b a.b ∈ E
a+b = b+a
a(b + c) = ab + ac ; (a + b)c = ac + bc
(ab)c = a(bc)
Nous devons avoir quelques propriétés de plus pour mériter le nom d'algèbre. Il
faut qu'il existe des éléments neutre vis à vis des deux opérations, qu'on appelle
0 et 1 : a + 0 = 0 et a1 = 1a = a. De plus, les inverses des éléments vis à vis de +
et de . doivent exister : pour chaque élément a, il doit exister un élément unique,
qu'on appelle −a, tel que a + (−a) = 0 ; de même, il doit exister un élément un
−1
élément unique qu'on note 1/a ou a tel que a.(1/a) = (1/a)a = 1 (pour a 6= 0).
L'ensemble des nombres (rationnels ou réel), équipé de + et de . usuel, constitue
un algèbre. C'est un cas un peu particulier, puisqu'en plus, la multiplication y
est commutative (ab = ba). Mais toutes les théorèmes qui ont été démontré pour
l'algèbre des nombres sans invoquer la commutativité du produit sont valable
pour n'importe qu'elle autre algèbre.
Nous pouvons dénir un algèbre pour les opérateurs linéaires. Nous devons
d'abord préciser le sens de l'égalité entre opérateurs. Nous dirons que O1 = O2
si le résultat de l'application de ces deux opérateurs à une fonction est le même,
4
quelque soit la fonction : ∀f, O1 f = O2 f .
3. A vrai dire, c'est encore pire : f est une fonction, f (x) est un nombre. A nouveau, on a
l'habitude de ne pas toujours distinguer explicitement les deux choses et laisser le boulot au
cerveau. Dans ce cas, le cerveau agit comme un vulgaire compilateur C, testant constamment
le type des notations qu'on utilise.
4. Il est évident que ∀f est une condition exagérément demandeuse et n'a pas de sens en
général. Si par exemple, l'opérateur contient des dérivées d'ordre n, nous devons comprendre
∀f comme : quelque soit f n−fois dérivable. De même si l'opérateur vient avec des conditions
aux bords. A chaque fois, nous supposerons l'ensemble des fonctions comme compatible avec la
dénition de l'opérateur. Nous n'entrerons pas plus dans le détail lors de ce cours, pour ne pas
alourdir chaque assertion par un train de précautions et de conditions d'applicabilités. Dans la
majorité des cas, nous supposons de nous travaillons avec l'ensemble des fonctions L2 [−∞, +∞]
au moins deux fois continuement dérivalble. Ceci surtout impose à nos fonctions qu'elles et leurs
dérivée →0 quand leur argument → ∞.
104
9 Les opérateurs linéaires.
5. De même que dans l'espace des fonctions, l'opération + est héritée de l'addition entre les
nombres : la fonction f +g est la fonction qui associe au nombre x le nombre f (x) + g(x).
105
9 Les opérateurs linéaires.
P∞
et le résultat de son application à une fonction f (x) produit la fonction n=0 (1/n!)n f (n) (x
c'est à dire la fonction f (x + ). L'opérateur exp(D) n'est rien d'autre que l'opé-
rateur de translation T vu plus haut. Bien sûr, dès que l'on parle de suite et
série innie, nous avons besoin de la notion de convergence. La convergence dans
l'espace des opérateurs hérite sa dénition de la convergence dans l'espace des
fonctions : nous dirons que la suite On converge vers O si la suite des fonctions
On f converge vers la fonction Of quelque soit f (revoir la note 4).
Disposer des fonctions d'opérateurs nous permet de résoudre symboliquement
nombres d'EDP. Prenons d'abord l'équation diérentielle ordinaire
dy/dt = ay (9.1)
∂t ψ − ∂x ψ = 0 (9.2)
où ψ(x, t) est une fonction des deux variables x, t ; la condition initiale étant
ψ(x, t = 0) = ψ0 (x), ψ0 (x) étant une fonction connue de la variable x. Nous
pouvons écrire cette équation sous forme opératorielle
∂ψ/∂t = Dψ
Nous savons par ailleurs que l'opérateur exp(tD) n'est rien d'autre l'opérateur
translation d'une quantité t, Tt . La solution s'écrit donc
ψ(x, t) = ψ0 (x + t)
Ceci est la solution exacte de l'EDP (9.2) que nous pouvons obtenir soit par
des transformées de fourier-laplace , soit par la méthode des caractéristiques du
chapitre 15. Ceci n'est pas une analogie. Les même règles d'algèbre (et d'analyse)
que nous appliquons aux fonctions ont été dénies pour les opérateurs et nous
donnent le droit de les manipuler symboliquement de la même façon. Voyons cela
d'un peu plus près. La fonction f (t) = exp(ta) est donné comme la série
X
exp(ta) = tn an /n!
n=0
106
9 Les opérateurs linéaires.
sa dérivée (qui coïncide avec la dérivée terme à terme de la série) s'écrit (en jouant
sur l'indice de sommation)
X
f 0 (t) = tn an+1 /n!
n=0
X
= a tn an /n!
n=0
= af (t)
et c'est pour cela que cette fonction est la solution générale de (9.1). En utilisant
les mêmes règles de manipulation pour l'algèbre d'opérateurs, nous voyons que
l'opérateur exp(tD) possède comme dérivée par rapport au temps l'opérateur
D exp(tD). La fonction ψ(x, t) = exp(tD)ψ0 (x) a donc pour dérivée par rapport
au temps la fonction D exp(tD)ψ0 (x), c'est à dire Dψ(x, t).
De façon générale, nous pouvons avoir des EDP du genre
∂ψ/∂t = Hψ
où H est un opérateur spatial ( ne dépendant que de la variable x ) plus compliqué
que le simple opérateur de dérivation spatiale D, mais la discussion ci-dessus reste
valide et nous pouvons donner la solution comme
ψ(x, t) = exp(tH)ψ(x, t = 0)
L'opérateur exp(tH) n'est plus alors une simple translation, mais le principe
reste le même : la fonction solution à un temps ultérieur t est donnée par l'ap-
plication de l'opérateur exp(tH) à la fonction condition initiale. L'opérateur
exp(tH) est appelé, à juste titre, l'opérateur de l'évolution temporelle. Cette fa-
çon de présenter les choses est appelée, en mécanique quantique, l'interprétation
d'Heinsenberg (voir plus bas pour une digression historique). Evidemment, cette
façon de résoudre l'équation ne nous sert à rien si nous ne savons pas calculer
exp(tH). Nous verrons plus bas les outils que les mathématiciens ont développé
pour calculer ecacement ce genre de fonction d'opérateurs.
Exercices.
107
9 Les opérateurs linéaires.
4. Dans l'espace des opérateurs linéaires sur les fonctions à trois variables, nous
dénissons Lz = X∂y − Y ∂x ; Lx et Ly sont dénis cycliquement à partir de cette
dernière dénition. Calculer [Lα , Lβ ]( α, β = x, y, z ). Donner la dénition de L2α
L = α Lα . Calculer [L2 , Lα ].
2
P 2
et de
d
exp(tA) = A exp(tA)
dt
où A est un opérateur linéaire. Help : Utiliser le développement de l'exponentiel
et les règles habituelles de la dérivation.
Calculer A2 . En déduire une expression générale pour An selon que n est pair ou
impair. Démontrer alors que
cos x − sin x
exp(A) =
sin x cos x
Help : Décomposer la somme en terme pair et impair, et utiliser le développement
en série des fonctions sin cos. Soit maintenant les deux matrices
et
0 −x 0 0
C= , D=
0 0 x 0
108
9 Les opérateurs linéaires.
∂2u ∂2u
2
− c2 2 = 0
∂t ∂x
avec les conditions initiales u(x, 0) = f (x) et ∂t u(x, t)|t=0 = g(x) en l'écrivant
sous la forme symbolique ∂ 2 u/∂t2 − c2 D2 u = 0 et en vous inspirant de la solution
de l'équation ordinaire u00 − a2 u = 0.
X
v= aj ej
j
109
9 Les opérateurs linéaires.
D.eq = iq eq
Z +∞
Df (x) = iq f˜(q) exp(iqx)dq
−∞
110
9 Les opérateurs linéaires.
Base orthonormale. Nous avons vu au premier chapitre que disposer d'un pro-
duit scalaire (., .) et d'une base orthonormale facilite énormément les chose. Soit
{e1 , ...en } une base orthonormale, c'est à dire
P (ei , ej ) = δi,j et soit la décomposi-
tion d'un vecteur quelconque v:v= ai ei . Alors
X
(v, ek ) = ( ai ei , ek )
i
X
= ai (ei , ek )
i
= ak
Exercices.
dn
hn (x) = Cn (−1)n exp(x2 /2) exp(−x2 ) (9.5)
dxn
Les premières fonctions sont (en multipliant par exp(−x2 /2) ) 1, 2x, 4x2 −2,... Les
coecients Cn que nous n'explicitons pas assurent que les fonctions sont normées.
On peut démontrer, avec un peu d'eort, que les fonctions hn sont deux à deux
orthogonales et forment une base.
111
9 Les opérateurs linéaires.
H = −D2 + X 2
nous avons Hhn (x) = (2n + 1)hn (x). Donner alors la représentation de H dans
la base des hn .
3. Opérateur D dans la base des Bessel. Soit les fonctions de Bessel In dénie
par
π
1
Z
In (x) = ex cos θ cos(nθ)dθ
π 0
Démontrer que
In0 (x) = (1/2) (In−1 (x) + In+1 (x))
Les fonctions exp(−x)In (x) (n = 0, 1, ...) forment une base. Donner l'expression
de la matrice de l'opérateur D dans cette base. [ Très important dans les pro-
blèmes de matrices tridiagonal. ]
laguerre,...
112
9 Les opérateurs linéaires.
2x + 3y = 4
x − 2y = 1
2 3
1 −2
2x = 4
3y = 1
2 0
0 3
113
9 Les opérateurs linéaires.
où l'on suppose que l'opérateur H n'a que des composantes spatiales. Les condi-
tions initiales et aux limites de cette équation sont les suivantes :
ψ(x → ±∞, t) = 0
ψ(x, 0) = g(x)
la fonction tend vers zéro pour les grand x ; à l'instant t = 0, la fonction recherché
prend la forme de f (x). Supposons que nous connaissons une base orthonormale
6
{fn (x)} dans laquelle l'opérateur H est diagonale :
6. Nous supposons que les fonctions fn sont compatibles avec les conditions aux bords :
fn (x → ±∞) = 0.
7. Nous supposons que l'on peut intervertir les opération de sommation et de dérivation par
rapport au temps.
114
9 Les opérateurs linéaires.
et donc
an,0 = hfn (x), g(x)i
Résumons la méthode. On décompose la condition initiale sur la base des fonctions
propres. L'amplitude de chaque composante an (t) varie exponentiellement avec
l'exposant λn . Il sut de recombiner ces composantes à un temps ultérieurs t
pour recalculer la fonction ψ en ce temps là :
∞
X
ψ(x, t) = hψ(x, 0), fn (x)i exp(λn t)fn (x) (9.7)
i=0
X
ψ(x, t) = an e−i(2n+1)t hn (x)
X
exp(tH) = (1/n!)tn H n
n=0
8. Heisenberg et Schroedinger ont formulé ces deux approches dans les années 1925-28 quand
les méthodes d'analyse fonctionnelle n'étaient pas encore popularisées chez les physiciens. La
contribution de Von-Neuman était de montrer, en important les concepts développés par Hilbert
en mathématiques, que les deux approches étaient équivalentes. Dirac à mis la dernière main à
l'édice en 1932 en formulant l'ensemble de façon extrêmement élégante.
115
9 Les opérateurs linéaires.
nous voyons que l'opérateur exp(tH) est également diagonal dans cette base,
et ses éléments diagonaux s'écrivent ( (exp(tλ1 ), (exp(tλ2 ), ...(exp(tλn ), ...). En
notation matricielle, nous avons
λ1 0 . .
0 λ2 0
H=
. 0 λ3 .
. . . .
. .
et
etλ1
0 . .
0 etλ2 0
tH
tλ3
e =
. 0 e .
. . . .
. .
Si maintenant nous exprimons la fonction ψ(x, 0) dans la même base
X
ψ(x, 0) = hψ(x, 0), fn (x)i fn (x)
n
116
9 Les opérateurs linéaires.
Supposons que le produit scalaire est déni sur le corps des réels. Alors (u, v) =
(v, u). Si dans une base (que nous prenons orthonormale pour plus de simplicité,
mais sans nécessité aucune) l'opérateur O est représenté par la matrice Oij =
(ei , Oej ), on peut démontrer sans diculté que pour la matrice de l'adjoint,
†
Oij = Oji : on interverti les lignes et les colonnes d'une matrice pour obtenir
celle de son adjoint. La matrice résultante est appelé la transposée. Si le produit
† ∗
scalaire est déni sur le corps des complexes, alors Oij = Oji .
†
Un opérateur est dit self-adjoint ou hermitien si O = O.
Exercices.
2. Les vecteurs propres associés à deux valeurs propres distinctes sont ortho-
gonales : Si Ax1 = λ1 x1 , Ax2 = λ2 x2 , A = A† , λ1 6= λ2 , alors (x1 , x2 ) = 0.
†
[indication : calculer (x1 , Ax2 ) et (x1 , A x2 ).
3. Démontrer, dans l'espace des fonctions L2 que les valeurs propres de l'opéra-
2
teur −D sont positifs. [indication : il sut de démontrer que ∀x, (x, −D2 x) ≥ 0,
ce qui peut s'obtenir en eectuant une intégration par partie. De tels opérateurs
sont appelés dénie positif.].
H = −D2 + V
117
9 Les opérateurs linéaires.
118
9 Les opérateurs linéaires.
d'une particule se trouvant dans un potentiel harmonique. Nous savons que toutes
les valeurs propres sont > 0. Nous avions donné en exemple plus haut les fonctions
et valeurs propres de cet hamiltonien. Nous allons voir que nous pouvons trouver
ces fonctions sans résoudre aucune équation diérentielle, un peu comme faire
du beurre avec de l'eau. Il sut juste de manipuler l'algèbre des opérateurs et
surtout de leur commutateur. L'exemple que nous allons suivre et le prototype
de ce genre de calcul et nous le donnons donc avec un peu de détail.
Comme [D, X] = 1, nous pouvons décomposer l'hamiltonien :
A = D+X
A† = −D + X
[H, A† ] = [A† A + 1, A† ]
= [A† A, A† ]
= 2A† (9.9)
L'équation (9.9) est un cas particulier d'un opérateur d'échelle. Avoir à sa dis-
position de telles relations est d'un très grand avantage comme nous allons le
voir.
Nous pouvons eectuer les même démarche pour A et démontrer que HAψE =
(E − 2)AψE . Comme nous savons que tous les valeurs propres sont > 0, il existe
donc forcément une valeur propre minimum que nous appelons (noter que 0 <
119
9 Les opérateurs linéaires.
< 2). Toute les autres valeurs propres sont donc de la forme (2n + ), avec
n ∈ N.
Il nous reste maintenant à déterminer cette valeur . Appelons ψ0 la fonction
propre associée à . Nous devons alors obligatoirement avoir
Aψ0 = 0 (9.10)
sinon nous aurions des valeurs propres négatives. De là, nous pouvons naturelle-
ment déduire que
Hψ0 = ψ0
Et par conséquent, = 1. Les valeurs propres de l'opérateur H sont donc de la
forme En = 2n + 1. Quand je vous disais qu'on fait du beurre avec de l'eau !
Noter que la relation (9.10) est juste une équation diérentielle
avec les conditions ψ0 → 0 pour x → ±∞. Cette équation est simple à résoudre
Exercices.
120
10 Les systèmes Sturm-Liouville.
10.1 Introduction.
1
Nous allons traiter dans ce chapitre la théorie générale des équations diéren-
tielles linéaires de second ordre de la forme :
Lu = λu (10.1)
où u(x) est une fonction au moins deux fois dérivable, la fonction et ses dérivées
2
étant de carré sommable . λ est un scalaire que nous appelons valeur propre et
L est un opérateur diérentiel de second ordre
d2 d
L = α(x) 2
+ β(x) + γ(x)
dx dx
Ce genre d'équation se rencontre partout en physique et la solution du système ci-
dessus a occupé une grande partie du travail des physiciens-mathématiciens. Les
grandes familles de fonctions spéciales, les Bessel, Legendre, Hermit, Laguerre,
les hypergéométriques, ... ont été introduites à l'occasion de l'étude de ce genre
d'équation. Le but de ce chapitre est en partie de nous habituer avec ces fonctions.
La théorie générale que nous allons voir dans ce chapitre est une application
directe de la théorie des opérateurs linéaires que nous avons rencontré au chapitre
précédent ; nous aurons ainsi l'occasion d'approfondir les concept que nous avons
vus.
Illustrons à travers les trois exemples suivants quelques fonctions et équations
fondamentales de la physique mathématique.
n
∂ u
= Lu (10.2)
∂tn
où l'opérateur L ne contient pas de dépendence en t, nous pouvons chercher la
solution de l'équation aux valeurs propres
Lφn = λn φn
1. Cette théorie a été formulée par les deux mathématiciens français aux alentour de 1850.
2. Ce genre d'espace est appelé l'espace de Sobolev, mathématicien soviétique du vingtième
siècle, précurseur de la théorie des distributions.
121
10 Les systèmes Sturm-Liouville.
où φn (x) est fonction de la seule variable x. Si les {φn }constituent une base dans
l'espace des fonctions appropriées, alors la solution générale de (10.2) est alors
donnée par
X
u(x, t) = fn an (t)φn (x)
n
dn an
− λn an = 0
dtn
et les scalaire fn sont donnés par les conditions initiale. Si l'on veut, cette méthode
est une super méthode de séparation des variables.
∂2u
= c2 ∆u (10.3)
∂t2
où u = u(r, θ, t). Si nous savons résoudre
X
Ak eickt + A−k e−ickt φk (r, θ)
u(r, θ, t) =
k
∂ 2 φk 2
2 ∂ φk ∂φk
− 2
= r 2
+r + r 2 k 2 φk (10.5)
∂θ ∂r ∂r
Si on regarde de plus près cette équation, nous voyons qu'elle a à nouveau exac-
tement la forme (10.2) et nous pouvons appliquer la même méthode en cherchant
la solution de l'équation aux valeurs propres
d2 ηm dη
r2 2
+r + r2 k 2 ηm = m2 ηm (10.6)
dr dr
3. Nous utilisons le symbol Σ pour signier superposition. Si la variable sur laquelle on
somme est discrète (∈ Z)alors Σ a son sens habituel. Si par contre la variable de sommation est
R
continue (∈ R) alors le symbol doit être compris formellement comme une intégrale .
122
10 Les systèmes Sturm-Liouville.
Cette équation s'appelle l'équation de Bessel, les fonctions Jm sont appelées les
fonctions de Bessel ; le lecteur notera que cette équation qui joue un rôle pri-
mordial dans les équations de propagation en coordonnées cylindriques est de la
forme (10.1).
Nous avons beaucoup détaillé les calculs dans cet exemple. Nous pouvons sys-
tématiser le travail de la façon suivante : nous cherchons la solution de (10.3)
directement sous la forme
a00 1 c2 f 00
− c2 (η 00 + η 0 /r) − 2 =0 (10.8)
a η r f
Cette équation est valable pour tous (r, θ, t). Supposons que nous gardons constance
r et t et nous varions θ. Les deux premiers termes de cette équation ne dépendent
pas de θ et restent inchangé. Pour que l'équation soit satisfaite, nous devons avoir
f 00 /f = Cte. La contrainte f (θ +2π) = f (θ) nous impose Cte = −m2 , m = 0, 1, ...
De la même manière, si l'on fait varier t, les deux derniers termes restent inchan-
00
gés et nous devons donc avoir a /a = cte ; la solution devant resté borné pour
2
tous les temps, nous devons avoir cte = −k . L'équation (10.8) se transforme
alors en
2 1 00
(k/c) + (η + η 0 /r) − m2 /r2 = 0
η
en multipliant par η et en nettoyant un peu, cette dernière équation se met sous
la forme de l'équation de Bessel. La solution générale est la superposition de ces
solutions.
123
10 Les systèmes Sturm-Liouville.
d2 h
1 d 2 df 1 d dg 1
r + sin(θ) + 2 =0
f (r) dr dr g(θ) sin(θ) dθ dθ h(φ) sin (θ) dφ2
Par des arguments analogues à ce que nous avons utilisés précédemment, nous
obtenons
h00 (φ)
= −m2
h(φ)
et
1 d 2 df
r =λ (10.10)
f (r) dr dr
Il n'est pas dicile de vérier qu'une fonction f de la forme f (r) = An rn +
−(n+1)
Bn r est fonction propre, avec la valeur propre λ = n(n + 1). Ceci nous
donne pour la dernière équation
m2
1 d dg
sin(θ) + n(n + 1) − g(θ) = 0
sin(θ) dθ dθ sin2 (θ)
Et nous allons quelques peu nettoyer cette dernière équation. Remarquons d'abord
que la fonction g(θ) est pair ; nous n'avons donc besoin de le résoudre que sur
l'intervalle par exemple [0, π]. cos θ = t ( t ∈ [−1, 1] ) et g(θ) = P (t). La
Posons
dérivation en chaîne nous donne d/dθ = − sin θ(d/dt) et donc
m2
d dP
(1 − t2 ) + n(n + 1) − P (t) = 0 (10.11)
dt dt 1 − t2
Les solutions de cette équation, appelées les fonctions de Lengendre associées sont
notées Pnm (t). Pour m = 0, L'équation s'écrit
notons à nouveau que cette équation qui joue un rôle primordial dans les équa-
tions implicant le Lalplacien en coordonnées sphériques est de la forme (10.1).
Les solutions de cette équation sont appelées les polynômes de Lengendre. Nous
verrons (c.f. exercice ??) que les solutions pour m 6= 0 s'obtiennent à partir des
m = 0. La partie angulaire de l'équation de Laplace est donnée par
124
10 Les systèmes Sturm-Liouville.
ces dernière fonctions sont appelées les harmoniques sphériques et jouent le même
rôle que les fonctions sinet cos à une dimension. Le lecteur les rencontrera souvent
comme les fonctions propres des deux opérateurs L2 et Lz dans les problèmes à
symmetries sphériques.
4. Ceci bien sûr n'est pas un hasard : on choisit (invente) un système de coordonné dans
lequel l'EDP peut s'écrire de cette façon. C'est la raison de la popularité des trois systèmes de
coordonnés les plus populaires. Le lecteur rencontrera d'autres systèmes plus exotiques adapté
à des problèmes bien particulier.
5. Souvenez vous, nous appelons cela l'interprétation de Schrodinger.
125
10 Les systèmes Sturm-Liouville.
Puisque les ηi sont linéairement indépendant (elles forment une base), l'équation
à dérivées partielles Hu = 0 se transforme en une équation diérentielle ordinaire
(donc beaucoup plus simple)
Mais ceci n'est guère diérent. En faisant exactement la même démarche de dé-
composer u(x, y) sur la base des {ηi (y)}, nous obtenons pour les coecients ci (x)
l'équation diérentielle ordinaire
où nous avons posé c = 1. Nous voyons que cette équation possède la même
θ ∈ [0, 2π], les fonctions exp(imθ) sont des
structure que (10.12). Pour la variable
fonctions propres de l'opérateur ∂θθ associées à la valeur propre −m2 (de plus,
m ∈ Z) . Pour la variable t ∈] − ∞, +∞[, les fonctions exp(ikt)sont des fonctions
2
propres de l'opérateur ∂tt associées à la valeur propre −k . Si l'on cherche la
solution générale sous la forme de
X
u(r, θ, t) = Rk,m (r)eimθ .eikt
k,m
Alors, d'après ce que nous avons dit, la fonction Rk,m (r) doit obéir à l'équation
126
10 Les systèmes Sturm-Liouville.
6 2
Nous connaissons une base propre de l'opérateur L qui sont les sphériques
m
harmoniques Yn (θ, φ), associée à la valeur propre −n(n + 1). Si on cherche la
solution sous forme de
X
u(r, θ, φ) = R(r)Ynm (θ, φ)
m,n
2 n(n + 1)
R00 (r) + R0 (r) − R(r) = 0
r r2
Exercices.
Rπ
1. Démontrer que la fonction Jm (x) = (1/π) 0 cos(x sin θ − mθ)dθ est solution
de l'équation de Bessel si m ∈ Z. Cette fonction est appelée la fonction de Bessel
(d'ordre m) de première sorte.
Z Z ∞
f˜(u, v) = f (x, y) exp (−i (ux + vy)) dxdy
−∞
Supposons que f est de symétrie cylindrique, c'est à dire qu'on peut l'ecrire
comme f (r) où x + iy = r exp(iθ). Dans ce cas, on peut également choisir les
coordonnées polaires dans l'espace réciproque u + iv = q exp(iφ). Démontrer
alors que f˜ est également de symétrie cylindrique et
Z ∞
f˜(q) = 2π f (r)J0 (qr)rdr
0
Z ∞
f (r) = 2π f˜(q)J0 (qr)qdq
0
6. A vrai dire, nous n'avons jamais démontré que ces fonctions constituent une base. La
démonstration découle du fameux théorème d'approximation Weirestrauss (1885). Nous ad-
mettons le résultat. Nous avions simplement démontré que les sphérique harmonique sont les
fonctions propre de l'opérateur L2 .
127
10 Les systèmes Sturm-Liouville.
3. Démontrer que pour m entier, J−m (x) = (−1)m Jm (x). Cela montre que pour
m entier, les deux fonctions Jm et J−m ne sont pas linéairement indépendantes.
L'équation de Bessel étant de second ordre, elle a besoin de deux solutions indé-
pendantes. L'autre solution notée souvent Ym (x) est appelé la fonction de Bessel
de seconde sorte. [Help : eectuer le changement de variable θ → π − θ].
x2 u00 + νxu0 + x2 − m2 u = 0
5. Résoudre l'équation
m2
2 00 0
(1 − x )v − 2xv + n(n + 1) − v=0
(1 − x2 )
Si on sait que le polynôme de Legendre Pn est d'ordre n, que peut on déduire
pour Pnm pour m > n? Construire explicitement les trois premiers polynomes de
Legendre. [Help : Commencer par démontrer par récurrence que
128
10 Les systèmes Sturm-Liouville.
8.Moment cinétique. Soit l'opérateur L2 = L2x + L2y + L2z . Démontrer que l'opé-
rateur laplacien, en coordonnées sphérique, s'écrit comme
∆ = r−2 ∂r r2 ∂r + L2
Rappel :Lz = x∂y −y∂x et les autres s'en déduisent par permutation circulaire des
indices(x, y, z). Nous avions déjà vu que Lz = ∂φ . Démontrer que les harmoniques
sphériques sont fonctions propres de Lz , donner les valeurs propres associées.
∂tt u = ∆u
Help : en notatation opératoriel, l'équation s'écrit
∂tt − r−2 ∂r r2 ∂r + L2 u = 0
129
10 Les systèmes Sturm-Liouville.
∞ n
1 1 X r0
= √ = Pn (cos θ)
|x − x0 | r2 + r02 − 2rr0 cos θ n=0 rn+1
∂2u 2
2∂ u
= c
∂t2 ∂x2
La solution sur la base propre de fourier, d'après ce que nous avons vu plus haut,
est donnée par
X
An eiωn t + Bn e−iωn t eikn x
u(x, t) = (10.13)
n
7. De la même manière que la mécanique Newtonienne ajoutait quelque chose de très étrange
à la science du mouvement répandu en 1680. Notre intuition nous disait que la vitesse d'une
charette que l'on pousse dépend de la force qu'on exerce dessus et qu'elle s'arrête quand nous
ne poussons plus. La physique Aristotélicienne postulait donc, en langage moderne, v = C.F .
La mécanique Newtonienne a modié ce postulat en imposant la proportionnalité non pas entre
la vitesse et la force, mais entre l'accélération et la force : a = (1/m)F . Pour interpréter les
résultats expérimentaux dans ce cadre, il a fallu supposer l'existence de forces de réaction, de
frottement, ... On peut facilement imaginer combien cette mécanique nouvelle paraissait contre-
intuitif et étrange aux scientique de l'éopque. Pour nous qui avons assimilé cette mécanique
depuis notre enfance, cette mécanique nous paraît aller de soi. De la même manière, la MQ
parraissait étrange au début du XXème, puisque les scientiques s'étaient forgé une intuition
qui allait à l'encontre des postulats de la nouvelle mécanique.
8. Parfois appelé dualité onde-corpuscule
130
10 Les systèmes Sturm-Liouville.
L
ρ K
Z
E(u) = ut u∗t + ux u∗x dx (10.14)
0 2 2
An est l'amplitude du mode n, et nous voyons que le résultat est la somme des
amplitudes des modes au carré, pondéré par leur valeurs propres.
Nous pouvons contruire un appareil pour mesurer l'énergie de la corde vibrante
de la façon suivante : une caméra prend deux photographies successives de la
corde. Par l'analyse de la forme de la corde sur une des photos, nous pouvons
explicitement mesurer point par point ux . Par l'analyse de la hauteur de la corde
entre les deux photos successives, nous pouvons mesurer point par point ut . Ces
deux mesures nous permettent ensuite d'eectuer une intégrale point par point
10
et remonter à l'énergie (10.14) .
Supposez maintenant que vous avez préparé par exemple M = 106 cordes
vibrantes toutes dans le même état (identiques). En les mesurant les uns après
les autres avec l'appareil, on doit toujours trouver la même valeur E . Les premiers
chercheurs investigant les phénomènes atomiques ont trouvé un résultat diérent :
A chaque mesure, ils trouvaient une valeur diérente, correspondant exactement
à une des valeurs propres kn . La mesure de l'énergie ne donnait pas la même
valeur, ni même des valeurs dispersées de façon continue, mais un ensemble discret
de valeur. Il s'avère que quand ont fait cette mesure un grand nombre de fois,
la proportion de fois où l'on tombe sur la même valeur kn et proportionnelle
au coecient An A∗n . La moyenne sur les M mesures donne en eet le résultat
11
attendu E d'un système classique .
9. voir les chapitres consacrés, d'une part aux équations de la physique, d'autre part au
calcul variationnel.
10. Pour l'investigation des phénomènes à l'échelle atomique, les scientiques du début de
XXème siècle avaient à leur disposition un appareil de mesure basée sur la strepctoscopie.
Ce sont le character discret des raies qui ont commencé à poser des problèmes. Notez que le
problème dont on parle ici n'est pas du tout celui de la divergence ultra-violette du corps
noir. Ce dernier est dû a un postulat de la physique statistique qui exige, dans le cadre de la
physique classique, qu'à l'équilibre thermodynamique, on ait 2LKAn A∗n kn
2 = T /2, ce qui rend
la somme (10.15) divergente.
11. La présentation que je donne est bien sur anachronique. Le concept de décomposition sur
base propre à travers l'équation de Schrodinger post-date de quelques 20 années la découverte
de la nature discrète des raies atomiques.
131
10 Les systèmes Sturm-Liouville.
12
Cette observation a été intégré comme un postulat à la mécanique quantique ,
en sus des équations d'évolutions de la mécanique quantique (comme par exemple
l'équation de Schrodiner). Ce n'est que récemment (les années 1990) que ce pos-
tulat a été compris comme une conséquence du phénomène d'intéraction entre
un système macroscopique et microscopique, appelé décohérence.
Dans beaucoup de branche de physique atomique et moléculaire, la quantité
pertinente étant l'énergie, les scientiques ont élaborer des règles de manipu-
lations impliquant uniquement la connaissance des valeurs propres, sans même
passer par la case résoudre l'équation d'évolution temporelle. Voilà pourquoi
les valeurs propres sont devenues une partie si fondamentale de la culture des
physiciens.
Le lecteur peut vérier que cette denition possède toutes les bonnes propriétés
que l'on exige d'un produit scalaire, si w(x) ≥ 0 13 . La fonction w(x) est dite le
poids (weight en anglais).
Dans la très grande majorité des cas que l'on rencontre en physique-mathématique,
14
l'opérateur L est hérmitien : (f, Lg) = (Lf, g)C'est d'ailleurs précisément ces
systèmes où l'opérateur L est hermitien que nous appelons Sturm-Liouville. Les
opérateurs hermitiens ont des propriétés remarquables : ils sont diagonalisable
et leurs valeurs propres sont réel. Ces faits ne sont pas étranger au fait qu'ils
apparaissent aussi souvent en physique. Nous avons vu que la forme générale de
l'opérateur L est
L = α(x)dxx + β(x)dx + γ(x)
où dx et dxx dénote les dérivées première et seconde et α, β, γ sont des fonctions
à valeurs réels. Comme on exige de L d'être hermitien, cela limite le choix des
fonctions α, β, γ . Si on regarde d'un peu plus près, aucune contrainte ne pèse sur
γ(x). Si L est hermitien, il est trivial de démontrer que L + η(x) est également
12. Cela s'appelle l'interprétation de Copenhague (1928) : Une mesure d'un observable O
projette un état quantique mixte sur un des états propres de cet observable, avec une probabilité
donnée par la norme au carré de l'amplitude de ce mode propre.
13. Il faut que w(x) > 0 sur un ensemble de mesure non-nulle, par exemple sur un intervalle
14. Nous avonsn le choix du poids w(x)
132
10 Les systèmes Sturm-Liouville.
hermitien. Pour étudier les contraintes qui pèsent sur α et β , nous choisissons
donc pour l'instant γ(x) = 0, cela nous simplie l'écriture. Formons la diérence
I = (Lf, g) − (f, Lg). En eectuant une intégration par partie, nous parvenons
facilement à
∞
I = [(f 0 g − f g 0 )(αw)]−∞
Z ∞
+ (f g 0 − f 0 g) [(αw)0 − βw] dx
−∞
(αw)0 = βw (10.16)
0 0 ∞
[(f g − f g )(αw)]−∞ = 0 (10.17)
L'équation (10.16) dénit en fait le poids w que l'on doit choisir en fonction de α
et β. La condition (10.17) nous indique que selon l'espace des fonctions que nous
nous sommes choisi, nous devons exiger de w de tendre susement rapidement
vers 0 quand x → ∞. Remarquez que w = 0 est solution de l'équation (10.16),
donc nous pouvons eventuellement connecter une région où w>0 à une région
où w=0 et satisfaire ainsi la condition (10.17). Remarquer qu'une fois w choisie
convenablement, nous pouvons mettre l'équation diérentielle Lu = λu sous la
forme de
d du
(αw) + (γ − λ)wu = 0
dx dx
C'est sous cette forme que les systèmes Sturm-Liouville ont été formulés. Notez
que l'équation (10.16) est une équation diérentielle simple dont la solution est
donnée par
Z
C β
w(x) = exp dx (10.18)
α(x) α
R
où par nous dénotons une primitive.
133
10 Les systèmes Sturm-Liouville.
α(x) = α2 x2 + α1 x1 + α0
β(x) = β1 x + β0
γ(x) = γ0
Nous devons donc explorer un espace à six dimensions pour épuiser toutes les
combinaisons des coecients. Pas tout à fait en réalité, cela peut être beaucoup
plus simple. Prenons l'équation algébrique élémentaire ax2 + bx + c = 0. Au lieu
de résoudre directement cette équation, nous pouvons remplacer x par x + x0 et
résoudre
ax2 + (2ax0 + b)x + (ax20 + bx0 + c) = 0
pour une valeur arbitraire de x0 . Une fois cette équation résolue, nous pouvons
toujours remplacer x par x − x0 pour retrouver la solution de l'équation originale.
2
Si nous choisissons judicieusement x0 = −b/2a, l'équation se transforme en ax +
0
c = 0. On peut encore
√ simplier la forme de cette équation (en remplaçant par
exemple x par x/ a ) pour obtenir l'équation
x2 + c0 = 0
Si nous savons résoudre cette dernière nous savons résoudre l'équation général de
second degrès : au lieu d'explorer une famille à trois paramètres, nous n'avons
qu'à explorer une famille à un seul parmaètre.
Nous avons pu eectuer cette simplication formelle et éliminer deux para-
mètres parce que nous avions 2 degrès de libertés à notre disposition : le choix
de l'origine et de l'échelle de l'axe x. Dans une équation de type (10.19), nous
avons 4 degrès de libertés. Par exemple, au lieu de considérer l'opérateur L, nous
pouvons étudier l'opérateur aL, où a est un scalaire. Les fonctions propres de
15. Cela s'appelle la complétude dont nous avions parlé au chapitre sur l'analyse fonctionnelle
et qui découle d'un théorème démontré par Weirestrauss que nous n'avons pas donné ici.
16. Vous remarquerez donc que les fonctions de bessel ne sont pas polynamiales.
134
10 Les systèmes Sturm-Liouville.
cette nouvelles équations restent inchangées, les valeurs propres deviennent aλ.
Cela nous donnera par exemple la possibilité de toujours choisir α2 = −1 (quand
6= 0). Nous pouvons également étudier l'opérateur L+a : a nouveau, les fonc-
tions propres restent inchangées, les valeurs propres seront deplacées de a. Nous
utiliserons cela pour toujours choisir γ0 = 0. Nous avons également toujours la
liberté de choisir l'origine et l'échelle de l'axe x. Nous aurons donc au plus que
deux paramètres libres.
Exercices.
(1 − x2 )u00 + [p − q + (p + q + 2)x]u0 = λu
Comme nous l'avons dit, nous utilisons un degrès de liberté pour choisir α2 =
−1. Nous pouvons donc écrire α(x) = (−x0 + x)(x1 − x) où x0 et x1 sont les deux
racines de α(x). Ces deux racines sont soit complexes (et conjuguées l'une de
l'autre) soit réelles. Le lecteur peut démontrer qu'avec des racines complexes, il
n'est pas possible de remplir les conditions d'hermicité. Nous utilisons maintenant
deux degrès de liberté d'origine de l'axe x pour choisir x0 = −1 et x1 = 1.
135
10 Les systèmes Sturm-Liouville.
exigence telle quelle. Par contre, si p, q > −1, nous voyons que wα s'annule sur
les bords. Nous chisisons donc
= 0 sinon
Les polynômes associés à ce choix des paramètres sont appelés des polynômes
(p,q)
de Jacobi Jn (x). Certains choix de p, q ont obtenus des noms propres. Par
2 1/2
exemple, p = q = −1/2 nous donne une fonction w(x) = (1−x ) et les solutions
17
s'appellent les polyômes de Chebychev . Pour p = q = 0, nous obtenons les
polynômes de Legendre, avec le poids w(x) = 1.
Nous considérons le cas α2 = 0. Cette fois, nous n'avons qu'un seul paramètre
libre. Nous choisissons α(x) = x ; β(x) = −x + s + 1.Cela détermine
w(x) = xs e−x
Cela nous convient parfaitement pour x → +∞, mais pas pour x → −∞. Ce-
pendant, ont peut remarquer que si s > −1, nous pouvons connecter la fonction
ci-dessus pour x > 0 à la fonction w(x) = 0 pour x < 0. Les solutions de ce
(s)
système sont appelés les polynômes de Laguerre associés Ln (x). Pour s = 0 les
solutions s'appellent simplement les polynôme de Laguerre et nous les rencontre-
rons pour la résolution de l'atiome d'hydrogène.
Nous n'avons plus de paramètres libres et tous les cas se ramène au choix α(x) =
1 β(x) = −2x ( le coecient de x négatif ne pourra pas satisfaire l'hermicité) et
nous obtenons
2
w(x) = e−x
18
Les solutions sont appelées les polynômes d'Hermite . Nous les rencontrerons
très fréquement dans les problèmes d'oscillateurs harmoniques.
17. Les polynômes de Chebychev ont été trouvé par l'auteur du même nom ( professeur
à l'université de St-Petersburg dans les années 1850-80) à l'occasion de l'étude de la théorie
d'interpolation : Soit une fonction donnée sur l'intervalle [−1, 1]. On cherche un polynôme de
degrès n Tn (x) qui coïncide avec f (x) en n points et qui minimise l'écart (maxx∈[−1,1] |f (x) −
Tn (x)| ) avec ce dernier. Les solutions sont nos polynômes.
18. Professeur à l'Ecole Polytechnique et à l'ENS dans les années 1850 − 1880.
136
10 Les systèmes Sturm-Liouville.
λn = α2 n(n − 1) + β1 n = n (α2 n + β1 − α2 )
Pour les Chebychev, les valeurs propres sont de la forme λn = −n2 et pour les
les legendre de la forme λn = −n(n + 1).
L'équation de Laguerre s'écrit
xu00 − (x − (s + 1)) u0 + nu = 0
[n/2]
X n 2n − 2m
Pn (x) = xn−2m
m n
i=0
[n/2]
X 1
Hn (x) = (2x)n−2m
i=0
m!(n − 2m)!
1 dn
fn (x) = Cn (αn w)
w dxn
137
10 Les systèmes Sturm-Liouville.
19
Nous omettons la démonstration de cette formule , mais un des sous produit de
cette démonstrations nous fournit la norme des polynômes orthogonaux :
Z +∞ Z +∞
w(x)fn2 (x)dx = (−1) n!an n
αn (x)w(x)dx
−∞ −∞
Comme nous l'avons souvent indiqué, les polynômes orthogonaux sont dénis à
un coecient multiplicatif près, et on peut utiliser l'expression ci-dessus pour les
normaliser.
10.8 Problèmes.
1. Calculer la fonction poids pour les équations suivantes ; mettre ces équations
sous forme SL :
8. x3 y 00 + xy 0 + 2y = 0
(x2 + α1 x + α0 )y 00 + (β1 x + β0 )y 0 − λy = 0
n'a pas de solution polynomiale si α(x) a deux racines complexes [Help : dé-
montrer d'abord que wα n'est pas susement rapidement décroissant et en-
suite qu'on ne peut pas trouver wα continue s'annulant en deux points, pour
pouvoir ensuite le connecter à la solution wα = 0. Pour démontrer ce dernier
point, remarquer que
R α(x) peut se mettre sous la forme de (x − a)2 + b2 et que
dx/α(x) = (1/b)Arctg (x − a) /b].
19. Il sut d'abord de démontrer que fn est un polynôme de degrès n et de démontrer
ensuite que fn et fm sont orthogonale avec le poids w. Comme nous savons que les systèmes
de polynômes orthogonaux avec un poid w sont unique ( à un coecient multiplicatif près, voir
un des exercices plus bas) nous tenons notre démonstration.
138
10 Les systèmes Sturm-Liouville.
α(x)y 00 + (β1 x + β0 )y 0 − λy = 0
5. Démontrer que si les polynômes {Pn (x)} sont les fonctions propres d'un sys-
tème SL avec le poids w(x), alors les polynomes {Pn0 (x)} sont orthogonaux avec
le poid w(x)α(x).
dm
Gm
n−m (x) = Pn (x)
dxm
Quelle est la relation entre les ultrasphériques et les fonctions de legendre asso-
ciés ?
v 00 − x2 v = −λv
D'après ce que nous avons dit, cette équation n'a pas de solution polynômiale.
On peut cependant la mettre sous une meilleure forme. Poser
Et déduire une équation pour la fonction φ(x). Comment faut il choisir la fonction
f (x) pour éliminer le terme en −x2 φ(x) (attention au signe choisi) ? Que devient
alors l'équation au valeurs propres pour φ? Comment les valeurs propres sont
139
10 Les systèmes Sturm-Liouville.
∂ψ ∂2ψ
i = − 2 + x2 ψ
∂t ∂x
sur l'intervalle x ∈] − ∞, +∞[
√
12. Soit wαy , où y est la solution d'un système Sturm-Liouville αy 00 +
u(x) =
0
βy = λy . Démontrer que u obéit à une équation du genre
u00 + Ru = 0
où il faut expliciter la fonction R(x). Cette forme est le point de départ d'une
approximation célébre, appelé WKB.
140
11 Le calcul variationnel
11.1 Introduction.
Dès que vous avez vu les bases de l'analyse, vous avez appris à répondre à la
question suivante : comment trouver le point x pour lequel la fonction f (x) est
maximum (ou minimum) ? f est une machine qui prend un nombre en entrée et
produit un nombre en sortie. La question ci-dessus en réalité est celle de trouver
un extremum local : un point qui produit la sortie la plus grande (ou la plus
petite) que tous ses voisins immédiats. Nous savons que pour un tel point x∗,
f 0 (x∗) = 0.
Donnons nous maintenant une fonctionnelle S. Ceci est une machine qui prend
une fonction en entrée et produit un nombre en sortie. Par exemple
Z b
f (x)2 + f 02 (x) dx
S(f ) = (11.1)
a
est une fonctionnelle qui prend une fonction, ajoute son carré et le carré de sa
dérivée et les intègre entre deux bornes pour produire un nombre. Si on entre la
fonction sin x dans cette machine, elle produit le nombre b − a. Si on y entre la
fonction exp x, elle produit le nombre 2 exp(2b) − 2 exp(2a).
Le calcul variationnel consiste à répondre à la question suivante : quelle est la
fonction f qui produit la plus grande sortie S(f ) ? La réponse que nous allons
voir par la suite est que f doit satisfaire une équation diérentielle qui est relié à
la forme de la fonctionnelle S.
Donnons deux exemples avant d'aller plus loin.
141
11 Le calcul variationnel
√
de mettre cela
p en forme. La vitesse de l'objet à l'ordonnée
p y vaut 2gy.L'élément
d'arc ds = dx2 + dy 2 = (1 + f 0 (x)2 dx est parcouru en un temps dt = ds/v .
Le temps total du parcours est donc
s
x1
1 + f 0 (x)2
Z
T = dx
0 2gf (x)
1
Et il faut trouver la fonction f qui minimise cette intégrale . Ce problème avait
été lancé comme un dé par un des frères Bernoulli vers 1690 (à peine dix ans
après l'invention du calcul diérentiel) à la communauté scientiques. Tous les
grands (Newton, Leibnitz, l'autre Bernoulli, Hospital, ...) y répondirent. Euler
(~1740) a trouvé une solution générale de ce genre de problème et Lagrange
(~1780) les a généralisé à la mécanique.
est la trajectoire suivie par la particule. Ceci est une nouvelle formulation de
la mécanique. Classiquement, nous résolvons l'équation diérentielle F = ma
où la fonction F (x) = −dV /dx et a = d2 x/dt2 pour remonter à la trajectoire
x(t). Ici, la démarche est diérente : de toute les trajectoires possibles qui relie
(0, 0) à (t1 , x1 ), la particule choisit justement celle qui minimise l'intégrale (11.2).
Comme si un dieu calculait le coût (qu'on appelle l'action S ) de chaque trajec-
toire et choisissait la meilleure. Bien sûr, cette formulation de la mécanique et la
formulation Newtonienne sont équivalente, bien que la formulation lagrangienne
soit beaucoup plus profonde et pratique. Notez que la quantité dans l'intégrale
n'est pas l'énergie totale, mais l'énergie cinétique moins l'énergie potentielle. On
appelle cette quantité le Lagrangien.
1. A première vue, il semble qu'il manque quelque à cette formulation : l'intégrale ne contient
pas de référence à y1 et nous n'exigeons apparemment pas que la particule nisse sa trajectoire
à l'ordonné y1 . Nous y reviendrons plus tard, quand nous aborderons les contraines.
142
11 Le calcul variationnel
Z b
S[f ] = L[f (t), f 0 (t), t]dt (11.3)
a
Trouver la fonction f (t), avec les conditions f (a) = y0 et f (b) = y1 pour laquelle
l'intégrale est un extremum.
Traditionnellement, la fonction L qui se trouve sous l'intégrale est appelé le
Lagrangien. C'est une fonction tout ce qu'il y a de plus normal. Par exemple,
L(x, y) = x2 + y 2 . Comme à un instant donné, f (t) et f 0 (t) sont des nombres, il
est tout à fait légitime de calculer L[f (t), f (t)] qui dans ce cas, vaut f (t)2 +f 0 (t)2
0
comme l'expression que nous avions écrit dans (11.1). En plus, nous avons le droit
de prendre les dérivées partielles de L : par exemple, dans ce cas, ∂L/∂x = 2x et
∂L/∂y = 2y . Il est usuel, si nous avions noté L[f (t), f 0 (t)], de noter ces dérivées
partielles par ∂L/∂f et ∂L/∂f 0 : cela veut juste dire dérivée partielle par rapport
au premier ou deuxième argument. Dans ce cas, nous aurions eu par exemple
∂L/∂f 0 = 2f 0 (t). D'ailleurs, ∂L/∂f 0 t et on peut par
est ici une fonction de
exemple prendre sa dérivée par rapport au temps : d[∂L/∂f 0 ]/dt = 2f 00 (t). Si au
0
début, vous trouvez cette notation abrupte, remplacez f et f avant les dérivations
par x et y , et remettez les à leur place une fois les opérations terminées. Mais
on prend vite l'habitude de ces notations. Notez également que l'on ne cherche
pas n'importe quelle fonction, mais les fonctions qui prennent des valeurs bien
déterminée (y0 et y1 ) aux bords a et b.
Avant d'aller plus loin, revenons un instant au cas d'une fonction f (x) dont ont
veut trouver l'extremum. Si nous connaissons la valeur de la fonction au point x,
alors son accroissement quand on se déplace au point x+ est donnée par
La première partie de l'accroissement (celle qui est importante quand est petit)
est linéaire en : si nous avions pris un deux fois plus grand, nous aurions eu un
accroissement deux fois plus grand également. La fonction A(x) est le coecient
de proportionnalité entre df et au point x, et nous avons plus l'habitude de la
0
noter par f (x). Le point x est un extremum si le coecient de proportionnalité
0
f (x) = 0, c'est à dire qu'en se déplaçant autour du point x, l'accroissement de f
(à l'ordre 1 en ) est nulle.
Nous n'avons qu'à suivre cette méthodologie pour trouver l'extremum de notre
fonctionnelle S[f ] : Nous allons ajouter la fonction g(t) à la fonction f (t), et
calculer l'accroissement de la fonctionnelle dS = S[f + g] − S[f ]. Avec un peu de
chance, cette accroissement comporte un terme linéaire en :
143
11 Le calcul variationnel
y1
f+εg
f
y0
a b
Z b
S[f + g] = L[f (t) + g(t) , f 0 (t) + g 0 (t)]dt (11.4)
a
b b
∂L ∂L 0
Z Z
= S[f ] + g(t)dt + g (t)dt + ...
a ∂f a ∂f 0
où nous avons simplement utilisé le fait que L(x+h, y+k) = L(x, y)+(∂L/∂x)h+
(∂L/∂y)k+... On peut déjà voir la partie linéaire apparaître. Nous pouvons mettre
144
11 Le calcul variationnel
la deuxième intégrale un peu plus en forme en faisant une intégration par partie :
b b Z b
∂L 0 ∂L d ∂L
Z
g (t)dt = g(t) − g(t)dt
a ∂f 0 ∂f 0 a a dt ∂f
0
La première partie est nulle, puisque la fonction g vaut justement 0 sur les bords.
En remettant ce qui reste dans l'expression (11.4), nous avons :
b
∂L d ∂L
Z
dS = − g(t)dt + ...
a ∂f dt ∂f 0
∂L d ∂L
− =0 (11.5)
∂f dt ∂f 0
qui est appelé l'équation d'Euler-Lagrange. Notez que cette équation est homo-
gène dimentionnellement. Faisons quelques exercices pour nous xer les idées.
d 0∂L ∂L
00 0 d ∂L ∂L 0 ∂L 00 ∂L
f −L = f +f − f − f −
dt ∂f 0 ∂f 0 dt ∂f 0 ∂f ∂f 0 ∂t
d ∂L ∂L ∂L
= f0 − −
dt ∂f 0 ∂f ∂t
145
11 Le calcul variationnel
∂L dV
=−
∂x dx
Comme nous l'avons mentionné ci-dessus, le seul terme qui dépend de la première
variable x est V (x). Remplacer mentalement la deuxième variable ẋpar y dans
l'expression du lagrangien avant la dérivation si cela vous dérange. La dérivation
par rapport à la deuxième variable ( ẋ )donne
∂L
= mẋ
∂ ẋ
et la dérivation par rapport au temps de cette dernière nous donne
d ∂L
= mẍ
dt ∂ ẋ
mẍ + dV /dx = 0
Ce qui est bien sûr la même chose que l'équation de Newton F = ma.
Allons un peu plus loin. Supposons que le potentiel est constant V (x) = Cte,
s'est à dire que la particule se meut dans une région de l'espace où il n'est pas
soumis à une force. On peut également dire que cette région de l'espace possède
une symétrie d'invariance par translation : deux particules identiques placé à
deux endroits diérents de l'espace réagirait exactement de même ; dit encore
autrement, nous n'avons aucune méthode pour déterminer où l'on se trouve dans
l'espace. Dans ce cas, ∂L/∂x = 0, et l'équation d'E.L. s'écrit
d ∂L
=0
dt ∂ ẋ
ou encore la quantité p = ∂L/∂ ẋ = Cte. Or, p n'est autre chose que la quantité du
mouvement p = mẋ. Donc, symétrie d'invariance par translation dans l'espace
nous impose la conservation de la quantité du mouvement. C'est un concept
2
extrêmement profond : à chaque symétrie du Lagrangien correspond une loi de
146
11 Le calcul variationnel
Nous remarquons que nous avons une symétrie : si nous avions choisi nos axes
pour que à t = 0, θ = π/2 et θ̇ = 0 ( ce qui revient à choisir le plan xy déni par le
rayon vecteur de la particule et sa vitesse ), alors θ(t) = π/2 vérie trivialement
l'équation (11.7) : la particule reste dans le plan xy . Le lagrangien s'écrit plus
simplement donc
L = ṙ2 + r2 φ̇2 − V (r)
Nous remarquons que φ n'intervient pas dans le lagrangien, le moment associé à
cette variable se conserve donc :
∂L
pφ = = 2r2 φ̇ = cte
∂ φ̇
147
11 Le calcul variationnel
Ceci n'est rien d'autre que la conservation du moment cinétique, comme nous
l'avions annoncé ci-dessus. Finalement, il faut écrire l'E.L. pour r et résoudre
les équations diérentielles résultantes. Le lecteur trouvera la solution de ses
équations dans les livres de mécanique.
Comme par ailleurs, ∂L/∂θ = −∂U/∂θ = −g` sin θ, nous trouvons l'équation du
mouvement :
˙
θ̈ + 2 `/` θ̇ + (g/`) sin θ = 0
Dérivation vectorielle.
148
11 Le calcul variationnel
genre fx = mẍ, fy = mÿ , ... Nous pouvons vectoriser les équations E-L pour
nous éviter ce gymnastique inutile et donner un sens géométrique à nos équations.
Pour cela, nous devons généraliser le concept de dérivation. Premièrement,
remarquons que le Lagrangien est toujours un scalaire. Un Lagrangien avec un
sens géométrique ne doit donc faire intervenir que des opérations sur les vecteurs
dont le résultats est un scalaire intrinsèque, c'est à dire un scalaire dont le résultat
ne dépend pas du système de coordonnées que nous avons choisi. Le meilleurs
exemple d'une telle opération est le produit scalaire.
Prenons par exemple, dans l'espace à trois dimensions, la fonction f (r) = r.r ;
si nous nous sommes équipées de coordonnées cartésiennes, ceci est un racourci
pour écrire
f (x, y, z) = x2 + y 2 + z 2
Nous pouvons donc donner un sens à des expressions tel que ∂x f . Pouvons nous
∂f /∂r ? La réponse est évidemment oui si nous nous
donner un sens à l'expression
souvenons de la dénition de la dérivée. Faisons un petit déplacement u autour
du point r et mesurons la partie linéaire du changement dans la fonction f
df = f (r + u) − f (r)
= (r + u).(r + u) − r.r
= 2r.u + O(u2 )
où (∂f /∂r) représente le vecteur 2r. Ceci est l'exact equivalent (et la générali-
sation) de la dérivée de la fonction d'une seule variable scalaire f (x) = x2 , où
0
f (x) = 2x. En analyse vectorielle, la quantité (∂f /∂r) est souvent notée gradf
3
ou ∇f .
Nous pouvons généraliser le produit scalaire en utilisant les notations matri-
cielle. Dans ce cas, le produit scalaire ci-dessus s'écrit rT r où rT est un vecteur
colonne associé à r. De façon encore plus générale, nous pouvons avoir des ex-
T
pressions du genre f (r) = r Ar où A est une application bilinéaire, qu'on appelle
plus comunément un tenseur de rang 2. Il n'est pas dicile alors de voir que
df = rT (A + AT ) .u
149
11 Le calcul variationnel
1 0
A=
0 r2
mẍ = −gradV
Exemple fondamental. Pour xer les idées, considérons le cas de la corde vi-
brante xée à ces deux extrémités (x = 0 et x = L). A chaque instant t, la
hauteur de la corde à la position x est donnée par φ(x, t). Étant donnée la forme
de la corde à l'instant t0 (φ(x, t0 ) = y0 (x) ) et t1 (φ(x, t1 ) = y1 (x) ), quelle est
l'évolution de la corde qui minimise l'action ? La trajectoire de la corde est alors
la surface reliant y0 (x) à y1 (x) dans le temps.
A un instant donnée t, l'énergie cinétique de la corde est donnée par la somme
de l'énergie cinétique de tout ses points matériel,
Z L
2
T = ρ (∂φ/∂t) dx
0
Z L
2
V = k (∂φ/∂x) dx (11.8)
0
150
11 Le calcul variationnel
Z t1 Z L h i
2 2
S[φ] = (∂φ/∂t) − c2 (∂φ/∂x) dxdt
t0 0
En considérant une variation g(x, t) autour de la trajectoire φ(x, t), nous trou-
vons qu'à l'ordre 1 en , la variation de l'action est
t1 L
∂φ ∂g 2 ∂φ ∂g
Z Z
S[φ + g] − S[φ] = −c dxdt
t0 0 ∂t ∂t ∂x ∂x
t1 L
∂2φ 2
2∂ φ
Z Z
δS = − c gdxdt
t0 0 ∂t2 ∂x2
δS = 0 quelque soit la variation g que si le terme entre []est nul, c'est à dire
∂2φ ∂2φ
2
− c2 2 = 0
∂t ∂x
qui est bien sûr l'équation d'onde bien connue.
n
X ∂ ∂L ∂L
− =0
i=1
∂x i ∂u,i ∂u
Remarquez que cette expression est une simple généralisation d'EL à une dimen-
sion : l'expression de dérivation de moment (d/dx)(∂L/∂u0 ) est remplacée par la
somme de toutes les dérivées partielles.
151
11 Le calcul variationnel
Tenseur energie-impulsion. Nous pouvons pousser un peu plus loin. Nous avons
vu l'égalité de Beltrami quand nous avons une fonction d'une variable et que le
lagrangien ne dépend pas de la variable indépendante :
d ∂L
y0 −L =0
dx ∂y 0
d ∂L
y,x −L =0
dx ∂y,x
n
X ∂Tij
=0
j=1
∂xj
la quantité T qui joue le rôle de l'Hamiltonian pour le champ est souvent appelé
en physique le tenseur énergie-impulsion. Le lecteur interessé pourra consulter
5
des livres de géométrie pour voir la signication générale de ce tenseur .
Exercices.
1. Pour une corde vibrante dans un champ de gravitation, nous devons ajouter
ρ0 φdx à l'énergie potentielle (11.8) où ρ0 est le produit de
R
le terme Vg =
I
la densité par l'accélaration de la gravité. Déduire l'équation du mouvement
du champ dans ce cas. Même question si la corde se trouve dans un potentiel
κφ2 dx.
R
harmonique Vh = I
2. Calculer le tenseur energie-impulsion pour la corde vibrante sans potentiel
extérieur. Que représente Ttt ? Que veut dire l'identité de Beltrami dans ce
cas ? Que représente alors Ttx ?
152
11 Le calcul variationnel
∂φ ∂φ
Z X
V = aij dr
I i,j ∂xi ∂xj
où pour les coecients, nous pouvons supposer aij = aji (pourquoi ?). Ce
genre d'expression se rencontre fréquemment dans des problèmes comme
l'élasticité des cristaux, où les déformations dans les diérentes directions
ne sont pas équivalentes.
6. Imaginer que vous marchez en montagne sur un chemin, et vous vous intéressez au point
le plus bas sur ce chemin et non pas en général.
153
11 Le calcul variationnel
4
g(x,y)=0
2
A
0
O
−2
−4
−4 −2 0 2 4
(∂g/∂x)h + (∂g/∂y)k = 0
154
11 Le calcul variationnel
(2x)1 − (2y)(−a) = 0
∂F ∂f ∂g
= −λ =0 (11.10)
∂x ∂x ∂x
∂F ∂f ∂g
= −λ =0 (11.11)
∂y ∂y ∂y
∂F
= g(x, y) = 0 (11.12)
∂λ
L'équation (11.12) n'est rien d'autre que la contrainte et assure que la solution
trouvée est bien conforme. Les deux premières équations (11.10,11.11) ne sont
rien d'autre que la condition (11.9) si on y élimine λ.
2x + λa = 0
2y − λ = 0
Ce qui bien sûr nous donne x + ay = 0. Nous trouvons à nouveau le même point
optimum ; de plus, si on le souhaite, on peut trouver également λ∗ = 2y ∗ =
2
2b/(1 + a ).
Le coecient λ est appelé un multiplicateur de Lagrange. La méthode a une
signication physique profonde : supposons que nous avons un point matériel
dans le potentiel f (x, y) astreint à rester sur la courbe g(x, y). Au point x∗ , le
point (qui est stable) est soumis à une force non-nulle de la part du potentiel
F = (∂x f, ∂y f ). Pour qu'il puisse rester sur la position x∗ , il faut que la courbe
155
11 Le calcul variationnel
g(x, y) exerce une force de réaction sur le point qui vaut justement λ∗ (∂x g,∂y g).
Si on enlevait la contrainte mais qu'on soumettait le point matériel à cette force
9
supplémentaire, il se mettrait exactement à la même position.
avec la contrainte Z 2π
R(θ)dθ = L (11.14)
0
156
11 Le calcul variationnel
R−λ=0
c'est à dire R = λ = Cte. Ceci est bien un cercle. Pour trouver λ, nous utilisons la
contrainte (11.14), qui nous donne λ = L/2π . La courbe qui minimise la surface
est donc un cercle de rayon R = L/2π .
Z ∞
c(x)dx = 1 (11.15)
0
Z ∞
xc(x)dx = T (11.16)
0
Z ∞
H [c] = c(x). log [c(x)] dx (11.17)
0
soit extremum. La quantité −H est souvent appelé entropie. Avec les deux contraintes
(11.15,11.16), nous devons donc chercher l'extremum de la fonctionnelle
Z ∞ Z ∞ Z ∞
H 0 [c; λ, µ] = c(x). log [c(x)] dx − λ c(x)dx − µ xc(x)dx
0 0 0
Le calcul est assez simple dans ce cas, puisque nous n'avons pas de dérivés dans
la fonctionnelle. En cherchant la valeur de la fonctionnelle pour H 0 [c + g; λ, µ]
et en nous contentant d'ordre 1 en , nous trouvons
Z ∞
H 0 [c + g; λ, µ] = H 0 [c; λ, µ] + (1 + log c − λ − µx) g(x)dx
0
157
11 Le calcul variationnel
log c = (λ − 1) + µx
ou autrement dit c(x) = Ae−µx ; l'utilisation des deux contraintes nous donne
A = −µ = 1/T . Autrement dit,
Rappelons qu'un système Sturm-Liouville est une équation aux valeurs propres
Nous avons mentionné (et insisté) que si nous trouvons un poids w(x) qui rend
l'opérateur hermitien, alors les solutions des systèmes SL minimise une certaine
fonctionnelle. Nous avons vu que si une telle fonction poids existe, alors elle doit
obeïr à l'équation (αw)0 = βw et le système peut alors s'écrire sous la forme
alternative
d
(wαy 0 ) + wγy = λwy
dx
Remarquer que cette forme ressemble furieusement à une équation Euler-Lagrange.
On peut faire le chemin inverse : minimiser la fonctionnelle
Z
p(x)y 02 + q(x)y 2 dx
S[y] =
I
avec la contrainte Z
w(x)y 2 dx = 1
I
Comme on peut le voir, nous pouvons formellement identier l'équation d'Euler-
Lagrange du système ci-dessus à un système SL en posant p = wα, q = −wγ . A
regarder de plus près, la formulation variationnelle d'un système SL, si on assimile
la variable x au temps, ressemble beaucoup à un oscillateur harmonique avec une
masse et une constante de ressort dépendant du temps. Ceci, comme nous l'avons
mentionné, est le point de départ de l'approximation WKB.
158
11 Le calcul variationnel
y(a) = y0 ; y(b) = y1
Pour cela, nous avons écrit la variation de S en fonction d'une petite perturbation
g(x) pour obtenir
b b
∂L ∂L d ∂L
Z
δS = g + − gdx (11.18)
∂y 0 a a ∂y dx ∂y 0
et nous avons cherché dans quelles conditions, δS = 0 quelque soit g(x). Nos
conditions aux bords nous ont imposées g(a) = g(b) = 0, donc le premier terme
est nul ; le deuxième terme nous donne les équations d'E-L.
Ceci dit, nous pouvons relacher nos contraintes, et ne pas
exiger que y(a) = y0 , y(b) = y0 . Le problème serait alors :
parmis toutes les courbes entre a et b, trouver celle qui ex-
trémise la fonctionnelle. Dans ce cas, l'annulation de δS
exige toujours l'annulation de l'intégrale, qui nous donnera
comme d'habitude les équation d'Euler Lagrange, et l'an-
nulation du terme de bord. Or, cette fois, comme les bords
ne sont plus xe, nous n'avons plus g(a) = g(b) = 0, pour Figure 11.3 Bords
annuler les termes de surface, nous devons exiger libres
∂L
=0
∂y 0 x=a,b
b b
d2 ∂L
∂L d ∂L ∂L ∂L d ∂L
Z
δS = g− g + 00 g 0 + − + gdx
∂y 0 dx ∂y 00 ∂y a a ∂y dx ∂y 0 dx2 ∂y 00
159
11 Le calcul variationnel
Pour une poutre élastique soumis à une charge f (x) par exmeple, l'énergie s'écrit
Z L 002
E= By − f (x)y dx
0
160
11 Le calcul variationnel
Or,
∂L γlg ẏ
=p = γlg cos θ
∂ ẏ 1 + ẏ 2
où θ est l'angle entre la tangente et l'axe y. On en déduit l'angle de contact
solide-liquide
γsg − γsl
cos θ =
γlg
La relation ci-dessus est connu sous le nom de la relaton d'Young. Comme la
mesure de l'angle de contact est facile, on l'utilise en général pour mesurer les
tensions de surface.
b b b+db
∂L ∂L d ∂L
Z Z
S[y, b] − S[y + g, b + db] = g + − gdx + L(y 0 , y, x)d
∂y 0 a a ∂y dx ∂y 0 b
b
∂L
g + L(y 0 , y, x)db + {...} (11.19
∂y 0 a
Cela nous donne, à l'ordre 0 en db, y(b) = φ(b) bien sûr, et de plus, à l'ordre 1 :
∂L 0 0 0
δS = (φ (b) − y (b)) + L(y , y, x) db
∂y 0
161
11 Le calcul variationnel
∂L ∂L 0
y 0 (b) 0
−L= φ (b)
∂y ∂y 0
Le lecteur peut noter que le terme de gauche est souvent noté H , tandis que
∂L/∂y 0 est souvent noté p. En mécanique analytique, on les appelles l'Hamiltonien
et le moment. L'équation s'écrit donc, sur le bord,
Exemple : angle de contact d'une goutte posé sur un substrat solide non
plane.
X
ds2 = gij dxi dxj
i,j
162
11 Le calcul variationnel
où gij = gij (x1 , x2 ) est appelé le tenseur métrique. Par exemple, si nous avons
muni le plan euclidien de coordonées polaires, ds2 = dr2 + r2 dθ2 et nous avons
2
(en posant x1 = r , x2 = θ ), g11 = 1, g22 = x , g12 = g21 = 0.
Nous allons considérer dans la suite le cas très particulier où g11 = 1, gi6=j = 0
2 11
et g22 = g (x), où g est une fonction quelconque . Le prérimètre d'une courbe
y(x) reliant deux points est donnée par
Z 2 p
`[y(x)] = 1 + g 2 (x)y 02 dx
1
p
y 0 = a/g g 2 − a2
où a est une constante d'intégration. Dans le cas des coordonnées polaire par
12
exemple où g(x) = x, nous pouvons intégrer l'équation ci-dessus et obtenir
l'équation d'une droite y = α + arccos(a/x) où a et α sont deux constante d'in-
tégration. Pour vous convaincre que cela est eectivement le cas, Il sut d'inte-
préter x comme r et y comme θ, faire un petit schéma et quelques manipulations
d'angles .
Prenons le cas plus intéressant pour nous de g(x) = sin(x). A nouveau, l'inté-
13
gration s'eectue sans diculté et nous obtenons
où ψ et α sont deux constantes d'intégration. Nous voyons par exemple que pour
α = π/2, nous avons une famille de droites données par y = Cte. Prenons la
géodésique y = 0 et considérons le point P = (π/2, π/2) en dehors de cette
droite. Toute les droites traversant ce point doivent avoir le paramètre ψ = 0. Il
n'est pas alors dicile de voir que toute ces droites croisent la droite y = 0 au
point cot x = 1/ cos α.
Nous venons de démontrer dans ce cas que toutes les droites traversant P
croisent une droite ne contenant pas P ; cela est très diérent du cinquième axiome
d'Euclide. Le cas que nous venons de traiter correpsond à la géométrie sphérique :
sur la sphére unité, la distance entre deux points est donnée par ds2 = dθ2 +
2 2
sin θdφ . Mais le point de vue de Rieman est beaucoup plus fondamental que
cela : ce qui caractérise l'espace et qui lui donne sa substance est la donnée du
tenseur métrique. Les habitants de la surface de la sphère unité ne peuvent pas
11. Nous noterons par habitude les coordonnées (x, y) sans leur associer l'idée de coordonnées
cartesiennes
12. il sut d'eectuer le changement de variable u = a/x
13. Il sut de poser u = cot x
163
11 Le calcul variationnel
z
y
r(z)
L
F
a x
Figure 11.5 (a) : surface minimum entre deux cercle ; (b) ambage d'une
barre ; (c) pont suspendu à une chaînette.
voir qu'ils sont sur une sphére. Ils peuvent par contre visionner les géodésiques
(en suivant les trajets des faisceaux de lumière ) et déterminer la nature de leur
espace en faisant des mesures par exemple de la somme des angles d'un triangle
formé par trois géodésiques. C'est exactement dans ce cadre qu'Einstein a formulé
sa théorie de gravité en 1917, où les masses confèrent de la courbure à l'espace-
temps.
A ajouter.
Problèmes.
164
11 Le calcul variationnel
4. Elasticité 1-d. Soit une barre dont on repère les points (avant deformation)
par la coordonnées x. On appuie sur la barre parralèlelement à son axe ; les
points de la barre se déplacent aux coordonnées x0 (Figure 11.6). Nous appe-
lons déplacement u(x) = x − x 0
la fonction qui traque cette quantité. L'énergie
élastique stocké dans la barre est proportionnel au carré du gradient de ce terme :
Z L
E= (1/2)ku0 (x)2 dx
0
Z L
(1/2)ku0 (x)2 − F u0 (x) dx
E=
0
Figure 11.6
Démontrer alors que u(x) = ax où à est une constante à
determiner. Déterminer a en utilisant les conditions aux bords naturelles (section
11.6). En déduite la loi d'élasticité de Hook
F = Ku(L)
5. Flambage d'une poutre. Appuyez sur une règle tenu verticalement sur une
table ; au delà d'une certaine force, la règle ambe (g.11.5b). Ceci est un pro-
blème extrêmement important de la résistance des matériaux et conditionne
la conception des tours pour qu'ils ne s'écroulent pas (en ambant) sous leurs
propres poids. Repérons la barre par son écart à la droite y(x). En supposant
faible l'écart de la barre par rapport à la droite, l'énergie de courbure de la barre
165
11 Le calcul variationnel
est donné par sa courbure locale B(y 00 (x) )2 . Nous supposons l'extrémité de la
courbe maintenu à y = 0, mais pouvant coulisser sur l'axe x et soumis à une
force F. Pour trouver la conguration qui minimise l'énergie, nous devons donc
trouver l'extremum de la fonctionnelle
Z a
S[y, a] = B(y 00 (x) )2 dx − F (L − a)
0
soumis à la contrainte Z a
(1 + (1/2)y 02 dx = L
0
p
Nous avons approximé ici l'élément de ligne ds = 1 + y 02 par son développement
de Taylor, en supposant les écarts à la ligne (et leurs dérivées) faible. Démontrez
alors que pour F > Fc , la poutre droite n'est plus la solution optimum ; calculer
Fc .
dx = cos θds
dy = sin θds
Z L n o
2
S[θ] = B (θ0 ) + F cos θ ds − F L
0
Que l'on peut traiter par les équation d'EL sans contrainte : la longueur d'arc
s gère automatiquement la constance de la longueur totale de la poutre. Les
coordonnées semi-intrinsèque (s, θ) sont très utilisé en géométrie diérentielle.
Noter de plus la grande similarité de l'action à celle de l'oscillation d'une pendule
dans le champs de la gravité.
166
11 Le calcul variationnel
9. Isopérimétrique III. Quelle est la courbe de surface donnée qui minimise son
périmètre ?
10. Equation de la chainette. Une chaîne y(x) est suspendu entre deux points
distant de a. La longueur totale de la chaîne est L. Trouver l'équation de la
chaîne. Help : A l'évidence, la chaîne doit minimiser l'énergie potentielle, avec
R
une contrainte sur sa longueur. L'energie potentielle est de la forme ρyds ; on
doit donc trouver le minimum de
Z a/2 n p p o
0
H = ρy 1 + y 0 (x)2 − λ 1 + y 0 (x)2 dx
−a/2
11. Trajectoire complexe. Soit une fonction y(x) complexe (R → C) dont l'ac-
tion est dénie par Z
0
S[y] = L(y, y 0 , y ∗ , y ∗ ; x)dx
I
0 ∗0
Comme par exemple L = y y + kyy ∗ . Obtenir les équations d'Euler-Lagrange de
∗
cette fonction. [Help : il faut démontrer que l'on peut considerer y et y comme
deux composantes indépendantes, et obtenir une equation d'EL pour chacune].
14. Nous évitons pour l'instant les exposants et notons les coordonnées xi au lieu de xi
167
11 Le calcul variationnel
ci-dessus en donnant des noms diérents aux diérents composants : nous notons
par exemple A = (φ, −A) où nous appelons φ le potentiel et A le potentiel vec-
teur ; de même, nous notons x = (t, x) où le premier composant est appelé temps
et les trois autres l'espace. Les équations d'électromagnétisme ont été formulé
dans le cadre de cette séparation étrange et les diérentes dérivées du champ ont
reçu des noms diérents. Par exemple, on appelle champ électrique le vecteur à
3 dimensions
E = −∂t A − ∇φ
et champ magnétique
H=∇×A
Revenons à notre formulation générale. Le tenseur électromagnétique est déni
par
∂Ak ∂Ai
Fik = −
∂xi ∂xk
Ce tenseur est bien sûr anti-symétrique Fik = −Fki .
1. Donner l'expression du tenseur F en fonction des champs Ei et Hk .
2. Démontrer que pour trois indices i, j, k , la denition même du tenseur F
impose
∂Fij ∂Fjk ∂Fki
+ + =0
∂xk ∂xi ∂xj
démontrer que les seules équations non-triviales sont celles où i 6= j 6= l et
cela nous donne 4 équations que nous pouvons regrouper en
∇×E = −∂t H
∇.H = 0
qui ne sont rien d'autre que les deux premieres équations de Maxwell.
168
11 Le calcul variationnel
15
est donnée par l'intégrale sur un volume du Lagrangien suivant :
3
X
L=− i j Fij2
i,j=0
3
X ∂Fij
i j =0
j=0
∂xj
3. Mettre ces équations sous la forme plus usuelle des deux autres équations
de Maxwell :
∇ × H = ∂t E ; ∇.E = 0
15. Le signe moins n'a pas de conséquence pour nos calculs, mais assure que la solution trouvée
est un minimum plutôt qu'un maximum de l'action.
169
12 Calcul des perturbations.
Le calcul des perturbations n'est pas une méthode scientique utilisé dans les
hôpitaux psychiatriques pour évaluer les symptômes d'un patient. Il existe peu
de problème exactement soluble en physique et il faut souvent recourir aux tech-
niques d'approximations. Une des techniques les plus utilisées est celle qui porte
le nom de ce chapitre. L'idée de base est une généralisation du développement de
Taylor : si nous connaissons la valeur d'une fonction au point x0 , nous pouvons
calculer, sous certaines conditions, la valeur de la fonction au point x0 + :
Les racines d'un polynômes. Supposons que nous ne connaissons pas la réso-
lutions des équations algébriques de second ordre, mais que nous savons résoudre
l'équation x2 − x = 0 , dont les racines sont x0 = 0, 1. Nous cherchons la solution
170
12 Calcul des perturbations.
de l'équation
x2 − x + = 0 (12.1)
Nous cherchons la solution sous cette forme puisque nous pensons que comme
est petit, la nouvelle racine ne doit pas être trop loin de l'ancienne, et l'écart
doit être justement fonction de : pour = 0, nous devons trouver la solution
originale. Nous connaissons déjà x0 , et il nous faut trouver une méthode pour
calculer x1 , x2 , ... Branchons maintenant (12.2) dans (12.1) et regroupons les en
fonction des puissances d' :
x20 − x0 = 0 (12.4)
... = 0
L'équation (12.4), donnée par le coecient de 0 et appelé le terme d'ordre zéro,
est notre équation originale non perturbée que nous savons résoudre. l'équation
(12.5) nous donne x1 :
x1 = 1/(1 − 2x0 )
Comme nous connaissons déjà x0 , nous déterminons facilement que x1 = 1 ou
−1. L'équation (12.6) nous détermine le coecient x2 :
x21
x2 =
1 − 2x0
et donc x2 = 1 ou −1. Nous pouvons continuer ainsi (cela dépend de notre
patience) et trouver les coecient xn . Ce que nous devons remarquer est que : (i)
pour déterminer xk , nous n'avons que besoin des xk−1 , xk−2 , ... (ii) l'équation qui
détermine xk est linéaire en xk , c'est à dire ne comporte que des puissances unité
de xk . C'est deux points nous permettent assez aisément de calculer la solution
aussi précisément que l'on souhaite. Nous avons donc, pour les deux racines de
l'équation (12.1),
X1 = 0 + + 2 + ... (12.7)
2
X2 = 1 − − + ... (12.8)
171
12 Calcul des perturbations.
√
1± 1 − 4
X=
2
Un développement de Taylor de cette dernière nous rassure sur l'exactitude des
résultats (12.7,12.8).
Recherche des valeurs propres d'une matrice symétrique. Supposons que nous
connaissons une valeur et un vecteur propre d'une matrices symétrique, c'est à
dire que nous connaissons un scalaires λ0 et un vecteur φ0 tel queAφ0 = λφ0 .
Une matrice symétrique par dénition est égale à sa transposée AT = A. Nous
cherchons la valeur propre proche de λ0 de la matrice A + B . Appelons cette
valeur propre µ.On cherche donc à résoudre
(A + B)ψ = µψ (12.9)
Procédons comme nous l'avons mentionné plus haut. Nous chercherons la solution
sous la forme
Aφ0 = λ 0 φ0 (12.12)
... = ...
La première équation, c'est à dire les terme d'ordre 0 en , ne nous rapporte bien
sûr rien que ne l'on connaisse déjà. Dans l'équation (12.13), nous avons deux
172
12 Calcul des perturbations.
1+ 2
2 2 + 3
173
12 Calcul des perturbations.
˙
θ̈ + ρ ˙ + ω 2 sin θ = θ0 (12.15)
˙
θ̈1 + ρ ˙ 1 + ω 2 θ1 = θ0
˙
θ̈1 + ρ ˙ 1 − ω 2 θ1 = θ0
et cette fois, il est claire que quand t → ∞ , θ1 → ∞ . Le point θ=π est donc
instable.
La solution non perturbée, i.e. pour =0 vaut x = 1. La solution exacte pour
6= 0 s'écrit
√
−1 ± 1 + 4
x=
2
et un petit développement nous montre que les racines sont, pour 1, de la
forme
x1 = 1−
1
x2 = −
174
12 Calcul des perturbations.
Nous avons donc l'apparition d'une nouvelle racine qui est d'autant plus grande
que la perturbation est petite. Cela est un phénomène générale : à chaque fois que
la perturbation est sur un terme d'ordre supérieur, la perturbation est singulière.
Il existe parfois des changements de variable qui rendent la perturbation régulière.
Par exemple, dans l'équation (12.16), en posant x = 1/y , nous avons
y2 − y − = 0
qui peut se traiter par la méthode habituelle. D'après notre traitement de (12.1),
ses solutions sont
y1 = −
y2 = 1+
ẍ + ẋ + 1 = 0
est celle d'un oscillateur harmonique amortie. Si la masse est nulle, la solution
est de la forme x = A exp(−t). Si la masse est non nulle, la solution, à l'ordre
le plus important en , est de la forme A exp(−t) + B exp(−t/) et le lecteur
peut vérier que les deux solutions sont radicalement diérentes. Remarquons
à nouveau que nous pouvons chercher un changement de variable de la forme
t = p t0 et x = q y qui rendrait la perturbation régulière. Nous en laissons le soin
au lecteur intéressé.
L'ennui avec les équations diérentielles est que les termes les plus inoensifs
peuvent rendre les perturbations singulières. Considérons l'exemple de l'oscilla-
teur suivant :
ẍ + ω 2 x + x3 = 0 (12.17)
2 0 4
ceci est l'équation d'un mobile dans un potentiel en kx + k x . La solution
général de l'équation non perturbée est a cos(ωt + φ). Sans perte de généralité,
on supposera φ = 0. Nous cherchons alors la solution de l'équation perturbée
sous forme de x(t) = a cos(ωt) + x1 (t) + ... En injectant dans l'équation et en
collectant les termes d'ordre 1 en , nous trouvons que
Or, cos3 (u) = (1/4) cos(3u)+(3/4) cos(u) et donc la solution de (12.20) est donnée
par la somme de la solution des deux équations suivante :
175
12 Calcul des perturbations.
La perturbation que nous avons considéré plus haut intervient dans pratique-
ment tous les problèmes d'oscillations, et c'est pourquoi il nous semble important
de la traiter. En regardant de plus près l'équation (12.17), nous voyons qu'il n'y
a rien d'anormal ou de divergent. Elle décrit simplement des oscillations au fond
d'un puits peut être un peu plus raide qu'un puits harmonique et il n'y a aucune
raison que quelque chose diverge. L'erreur ne peut venir que de notre traitement.
En supposant que la solution s'écrit sous la forme a cos(ωt) + x1 (t), nous avons
fait l'erreur de penser que le terme d'ordre 0 continue à présenter une oscillation
à fréquence ω. Il n'y a aucune raison pour cela, et la fréquence peut également
être de la forme ω + ω1 + ... La gure (12.1) montre la diérence entre sin(t) et
sin(1.01t) pour les temps inférieurs à vingt et pour les temps autour de 250. Nous
voyons que la diérence est à peine perceptible pour les temps courts, tandis que
les deux fonctions n'ont plus rien à voir aux temps longs. Ce problème avait été
observé d'abord en astronomie, où les calculs perturbatifs des siècles précédents
commençaient à s'écarter des observations (d'où le terme séculaire). Lindstedt
(vers 1880) a remédié à ces carences par sa technique de renormalisation qui est
de chercher la solution sous la forme
ẍ1 +ω 2 x1 −2aωω1 cos[(ω+ω1 )t] = (−a3 /4) cos[3(ω+ω1 )t]−(3a3 /4) cos[(ω+ω1 )t]
176
12 Calcul des perturbations.
0.5
-0.5
-1
0 5 10 15 20 235 240 245 250 255
Figure 12.1 sin(t) (en noir) et sin(1.01t) (en rouge) pour les temps courts et
longs.
3a2
ω1 =
8ω
pour éliminer le terme résonnant. La solution perturbative à l'ordre 1 s'écrit alors :
3a2 3a2
x(t) = a cos[(ω + )t] + A cos[3(ω + )t + α]
8ω 8ω
où les coecients a, A, α sont déterminés à partir des conditions initiales.
Problèmes.
xp0
x0 = x0 − P
nan xn−1
0
3. Soit l'équation
x6 − 4x5 + 3x4 − 6x2 + 6x + 1 = 0 (12.22)
4
Nous remarquons qu'en écrivant par exemple le coecient de x comme
2+ (où = 1), la somme des coecients de l'équation non perturbée
vaut 0. x = 1 est donc une solution de l'équation non perturbée (i.e. pour
= 0). Calculez la correction à cette racine à l'ordre 1 en et comparez à la
4
solution exacte x = 1.10565. Et si au lieu du coecient du x , nous avions
choisit un autre terme, qu'aurait on obtenu ?
177
12 Calcul des perturbations.
Équation trencendante.
Équation intégrale. Nous avons rencontré les équations intégrales lors de notre
discussion des fonctions de Green. Nous allons étudier ci-dessous un schéma ité-
ratif de leurs résolution. Ces schéma là sont extrêmement fragile cependant, et il
faut toujours s'assurer de leur convergence.
Z b
f (x) = g(x) + µ K(x, x0 )f (x0 )dx0
a
Z ∞
f (x) = 1 + λ e−(x+y) f (y)dy
0
Z x
f (x) = 1 + λ f (y)dy
0
Oscillateur de Van der Pol. Van de Pol à proposé l'équation suivante dans les
années 1920 pour modéliser les oscillateurs auto-entretenus comme le battement
de coeur
ẍ + (x2 − 1)ẋ + ω0 x = 0
Le coecient du terme ẋ est équivalent à un frottement. Nous voyons qu'il est
négatif si l'amplitude x est petite (< 1), c'est à dire que le système reçoit de
l'énergie de l'extérieur, ce qui va l'amener à augmenter son amplitude. Par contre
178
12 Calcul des perturbations.
dN/dt = αN − βN P (12.23)
dP/dt = γN P − δP (12.24)
1. Montrez que ce système possède un point xe, c'est à dire des valeurs N0 , P0
pour lesquels dN/dt = dP/dt = 0.
2. Étudiez la solution de ce système pour les faibles écarts au point xe. Cela
veut dire que nous prenons des conditions initiales du genre N (t = 0) =
N0 + et P (0) = P0 . Cherchez la solution sous la forme N (t) = N0 + N1 (t)
et P (t) = P0 + P1 (t), et en collectant les termes d'ordre 1 en , obtenez un
système linéaire pour N1 et P1 . Résolvez ce système et déduisez également
la forme du cycle limite, c'est à dire N1 en fonction de P1 .
179
12 Calcul des perturbations.
4. Vous pouvez également remarquer que le cycle limite peut s'obtenir en divi-
sant directement (12.23) par (12.24) et en résolvant l'équation diérentielle
du premier ordre. Comparez le résultat de ce calcul au résultat de la ques-
tion 2.
Stabilité d'interface. Soit une interface u(x, t) (par exemple entre solide et li-
quide lors de la coulée continue en métalurgie) décrit par l'équation
∂u ∂2u ∂4u
= −au − bu3 + c 2 − d 4
∂t ∂x ∂x
où nous supposons les coecients a, b, d > 0. Discuter la stabilité linéaire de
la solution u(x, t) = 0 selon que c est positif ou négatif et chercher les seuils
d'instabilité.
180
13 Les opérateurs diérentiels.
La plupart des phénomènes physiques sont décrits par des équations dié-
rentielles qui impliquent des opérateurs diérentielles. On rencontre souvent les
gradients, rotationelles, divergences et laplaciens et le fait que l'espace dans le-
quel vivent les physiciens ait trois dimensions a peut-être fovorisé leurs usages au
1
dépend d'autres formulations plus symétriques . Fondamentelement, ce sont des
opérateurs de dérivation et nous allons nous attacher dans ce chapitre à étudier
leurs signications et à établir leurs expression dans divers systèmes de coordo-
nées.
181
13 Les opérateurs diérentiels.
2
les éléments du tenseur métrique . Il est évident que si pour un certain déplace-
ment, nous avons dq2 = dq3 = 0, alors ds = h1 dq1 tout simplement.
x = στ ; y = (τ 2 − σ 2 )/2 ; z = z
√
Démontrez que les éléments du tenseur métrique sont h1 = h2 = σ2 + τ 2 ,
h3 = 1.
et la matrice H dont les éléménts sont les hi,j s'appelle le tenseur métrique. Dans le cas des
coordonnées curvilignes orthogonales, les éléments non-diagonaux sont nulles et ds2 peut s'écrire
sous la forme plus simple de 13.1.
182
13 Les opérateurs diérentiels.
13.3 Le gradient.
Soit la fonction f (P ) qui a chaque point de l'espace associe une quantité. Le
nom savant de cela est un champ scalaire. Cela peut être une densité , un potentiel,
...Nous somme interessé par savoir de combien cette fonction change si on passe
du point P au point voisin P + ds. Le gradient est la quantité physique qui nous
donne cette information :
gradf qu'on note également ∇f est un vecteur dont le produit scalaire avec le
déplacement ds donne la variation de f. Ceci est la dénition du gradient. ∇f à
priori dépend du point P. Notez que jusque là, nous avons exprimé la variation
indépendement du système de coordonnées choisi pour repérer les points de l'es-
pace. Une quantité physique ne doit jamais dépendre du système de coordonnées
et sa dénition doit toujours être donnée de façon intrinsèque, indépendemment
des coordonnées. Quand en mécanique, nous écrivons F = md2 r/dt2 , ceci est une
relation qui est valable quelque soit le système de coordonées. La même chose
s'applique aux opérateurs diérentiels que nous utilisons en physique.
Evidement, une fois que nous avons exprimé les choses de façon intrinsèque, il
faut ensuite faire le boulot et calculer la trajectoire, les lignes du champ, les iso-
potentiels,...Pour cela, nous devons choisir un système de coordonées. Donc, nous
avons besoin d'exprimer ∇f dans un système de coordonnée, celui qui convient le
mieux au problème considéré. Suppons que le point P est repéré par (q1 , q2 , q3 ) et
le point voisin par (q1 + dq1 , q2 , q3 ). Alors df = f (q1 + dq1 , q2 , q3 ) − f (q1 , q2 , q3 ) =
183
13 Les opérateurs diérentiels.
(∇f )1 h1 dq1
184
13 Les opérateurs diérentiels.
2 2
1 1
0 0
−1 −1
−2 −2
−2 −1 0 1 2 −2 −1 0 1 2
(a) (b)
185
13 Les opérateurs diérentiels.
curl f
n
f
C
P
13.5 Le rotationnel.
La distinction entre les gure 13.1a et b saute aux yeux : dans le premier,
les lignes de champs ne se referment pas sur elles mêmes, dans le deuxième,
toutes les lignes se referment sur elle même. Dans le premier, les lignes de champs
sont comme originaire d'une source à l'origine, dans le deuxième au contraire,
aucune source ne saute au yeux à priori. C'est cela que l'opérateur rotationnel,
que l'ont note rot ou parfois ∇× (ou curl dans la littérature anglo-saxonne)
mesure localement. Précisons les choses.
Soit un champ f. Considérons un point P et un circuit innitésimal C autour
de ce point. Si la projection des lignes de champ de
R f sur C se referme, alors
IC = C
f .ds 6= 0. Le rotationnel est l'opérateur qui quantie l'amplitude de
IC . Il y a cependant un petit détail à régler : la direction du circuit C a autant
d'importance que sa taille. Soit An le vecteur porteur du circuit C , A étant l'air
de la surface enclose par C et n le vecteur unitaire perpendiculaire à C , alors
nous dénissons ∇×f telle que
Z
An.∇ × f = f .ds (13.3)
C
3
à l'ordre 1 en A (voir note ). Si vous n'aimez pas le travail avec les éléments
3. Précisons quelques notions sur les approxiamtions. Supposons que nous pouvons approxi-
186
13 Les opérateurs diérentiels.
1
Z
n.∇ × f = lim f .ds (13.4)
A→0 A C
mer une fonction autour d'un point x par son développement de taylor :
0 00
∆ = f (x + h) − f (x) = f (x)h + (1/2)f (x)h2 + ...
0
Quand on dit qu'à l'ordre 1 en h, ∆ vaut f (x)h, cela veut dire que
1 0
lim ∆ = f (x)
h h→0
Concrétement, cela veut dire que nous nous interessons aux très petits h (innitésimaux) et le
premier terme de l'approximation est amplement susant. De façon plus formelle, nous pouvons
écrire
0
∆ = f (x)h + o(h)
où o(h) regroupe tous les termes qui sont négligeable devant h quand h→0 :
1
lim o(h) = 0
h h→0
Si nous avons une idée précise des termes que l'on néglige (comme c'est le cas ici) on peut écrire
0
∆ = f (x)h + O(h2 )
où O(h2 ) veut dire que le plus grand terme que nous avons négligé est au mieux de l'ordre de
h2 :
1
lim O(h2 ) = Cte < ∞
h2 h→0
Pour simplier, par o(h) il faut entendre très petit devant h et par O(h) de l'ordre de h.
Les symboles o et O sont appelés les symboles de Landau, du nom du mathématicien allemand
Edmund Landau (et non du physicien soviétique Lev Landau). Ils permettent une grande rigueur
et concision dans l'écriture des expressions impliquant des limites.
187
13 Les opérateurs diérentiels.
3
B
C
2
A
P 1
et sur la partie BC
−f2 (q2 , q3 + b)h2 (q2 , q3 + b)a
et la somme de ces deux parties nous donne
∂
− [h2 f2 ] ab
∂q3
Par le même mécanisme, l'intégration sur la partie AB et CP nous donne
∂
[h3 f3 ] ab
∂q2
La partie gauche de l'eq.(13.3) est par ailleurs, à l'odre le plus bas en a, b :
h2 h3 ab (rot f )1 , ce qui nous donne, enn,
1 ∂(h3 f3 ) ∂(h2 f2 )
(rot f )1 = − (13.6)
h2 h3 ∂q2 ∂q3
Les autres composantes se trouvent facilement par une permutation circulaire de
(1, 2, 3).
188
13 Les opérateurs diérentiels.
13.6 La divergence.
Le travail d'un comptable est de faire le bilan des sommes dépensées et gagnées
par son entreprise. C'est exactement ce travail qu'eectue l'opérateur divergence.
Considérons une surface innitésimal fermée σ autour du point P : quel est le bilan
du ux d'un champs f à travers cette surface ? C'est ce bilan que la divergence
quantie. Plus exactement,
Z
dV div f = f dσ
σ
La démarche pour calculer la divergence est similaire à ce que nous avons fait
pour le rotationnel. Considérons le ux (sortant) à travers la surface ABCD (les
normales aux surfaces sont par convention orientées sortant ) :
bch2 (q1 + a, q2 , q3 )h3 (q1 + a, q2 , q3 )f1 (q1 + a, q2 , q3 )
et le ux (entrant) à travers la surface P B 0 C 0 D0
−bch2 (q1 , q2 , q3 )h3 (q1 , q2 , q3 )f1 (q1 , q2 , q3 )
Le bilan de ces deux termes nous donne
∂(h2 h3 f1 )
abc
∂q1
4. Le rotationnel dans ce cas est appelé tenseur électromagnétique. Nous réferons le lecteur
à un livre avancé en électromagnétisme pour voir cela en détail.
189
13 Les opérateurs diérentiels.
1 ∂(h2 h3 f1 ) ∂(h3 h1 f2 ) ∂(h1 h2 f3 )
div f = + +
h1 h2 h3 ∂q1 ∂q2 ∂q3
∂ρ
+ divρv = 0
∂t
Ceci est également le sens des équations de Maxwell en electromagnetisme, sauf
que là, on ne considère pas le ux d'un vecteur mais d'un objet un peu plus
complexe qu'on appelle le tenseur électromagnétique.
13.7 Le Laplacien.
Le laplacien dun champ scalaire est déni en terme des autres opérateurs que
nous venons de voir :
∆f = div(gradf )
et d'après ce que nous avons dit, s'exprime simplement en coordonnées curviligne
comme
1 ∂ h2 h3 ∂f ∂ h3 h1 ∂f ∂ h1 h2 ∂f
∆f = + +
h1 h2 h3 ∂q1 h1 ∂q1 ∂q2 h2 ∂q2 ∂q3 h3 ∂q3
190
13 Les opérateurs diérentiels.
1
∆ = (f (x0 + h) + f (x0 − h)) − f (x0 )
2
1 1
= (f (x0 + h) − f (x0 )) + (f (x0 − h) − f (x0 ))
2 2
1 00
= f (x0 )h2 + O(h3 )
2
donc, à un facteur 1/2 près (qui dépend de la dimension de l'espace), l'écart à la
moyenne est donnée par la dérivée seconde multipliée par la distance des points
de voisinage au carré h2 . La généralisation est immédiate. Donnons nous un point
P0 et une sphère de rayon h petit autour de ce point. Calculons la moyenne de
l'écart entre la valeur de la fonction au point P de la sphére et le point P0 . Le
point P est repéré par le vecteur hn, c'est à dire que P = P0 + hn
1
ZZ
∆ = (f (P ) − f (P0 )) dΣ
Σ Σ
1
ZZ
= (gradf ) hndΣ
Σ
Z ZΣZ
h
= div (gradf ) dV
Σ V
hV 3
= div (gradf ) + O(h )
Σ
5
La quantité V /Σ = Ch, où C est un facteur géométrique. A trois dimensions
par exemple, C=1/3. Nous retrouvons donc bien la signication du laplacien de
la moyenne.
191
13 Les opérateurs diérentiels.
Table 13.1 Les opérateurs dierentiels en coordonnées curviligne. Pour les opé-
rateurs vectoriels, seul la composante selon q1 est donnée, les autres
se déduisent par permutation circulaire (1, 2, 3).
Expression application
1 ∂f
R
(gradf )1 = h1 ∂q f (b) − f (a) = C ∇f.ds
h1 i
(rot f )1 = h21h3 ∂(h∂q32f3 ) − ∂(h∂q23f2 )
R R
C
f .ds = S rotf .dn
div f = h1 h12 h3 ∂(h∂q
2 h3 f1 )
+ ∂(h∂q 3 h1 f2 ) ∂(h1 h2 f3 ) R R
+ ∂q3 S
f dn = V divf dV
h 1 2
i
1 ∂ h2 h3 ∂f
∆f = h1 h2 h3 ∂q1 h1 ∂q1 + ...
∂2u
ρ = k∆u
∂t2
En terme de mécanique du point, l'équation ci-dessus est juste la formule mγ =
F : le terme de gauche est l'accélération verticale ; le terme de droite, l'écart à
la moyenne de chaque point par rapport à ses voisins, est la force exercée sur ce
point.
Une des équations très importante de la physique (électrostattique sans charge)
est celle de laplace (d'où le nom de Laplacien)
∆V = 0
Cela veut dire qu'en tout point x, la fonction V (x) est est égale à la moyenne de
son voisinage. Ceci veut dire que soit la fonction est localement linéaire autour
du point P, soit que les variations le long d'une direction sont compensé par des
variation en sens inverse dans d'autres dimension. Prenez par exemple l'image
d'un col en montagne : dans une direction, on monte, dans l'autre direction, on
descend. Cela implique donc qu'une fonction obéissant à cette équation ne peut
pas avoir d'extrémum local nul part à l'intérieur du domaine où cette équation
est valable.
13.8 Résumons.
Il est temps de mettre tous ces expression côte à côte et voir leur ressemblance.
Remarquez, dans la colonne des applications de la table 13.1), la relation entre
la partie droite et gauche de chaque égalité. Dans la partie gauche, nous somme
entrain de calculer quelque chose comme le ux d'un champ sur une courbe
192
13 Les opérateurs diérentiels.
P2 P3
P1 PN−1
B
A
où dΣ est l'hyper surface qui entoure l'hyper volume Σ, est dω est la dérivée
extérieure de ω.
193
13 Les opérateurs diérentiels.
13.9 Problèmes.
1. Démontrer les relations suivantes et surtout, donner leur un sens géométrique
en vous inspirant des dénitions
3. Nous avons déni le Laplacien d'un champ scalaire. Le Laplacien d'un champ
vectoriel est déni par
∆f = grad(divf ) − rot(rotf )
13.10 Notes.
Certaines manipulations impliquant les dqi peuvent paraître approximatif et
sans la rigueur nécessaire. Il n'en est rien. Reprenons par exemple le calcul du
rotationnel avec autant de précision que souhaitable.
Quelques points à éclaircir d'avance. Si nous connaissons la fonction (très lisse,
inniment dérivable) f et ses dérivées au point q = (qi0 ), alors nous pouvons
0 0 0
connaître sa valeur en un point proche, par exemple (q1 + dq1 , q2 , q3 ) :
194
13 Les opérateurs diérentiels.
La dernière ligne a été possible parceque les quantité f (q), ∂1 f (q), ... sont juste
des constantes pour l'intégrale en question : l'intégration se fait sur u! Dans
l'équation13.5, nous avons simplement écrit le premier ordre, le seul qui est per-
tinent quand on prend la limite a, b → 0. Pour vous en persuader, il sut de faire
le calcul à l'odre supérieur.
195
14 Les tenseurs en physique.
Le mot tenseur peut évoquer des objets avec beacoup d'indices et d'exposants
ml
du genre ξijk qui multiplient d'autres objets de ce genre et où il faut se souvenir
que certains varient de façon contravariante et d'autres covariante. En faite, ce
sont des objets très simple qui généralisent les matrices. Le lecteur déjà familier
avec ces derniers n'aura aucun mal à manipuler les tenseurs. Comme on va le voir
par la suite, les tenseurs sont partout en physique et donnent beaucoup de sens
aux diverses formules.
C'est la dénition d'une application linéaire. Comme c'est très simple et très
fondamental, ça ne mange pas de pain de la rappeler. En physique, nous avons
l'habitude d'appeler cela le principe de superposition.
Notre application linéaire dans ce cas était vraiment triviale : prendre le vec-
teur F et le multiplier par un scalaire 1/m. Prenons le cas maintenant d'une onde
électromagnétique qui rentre dans un matériau diélectrique (non métalique). Lo-
calement, le matériau devient polarisé, et le vecteur polarisation P est relié au
champs électrique E par
P = χE (14.2)
196
14 Les tenseurs en physique.
X
Pi = χij Ej (14.3)
j
197
14 Les tenseurs en physique.
Nous reviendrons plus tard à ces règles de maniplation pratique des chires.
Pour l'instant nous allons nous habituer un peu plus à ces concepts. A propos, le
titre de cette section était les tenseurs de rang 2. C'est un terme savant pour
désigner les applications linéaires. Un scalaire est un tenseur de rang 0 (zéro)
et une application linéaire est un tenseur de rang 2 (il faut deux indices pour
énumerer les éléments). A votre avis, qu'est ce qu'un tenseur de rang 1 ?
Prenons maintenant un autre exemple, une fonction vectoriel dans l'espace R3 ,
3
u(x, y, z) = (u1 (x, y, z), u2 (x, y, z), u3 (x, y, z) ) . Si nous connaissons la valeur de
la fonction au point (x0 , y0 , z0 ), la valeur de la fonction au point (x0 + dx, y0 +
dy, z0 + dz) est u(x0 , y0 , z0 ) + du, où
du = D.dr (14.4)
la relation ci-dessus n'est pas autre chose que du = u0 (x0 )dx pour les fonctions
d'une seule variable et le tenseur D généralise la notion de dérivée. Evidément,
nous savons que les composantes de ce tenseur s'écrivent
∂ui
Dij =
∂xj
198
14 Les tenseurs en physique.
importe ce que cela veut dire) est une façon plus concise d'écrire
4 X
X 4
ξij = λijkl ζkl
l=1 k=1
3. le tenseur quadrapolaire
199
14 Les tenseurs en physique.
Un tenseur de rang 3 est une application bi-linéaire qui prend deux vecteurs en
entrée et prdouit un vecteur en sortie : A : E1 × E1 → E2 . l'application A(x, y)
est bilinéaire, c'est à dire linéaire pour chacun de ses arguments :
où λ, µ ∈ R. A nouveau, pour faire des calculs, nous nous donnons une base, et
cette fois, A doit être donné par trois indices aijk (une matrice à trois dimensions
si vous voulez : ligne, colonne,epaisseur). Si z = A(x, y), alors la relation entre
leurs composantes est juste une généralisation des produits matricielles :
zi = aijk xj yk
5. Nous considérons seulement le cas où A est une application linéaire d'un espace vectoriel
de dimension n dans un espace vectoriel de même dimension. La matrice représentant A est
alors carré. La généralisation au cas les espace vectoriel de départ et d'arrivé n'ont pas la même
dimension est triviale et laissé au soin du lecteur.
200
14 Les tenseurs en physique.
Ax = A(xi ei )
= xi Aei linéraité d'une application linéaire
yi = aij xj (14.7)
Ceci est bien sûr la règle selon laquelle il faut multiplier la i-ème ligne de la matrice
par le vecteur colonne x élément par élément pour obtenir la i-ème composante
de y. Notez à nouveau 6 le sens de la variation de l'indice et comparez à la relation
(14.6) : cette fois nous sommes en train de sommer sur le deuxième indice tandis
que dans la relation (14.6), nous sommions sur la première indice. On dit que
les composantes d'un vecteur varient de façon contravariante, c'est à dire dans le
sens contraire à la variation des vecteurs sous l'eet d'une application linéaire. Le
7
mot contraire est mal choisi , puisque il veut simplement dire qu'il faut sommer
sur l'autre indice. C'est malheureusement un mot consacré qu'il faut connaître.
201
14 Les tenseurs en physique.
connaissant ces coecients akij , nous pouvons connaitre l'action de A sur n'im-
porte quel deux vecteurs x,y :
z = A(x, y)
= A(xi ei , yj ej )
= xi yj A(ei , ej )
= akij xi yj ek
Autrement dit,
zk = akij xi yj
Voilà, c'est ce que nous disions sur la généralisation naturelle des matrices. Notez
la concision que la convention de sommation de l'indice répété nous procure.
Commençons par le cas d'un vecteur. Nous connaissons les composantes d'un
vecteur x dans la base {e1 , ..., en }et nous souhaitons obtenir ses composantes dans
la base {f1 , ..., fn }. Evidement, il existe une application linéaire P qui transforme
les vecteurs fi en vecteur ei : P f1 = e1 , P f2 = e2 ,... Par exemple, si nous avons
tourné les axes de la première base de 45 degrès pour obtenir la deuxième base,
l'application P est l'application Rotation de -45 degrès. Notez que c'est l'appli-
cation qui transforme la deuxième base en première ; pour plus de clarté, on le
note parfois P2→1 . Pour avoir la représentation matricielle de P dans la base {fi },
il sut, comme nous l'avons dit plus haut (relation 14.5), d'écrire les vecteurs ei
comme des combinaisons linéaires des vecteurs fi :
ei = pji fj
202
14 Les tenseurs en physique.
x = xi ei
= xi pji fi
Si nous désignons par x0i les composantes du vecteur dans la nouvelle base, nous
avons
x0i = pij xj (14.8)
Vous avez peut être remarqué la beauté de la relation ci-dessus : les composantes
du vecteur x dans la deuxième base {f } sont égaux aux composantes du vecteur
Px dans la première base {e} ! Revenons à l'exemple de la base {f } obtenue par
une rotation de +45 degrès de la base {e} ; les composantes d'un vecteur x dans
cette nouvelle base sont égaux aux composantes du ce vecteur, tourné de -45
degrès, dans l'ancienne base. En faite, voilà l'origine du mot contravariant.
Continuons par un tenseur de rang 2. Nous connaissons les éléments aij d'un
tenseur A dans une base {e}, et nous souhaitons les exprimer dans la base {f }
en nous aidant de l'application de passage P = P2→1 . Cette fois, nous avons
également besoin de l'application inverse Q = P −1 :
fi = qji ej
Afi = Aqji ej
= qji Aej
= qji akj ek
= qji akj plk fl
203
14 Les tenseurs en physique.
Régle de sommation. Une expression qui contient des indices répétés représente
une somme si un des indices est en haut et l'autre en bas.
C'est une régle gramatical au même titre que les parenthèse : une expression
bien formée contient le même nombre de parenthèse ouvertes que fermées. De
même pour les indices répétés, l'expression xi yi est correctement formé et veut
1 2 3 i j ij
dire x y1 + x y2 + x y3 + ... L'expression gij x y est bien formée, ainsi que g xi yj
j i i i j
et gi xj y . Par contre, gj xj y ou gij xi y sont gramaticalement incorrect, au même
titre que les expressions du genre (a + b))c + d( ou (a + (b + (c). Par convention,
tout ce qui a un indice en bas est appelé covariant ; un indice en haut représente
une quantité contravariante.
Donnons nous maintenant une base (e1 , e2 , ...) dans un espace vectoriel E .
N'importe quel vecteur x s'écrit comme une combinaison linéaire des éléments de
la base, ce qui, avec notre nouvelle convention de sommation, donne :
x = xi ei
Si vous vous souvenez, nous avions souligné que les composantes varient dans le
sens contraire des vecteurs lors d'un changement de base, cette notation met cela
clairement en évidence.
Nous rentrons maintenant dans le vif du sujet. A l'espace E, nous associons
un espace dual E ∗ des formes lineaires. Cet espace représente, si vous voulez,
l'autre coté du mirroir. Par forme linéaire, il faut entendre l'espace de toutes les
fonctions f E , produisent un scalaire, et font cela de
qui prennent un élément de
façon linaire :f : E → R,f (λe1 + µe2 ) = λf (e1 ) + µf (e2 ). E ∗ ressemble à E :
∗
c'est également un espace vectoriel (af + bg , où a, b ∈ Ret f, g ∈ E a exactement
∗
le sens qu'on lui donne) et de plus, E a la même dimension que E . (cf exercice
∗
plus bas). E est l'espace des vecteurs contravariants comme nous allons le voir,
mais retenez l'image du mirroir : quand vous tournez vers la gauche, votre image
dans le mirroir tourne vers la droite.
204
14 Les tenseurs en physique.
Revenons à notre espace E. Vous avez vu (cf 2.1) que nous pouvons le munir
d'un produit scalaire <, >, c'est à dire une application bilinéaire qui a deux vec-
teur de E associe un scalaire. Si nous nous donnons une base (e1 , e2 , ...) et que
nous connaissons le produit scalaire de chaque couple d'entre eux < ei , ej >= gij ,
alors nous pouvons écrire le produit scalaire de n'importe quel deux vecteurs
hx, yi = gij xi y j
où xi et y j sont les composantes des deux vecteurs. N'oublions pas que le produit
scalaire doit être déni positif, c'est à direhx, xi > 0 si x 6= 0. Cela impose
gij que nous verrons plus tard.
certaines contraintes sur les valeurs
Considérons maintenant l'objet fv = hv, .i, où v ∈ E . Ceci est bien une forme
∗
linéaire appartenant à E , puisque si u ∈ E , alors fv (u) = hv, ui ∈ R.
Note sur le produit tensoriel de deux espaces vectoriel, tenseur d'elasticité qui
relie deux tenseurs,...
Indice haut, bas, la reduction, monter ou descendre un indice : essentiellement
en relation avec la relativité et le produit scalaire de minkowski.
espace dual
exercice : démontrer que E ∗ est un espace vectoriel de même dimension
une base dans l'esapce dual sans faire référence au produit scalaire.
produit scalaire généralisé < x, y >= gij xi y j
205
15 Équation à dérivée partielle du
premier ordre.
Le monde des équations à dérivée partielle est vaste, est des centaines de livres,
souvent extrêmement pédagogiques, leur sont consacrées. Les EDP les plus utili-
sées en physique sont de second ordre pour l'espace, et de premier ou de second
ordre pour le temps. Ce sont les équations de la chaleur, de Laplace et de Poisson,
et l'équation d'onde. Nous n'allons traiter aucun de cela, même si la plus part
des méthodes développées plus haut y sont extrêmement utiles.
Les EDP linéaires de premier ordre sont par contre exactement soluble par la
méthode des caractéristiques, au moins en théorie. Il est utile d'en donner un bref
aperçu.
(∂t u + P (s)∂s u)f (s)g 0 (u) + (P (s)f 0 (s) − Q(s)f (s))g(u) = 0. (15.4)
∂t u + P (s)∂s u = 0 (15.6)
206
15 Équation à dérivée partielle du premier ordre.
Z +∞
φ(s, t) = eisx p(x, t)dx
−∞
avec la CI
φ(s, 0) = eisx0 (15.10)
L'équation (15.9) est une EDP de premier ordre similaire à (15.1), avec P (s) =
ks Q(s) = −Ds2 . Nous avons
et alors A(s) = −Ds2 /2k et W (s) = log(s)/k . Les
fonctions f ,u et φ s'écrivent :
Nous pouvons vérier par dérivation directe que l'expression (15.13) est bien
solution de (15.9). Il nous reste à utiliser la CI (15.10) pour trouver g, ce qui
donne :
g(s) = exp(Ds2 /2k + iux0 )
et la solution complète s'écrit :
−Ds2
φ(s, t) = exp (1 − e−2kt ) + isx0 e−kt
2k
207
15 Équation à dérivée partielle du premier ordre.
∂φ
Z
<X> = xp(x)dx = −i
|s=0
∂s
∂2φ
Z
< X2 > = x2 p(x)dx = − 2 |s=0
∂s
Problème 1. Calculer, pour le processus d'Ornstein, < X(t) >et V ar(X(t)) =<
X 2 (t) > − < X(t) >2 (C'est pour vous faire la main).
Calculer < n(t) >et V ar(n(t)). La condition initiale est p(n, 0) = δn,n0 .
avec la condition initiale p(n, 0) = δn,n0 . p(n, t) est la probabilité pour la popu-
lation, à l'instant t, n.
d'avoir la taille
Pour résoudre l'éq.(15.14), vous avez plus intérêt à utiliser la transformée de
Laplace :
X
φ(s, t) = p(n, t)e−ns
n
208
15 Équation à dérivée partielle du premier ordre.
Nous pouvons représenter la solution φ(s, t) comme une surface : φ(s, t) étant la
hauteur à la position (s, t). Si nous pouvions connaître les courbes de niveau de
cette surface, nous aurions déjà une très bonne connaissance de la solution (voir
gure 15.1). Quand on parcours une courbe de niveau, la valeur de la fonction φ
y reste constante. Supposons maintenant que nous sommes à une position (s, t).
Comment se déplacer d'une quantité (ds, dt) pour que la valeur de la fonction φ
reste constante ? Quelle doit être le rapport entre le déplacement dans la direction
ds et le déplacement dans la direction dt pour ne pas changer d'altitude ? Noter
que se donner une relation entre ds et dt en tout point déni une courbe dans
le plan (s, t). Par exemple, dy/dx = −x/y déni l'équation d'un cercle de centre
origine ; le rayon de ce cercle est donné par une condition initiale.
La variation de φ en fonction de (ds, dt) est
Exemple. L'équation t∂s φ − s∂t φ = 0 : les courbes de niveaux sont données par
sds + tdt = 0, autrement dit par s2 + t2 = C . Ce sont des cercles centrés
sur l'origine.
Appliquons cela à l'équation plus simple que nous avions traité au début de ce
chapitre :
∂t φ + P (s)∂s φ = 0 (15.17)
ds dt
=
P (s) 1
W (s) − t = C
209
15 Équation à dérivée partielle du premier ordre.
La surface φ(s, t)
φ
2
0
1
0.8
0.6
1
0.4 0.9
0.2 0.8
0 0.7
0.6
−0.2 0.5
−0.4
−0.6 0.3
0.4
Les courbes de niveau
−0.8 0.2
0.1
La condition initiale −1 0
φ(s, 0) = I(s) s
t
Figure 15.1 Construction d'une solution : nous trouvons d'abord les courbes
de niveau dans le plan (t, s). Ensuite, en utilisant la condition
initiale φ(s, 0) = I(s), on précise la hauteur de la surface de φ sur
chacune des courbes et on reconstruit la solution φ(s, t).
La fonction g doit être trouvé en utilisant les conditions aux bords. Ceci est le
sens de la recette de résolution que nous avions donné au début de ce chapitre,
dans le cas simple où le second membre est nul.
Très bien, nous connaissons les courbes de niveaux. Mais pour vraiment connaître
φ, il faut connaître la valeur de cette fonction sur chaque courbe. Comment dé-
terminer cela ? Évidement, à l'aide des conditions initiales. Si par exemple, on
se donne φ(s, 0) = I(s), nous connaissons alors la valeur de φ sur la courbe de
niveau qui passe par (s, 0) (voir gure 15.1). Autrement dit, en transportant les
hauteurs φ(s, 0) le long des courbes de niveau, on reconstruit la surface φ(s, t).
Ceci est le sens de la détermination de la fonction g(u) par les conditions initiales
dans la section précédente. Nous avons donc la méthode générale de la résolution
d'une EDP de premier ordre.
φ(x, t) = f (x + ct)
210
15 Équation à dérivée partielle du premier ordre.
(c∂x − ∂t )(c∂x + ∂t )φ = 0
15.3 Généralisation.
A partir de là, nous pouvons généraliser notre analyse à l'équation
avec les conditions initiales φ(s, 0) = I(s). Les courbes caractéristiques données
par (15.16) ne sont plus des courbes de niveau, mais la variation de φ le long
des courbes est donnée par une équation diérentielle ordinaire. Supposons que
la solution de ds/P = dt/R soit donnée par s = f (t, s0 ) 1 , c'est à dire ds/dt =
0
f (t, s0 ) = P/R. Quand on se déplace le long d'une courbe caractéristique s =
f (t, s0 ), la variation de φ est
dφ = ds∂s φ + dt∂t φ
= (P ∂s φ + R∂t φ)(dt/R)
= (Q/R)dt
dφ Q(s, t, φ)
= (15.18)
dt R(s, t)
La stratégie pour trouver la solution est une modication de ce que nous avons
dit précédemment :
211
15 Équation à dérivée partielle du premier ordre.
Les courbes caractéristiques sont ds/1 = dt/P (t). Si nous appelons W (t) une
primitive de 1/P (t), W est connue, puisque P l'est ) les courbes ca-
( la fonction
ractéristiques sont données par W (t)−s = W (0)−s0 . Le long de ces courbes, nous
choisissons s comme variable indépendante ( nous avons le choix du paramétrage,
) et donc, le long de ces courbes,
dφ Q(t)
= φ
dt P (t)
Si nous appelons A(t) une primitive de Q/P , alors la solution générale de l'équa-
tion ci-dessus est
φ(t) = C. exp(A(t)).
Toutes les courbes passant par t (quelque soit leur ordonnée s) ont la forme
ci-dessus. Vous pouvez voir cela comme le croisement entre la surface φet le
plan t. La caractéristique passant par le point (s, t) passe par le point (s0 , 0) où
s0 = W (t) − s − W (0). La solution complète de l'équation s'écrit donc comme
212
16 Les formes diérentielles et la
dérivation extérieure.
16.1 Introduction.
L'analyse des fonctions d'une seule variable est simple : nous savons prendre
la dérivée première, seconde, ... et cela a un sens direct (pente, courbure,...).
Quand on aborde les fonctions de plusieurs variables, les choses commencent à se
compliquer. Les opérateurs diérentielles prennent alors des noms étrange comme
gradient, divergence, rotationnel,... Et nous découvrons qu'il existe des relations
entre ces êtres : prendre la circulation le long d'une courbe fermée revient à
calculer le ux d'un rotationnel à travers la surface engendré par cette courbe ;
calculer le ux à travers une surface fermée revient à prendre l'integrale de la
divergence dans le volume,... Si vous êtes très versé dans la manipulation de ces
objets, vous savez peut-être ce que vaut grad(divf ) par coeur !
Tout cela n'est pas très joli. D'abord, nous avons de la peine à distinguer la
signication de tous ces opérateurs et des relations qui existent entre elle ; ensuite,
cette analyse vectorielle ne marche qu'à trois dimensions
1
; Enn, les équations
mathématiques deviennent confus : pourquoi la dérivée temporelle du champ
magnétique devrait être lié au rotationnel du champ électrique ? On sent bien
qu'il y a des arguments de géométrie derrière, mais quoi exactement ?
A partir du début du vingtième siècle, des mathématiciens comme Poincarré
et Cartan ont réalisé que derrière tous ce chaos, il y avait de l'ordre, exactement
comme la découverte de l'existence des atomes a donné un sens à la chimie. Les
atomes en question ici s'appellent des formes diérentielles, et nous allons les étu-
dier plus en détails. Disons simplement que toutes ces relations entre operateurs
ne sont en faite que des généralisations du Théorème Fondamentale de l'analyse :
Z b
F 0 (x)dx = F (b) − F (a)
a
1. Et cela par un malentendu qui fait correspondre un vecteur aux produit vectoriel dans le
cas des espaces à trois dimensions.
213
16 Les formes diérentielles et la dérivation extérieure.
Nous appelerons cette 1-forme dx. Ici, dx n'a rien d'innitésimal, sa représentation
est le vecteur ligne (1, 0, 0). De la même façon, nous dénissons les 1-formes dy
et dz . Ainsi, dy(ax ex + ay ey + az ez ) = ay .
4
Un exemple de 1-forme est la force f en mécanique . Quand sous l'action de
cette force, un point matériel bouge du point P1 au point P2 , le travail (qui un
214
16 Les formes diérentielles et la dérivation extérieure.
6
très bonne représentation est les lignes de ux.
Ainsi, l'action d'une 1-forme sur un vecteur est
5 le nombre de ligne que ce vecteur coupe. Ici,
nous avons ainsi représenté . Le lecteur est déjà
4 familier avec cette représentation comme courbes
de niveau pour certaines 1-formes. Pour ces
3 formes là, ceci est une bonne représentation du
gradient, comme nous le verrons plus bas. De
2
façon générale, nous pouvons, dans un espace
à dimensions, représenter les 1-formes par des
1
1 2 3 4 5 6
hyper surfaces.
6. Il existe une dierence entre un vecteur abstrait, c'est à dire un objet appartenant à un
espace vectoriel, et un vecteur géométrique reliant deux points P1 et P2 . Les deux concepts sont
fortement connecté, mais diérent.
215
16 Les formes diérentielles et la dérivation extérieure.
N
−−−−→
Z X
ω = lim ω(Pi Pi+1 )
C N →∞
i=0
En clair, nous appliquons le 1-forme à tous les petits vecteurs dont l'union
constitue le chemin. Remarquez que nous avons transféré, pour l'intégration ici
le poids du petit des formes aux vecteurs.
Ceci dit, comment faire l'intégration concrétement ? Soit la formeω = f (x, y)dx+
g(x, y)dy C . Nous pouvons donner l'équation de la courbe sous forme
et le chemin
paramétrique x = x(t) et y = y(t) pour t ∈ [a, b]. Nous avons alors, selon les opé-
7 0 0
rations classiques de l'analyse , dx = x (t)dt et dy = y (t)dt. Nous avons alors
Z Z b
f (x, y)dx + g(x, y)dy = {f (x, y)x0 (t) + g(x, y)y 0 (t)} dt
C a
Z Z π/2
− sin2 (t) + cos2 (t) dt
ω= = 0
C 0
Z
f .ds
C
216
16 Les formes diérentielles et la dérivation extérieure.
~e ∧ ~e = 0
~e1 ∧ ~e2 = −~e2 ∧ ~e1
217
16 Les formes diérentielles et la dérivation extérieure.
Le calcul eective se fait via une paramétrisation de D. Par exemple, une deux
formes dans l'espace à 3d peut être représenté par
∂a ∂a
dx = du + dv
∂u ∂v
el l'élément dxdy par exemple devient
∂a ∂a ∂b ∂b
dxdy = du + dv du + dv
∂u ∂v ∂u ∂v
Or, comme dudu = dvdv = 0 dudv = −dvdu, nous trouvons
et simplement
∂a ∂b ∂a ∂b
dxdy = − dudv
∂u ∂v ∂v ∂u
et ainsi pour les autres éléments. La parenthèse représente bien sûr ce que nous
appelons un Jacobien, c'est à dire le determinant de la matrice des dérivées.
Quand vous passez des vecteurs e1 , e2 aux vecteurs f1 , f2 par une transformation
linéaire A, le déterminant de A est le scalaire qui relie les surfaces portées par les
deux jeux de vecteurs. Ceci est la dénition du déterminant, indépendement de la
base choisie pour exprimer la matrice de A. Le Jacobien apparait ici puisque nous
sommes passé des dx,dy ,dz aux du,dv par une transformation linéaire donnée par
la matrice des dérivées.
218
16 Les formes diérentielles et la dérivation extérieure.
Nous voyons donc que dω représente ce qu'en général nous appelons un gradient
et notons ∇f . Mais le gradient n'est pas un vecteur, c'est une 1-forme.
219
16 Les formes diérentielles et la dérivation extérieure.
220
16 Les formes diérentielles et la dérivation extérieure.
à la limite quand les deux vecteurs → 0. La technique que nous avons donné
plus haut calcule explicitement la deux-forme. Voyons cela de plus près. Prenons
pour simplier la 1-forme ω = f (x, y)dx + g(x, y)dy et posons ~a = (2h, 0)T et
~b = (0, 2k) . Si (x, y) sont les coordonnées du point P , les coordonnées du milieu
T
−−−→ −−−→
ω(P1 P2 ) + ω(P3 P4 ) = (f (x, y − k) − f (x, y + k)) (2h)
∂f
= − (4hk)
∂y
En calculant l'application de ω aux deux autres vecteurs restants, nous trouvons
nalement que
∂g ∂f
Z
ω= − (4hk)
C ∂x ∂y
Ce qui est exactement ce que produit la 2-forme ~a ∧ ~b. dω appliquée à
Cette construction se généralise aisément à la dérivation des n−formes. Pour la
dérivation d'une 2-forme ω par exemples, nous nous donnons trois petit vecteurs
autours d'un point P , et calculons la somme I de l'application de la 2-forme à
toutes ces surfaces (correctement orientées). Il existe une 3-forme qui, appliquée
au tri-vecteur en question, produit le même nombre et correspond bien sûr à
notre dω .
Lemme de Poincarré.
Ce lemme est quelque chose de tellement évident qui n'a pas mérité le nom de
théorème ; ceci dit, nous l'utilisons constemment dans divers contexte en lui don-
nant des noms diérents (par exemple les deux premieres équations de Maxwell).
Le voici :
d(dω) = 0
Dériver deux fois une k−forme produit la (k + 2)−forme nulle ! Prenons par
exemple une 0-forme dans l'espace à 2 dimensions f (x, y) et dérivons là deux
221
16 Les formes diérentielles et la dérivation extérieure.
fois :
∂f ∂f
df = dx + dy
∂x ∂y
∂2f ∂2f
d2 f = − + dxdy = 0
∂y∂x ∂x∂y
Ceci a un caractère très général : quelque soit la forme que vous prenez, en la
dérivant deux fois, vous tombez sur des expressions ou nous avons des dérivées
secondes croisées qui apparaissent deux fois avec des signes opposées.
Si par ailleurs, le lecteur a bien compris la signication géométrique de la
dérivation extérieure, il n'aura pas de mal à démontrer le lemme de façon générale,
sans faire appel aux coordonnées.
Exercice.
∇ × (∇f ) = 0
div(∇ × u) = 0
Changement de variable.
Une des beauté des formes diérentielles est la facilité qu'elles ont à gérer les
changements de variable, de façon presque automatique. Prenons par exemple la
forme ω = dxdy en coordonnées cartésiennes à 2 dimensions qui nous serre à
mesurer l'air d'une courbe fermée. En coodonnées polaire nous avons
x = r cos θ ; y = r sin θ
dx = cos θdr − r sin θdθ ; dy = sin θdr + r cos θdθ
η = (1/2)r2 dθ
222
16 Les formes diérentielles et la dérivation extérieure.
ω1 ω2 = (−1)deg(ω1 ) ω2 ω1
Exercice
1. ~ × B)
div(A ~ = div(A)
~ B~ − A.div(
~ ~
B)
Nous avons pris la peine de séparer les diérentes contributions selon les conven-
10
tions usuelles . Par exemple, la 1-forme qui multiplie dt
~ = −−
E
−→ ~
∇V − ∂t A
10. En donnant les indices 0 à 3 à nos coordonnées, nous avons simpement quelque chose du
genre
dA = (∂xi Aj − ∂xj Ai ) dxi dxj
où nous sommes données quelques conventions pour ordonner correctement les paires (i, j) et
sommer les indices répétés.
223
16 Les formes diérentielles et la dérivation extérieure.
Bx = −∂z A2 + ∂y A3 ; ...
~ =∇×A
B ~
Séparer ainsi les coordonnées temporelles et spatiales nous oblige à alourdir inuti-
lement nos notations, et pire, nous aveugler devant des évidences. Par le lemme
de Poincarré, nous avons
d2 A = 0
En séparant péniblement les divers coordonnées, nous obtenons ce que l'on appelle
les deux premières équations de Maxwell.
Voyons cela de plus près. Dans la dérivation de dA, nous voyons que seul les
termes de la 2-forme B produisent des 3-formes en dxdydz , ce que nous écrivons,
en notation vectoriel, par
~
divB =0
En regoupant maintenant les autres termes en par exemple dxdydt, ..., nous
trouvons trois autres identités que l'on écrit, en notation vectorielle, par
~ = −∂t B
∇×E ~
Un peu plus de travail sur les formes diérentielles nous montrerai que les deux
autres équations de Maxwell s'écrivent comme
d(∗dA) = µ0 (∗J)
où ∗ est appelé l'opération de Hodge (nous verrons le sens géométrique plus bas)
et J est la 1-forme courant :J = −ρdt + j1 dx + j2 dy + j3 dz .
224
16 Les formes diérentielles et la dérivation extérieure.
Ceci est en faite une forme particulière du théorème de Stockes. Donnons nous un
11
domaine S de dimension p dans un espace de dimension n. Une sphére pleine
( le point P de coordonnées (x, y, z) apprtient à la sphère de rayon R centré sur
2 2 2 2
l'origine si x + y + z < R ) est par exemple un domaine de dimension trois
2 2 2
dans un espace de dimension 3. La boule (z = 0, x + y < R ) est un domaine de
dimension 2 dans un espace de dimension 3. Notons par ∂S la frontière du domaine
S . La coque x2 +y 2 +z 2 = R2 du premier exemple et le cercle z = 0, x2 +y 2 = R2
du deuxième exemple sont les frontières de leurs domaines. Le théorème de Stockes
s'écrit Z Z
ω= dω (16.6)
∂S S
où ω est une (p − 1)-formes. C'est pour cela par exemple que l'intégrale d'une
fonction (une 1-forme) le long d'une courbe fermée est égale à l'intégrale de la
rotationnelle de cette fonction (la 2−forme dérivée) à travers la surface délimité
par cette courbe. En réalité, c'est ce théorème que les physiciens appelle théorème
de Stockes Z Z
rotf .ds = f .dl (16.7)
S ∂S
Mais nous n'avons pas à nous limiter là. Le ux d'un champ de vecteur à travers
une surface S (une 2−forme ) égale à l'intégrale de la divergence de ce champ (la
3−forme dérivée) dans le domaine D délimité par la surface. En physique, nous
écrivons cela comme Z Z
f .ds = divf dV (16.8)
S D
Enn, nous avons appris que si une fonction est le gradient d'une autre, alors son
intégrale le long d'un chemin reliant les point A et B ne dépend pas du chemin :
Z
gradf.dl = f (B) − f (A) (16.9)
C
Comme vous le constatez, ces grad,rot et div théorèmes ne sont que des applica-
tions du thèorème de Stockes aux 1,2 et 3 formes dans un espace de dimension
3.
225
16 Les formes diérentielles et la dérivation extérieure.
= ω1 ω2 − (−1)deg(ω1 ) ω1 (dω2 )
∂S S
f˜ = (f1 , f2 , ...fn )
= f1 dx1 + ...fn dxn
où tout simplement, nous avons f i = fi . Nous avons fait cela de façon intuitive
sans trop nous arrêter au détail. Une fois établi cette association, nous pouvons
établir l'association entre les k−vecteur et les k−formes en utilisant simplement
les règles de manipulation du produit extériure.
Comment généraliser cela à un système de coordonnées non-cartésien ? Nous
pouvons faire cela de façon fastidieuse en passant par un système cartésien, mais
nous pouvons faire cela de façon beaucoup plus élégante et rapide en comprenant
ce que la géométrie signie vraiment.
226
16 Les formes diérentielles et la dérivation extérieure.
et donc
Par exemple, le vecteur xux + yuy s'écrit rur en coordonnées polaire, tandis que
−yux + xuy s'écrit ruθ . Pour la 1-forme associée, nous avons en coordonnées
cartésiennes
f˜ = f1 dx + f2 dy
où f 1 = f1 et f 2 = f2 . D'après ce que nous savons sur les changement de variable,
nous savons que en coordonnées polaire,
fr = fr
fθ = rf θ
X
d`2 = gij hi hj
i,j
Les coecients gij forment les éléments d'un objet qu'on appelle le tenseur mé-
trique. En général, nous utilisons des coordonnées orthogonales, où les éléments
gij sont nuls si i 6= j . Dans ce cas, nous pouvons poser gii = gi2 et dénir
X
d`2 = (gi hi )2
i
227
16 Les formes diérentielles et la dérivation extérieure.
n
X
u.v = gii ui v i
i=1
où les coecients gii dépendent du point P auxquels les deux vecteurs sont at-
tachés.
Probablement, la chose la plus troublante pour le lecteur qui n'a pas déjà vu un
cours de géométrie est le fait qu'un vecteur soit associé à un point. Ceci provient
du fait que la plupart du temps, un espace plat muni de coordonnées cartésiennes
14
ont été utilisé où gii = 1. Nous pouvons alors établir très facilement une équi-
valence entre les vecteurs associés à diérents points et libérer les vecteurs de
leurs points d'attache. En général, ceci n'est pas le cas.
Si nous avons un produit scalaire entre deux vecteurs, nous nous donnons
automatiquement une distance entre deux points :
228
16 Les formes diérentielles et la dérivation extérieure.
Nous pouvons bien sûr utiliser des vecteurs ~ui unitaire. Dans le système de coor-
données orthogonales (x1 , x2 , ...xn ), nous avons
. Par exemple, en coordonnées polaire, le vecteur unitaire ~uθ au point (r, θ) s'écrit
(0, 1/r).
Retour sur les formes diérentielles. Nous pouvons maintenant donner un sens
plus précis aux formes diérentielles. Commençons par un 0-forme, c'est à dire
une fonction f (P ) qui à chaque point de l'espace, associe un scalaire. Prenons un
point inniment voisin P 0 = P + v où est un scalaire et v un vecteur. Nous
dénissons la 1−forme df au point P par
1
df (u) = lim (f (P + u) − f (P )) (16.13)
→0
dxi (~ei ) = 1
De même, si ~ui est le vecteur unitaire dans la direction i, alors dxi (~ui ) = 1/gi
d'après notre relation (16.12).
En général, nous travaillons toujours avec une base orthonormale pour représenter
le vecteur f (voir l'exemple du début de cette section). Supposons que dans cette
base orthonormale, nous ayons
fi = gi f i
f i = g i fi
229
16 Les formes diérentielles et la dérivation extérieure.
Dans l'exemple du début, nous avions trouvé la relation entre vecteur et forme
en coordonnées par le passage par les coordonnées cartésiennes. Nous aurions pu
remarquer simplement que la distance entre deux points (r, θ) et (r + h, θ + τ ) et
d`2 = h2 + r2 τ 2
et donc grr = 1, gθθ = r2 , donc fr = gr f r = f r et fθ = gθ f θ = rf θ .
∂f
(∇f )i = g i
∂xi
Par exemple, en coordonnées polaire, le gradient s'écrit
∂f 1 ∂f
∇f = ur + uθ
∂r r ∂θ
f˜ =
X
gi f i dxi
et donc
3
∂(gj f j ) ∂(gi f i )
df˜ =
X
− dxi dxj
i=1
∂xj ∂xi
où nous avons posé j = i+1 pour décrire correctement une permutation circulaire.
A la 2-forme df˜, nous associons le bi-vecteurξ
3
∂(gj f j ) ∂(gi f i )
X 1
ξ= − ~u1 ∧ ~u2
gg
i=1 i j
∂xj ∂xi
∂(gj f j ) ∂(gi f i )
1
∇×f = − ~uk
gi gj ∂xj ∂xi
où k = i + 2(mod)3.
230
16 Les formes diérentielles et la dérivation extérieure.
φ = dx1 ...dxn
Insistons à nouveau : cette n−forme est un objet intrinsèque ; dans une autre
base, elle s'écrirait autrement. Une fois qu'on la xe, on xe en réalité la géometrie
15
de notre espace . En coordonnées orthogonale généralisés, nous avons
φ = gdx1 ...dxn
g = g1 g2 ...gn
L'opérateur de Hodge ? associe (de façon unique) à une k−forme ω = dx1 ...dxk
une (n − k)−forme ?ω telle que
ω(∗ω) = φ
15. Se donner la n−forme volume ou se donner un produit scalaire sont équivalent
231
16 Les formes diérentielles et la dérivation extérieure.
Nous avons pas mal utilisé cet opérateur sans lui donner un nom. Prenons l'espace
à n=3 muni de coordonnées cartésiens où g = 1. Alors, par exemple,
∗dx = dydz
∗dy = dzdx
∗dz = dxdy
i i
Nous voyons alors que dx (∗dx ) = 1dxdydz pour i = 1, 2, 3. La seule petite
complication est de bien gérer le signe, c'est à dire le degrès de permutation que
cela nous impose. Prenons maintenant une fonction f (x, y, z), c'est à dire une
0−forme. Nous avons alors
∂f ∂f ∂f
df = dx + dy + dz
∂x ∂y ∂z
∂f ∂f ∂f
∗df = dydz + dzdx + dxdy
∂x ∂y ∂z
2
∂2f ∂2f
∂ f
d(∗df ) = + + dxdydz
∂x2 ∂y 2 ∂z 2
Et nous voyons que d(∗df ) nous donne bien le Laplacien sous forme d'une 3-
forme. Comme nous connaissons les changements de variable et les associations
forme-vecteur, nous pouvons écrire le Laplacien dans n'importe quelle système
de coordonnées.
Nous n'avons bien sûr par à nous restreindre aux 0−forme et nous pouvons
ainsi généraliser le Laplacien d'un champ de k−forme. L'exemple fondamental
est encore l'électromagnétisme, où l'action et le Lagrangien du champ A sont
donnés par Z
S= {dA(∗dA) + A(∗ρ)} (16.15)
V
où ρ est la 1−forme décrivant la distribution des charges (voir ci-dessous). Une
variation sur A nous donne alors simplement
d(∗A) = ∗ρ
ce qui constitue les deux dernières équations de Maxwell (voir exercice).
Vous rencontrez cette équation partout en physique, sous des formes diverses
et variées. Elle dit simplement que la variation de quelque chose dans un vo-
lume égale la quantité de ce quelque chose qui entre dans ce volume moins la
232
16 Les formes diérentielles et la dérivation extérieure.
quantité de ce quelque chose qui en sort. Le quelque chose peut être la concen-
tration d'une substance, l'énergie emmagasinée dans le volume, une probabilité
de présence, ...
16
Les systèmes qui obéissent à cette loi sont dits conservatif s. La
quantité entrante moins la quantité sortante se dit ux. Notons par ρ le quelque
chose et par J son ux. Appliquée à un volume innitésimal dxdydz , l'équation
de conservation s'écrit
∂ρ/∂t + divJ = 0 (16.16)
dω = 0
Problèmes et exercices.
Périmétre et surface. Soit A l'aire enformé par une courbe C. Démontrer que
nous avons Z
A = (1/2) xdy − ydx
C
16. Le quelque chose peut être l'argent d'une entreprise, et les comptables sont responsable,
sur leur denier personnel, de faire respecter cette loi. L'étudiant en physique perd au plus
quelques points à l'examen.
17. Cela se démontre facilement en physique statistique et s'appelle la réponse linéaire.
18. Le signe - vient de notre convention de compter en négatif le ux entrant. Cela paraît
aussi arbitraire que la charge de l'électron. Historiquement, cela vient du fait que la surface est
orientée pour que la normale pointe vers l'extérieurs.
233
16 Les formes diérentielles et la dérivation extérieure.
En déduire que l'air d'un ellispe est πab, où a et b sont les axes majeur et mineur.
Comment cette expression est reliée à l'expression habituelle
Z b
A= f (x)dx
a
Air d'une courbe fermée. Nous souhaitons calculer l'air enfermée par une
courbe C donnée en coordonnées polaire par l'équation
N
X
r(θ) = an cos(nθ)
n=0
R 2π
1. Démontrer que
0
cos2 (nθ)dθ = π si n 6= 0 1.5
R 2π2π si n =
et 0. De même, démontrer que 1.0
0
cos(nθ) cos(mθ)dθ = 0 si m 6= n. 0.5
2. Démontrer que la 2-forme diérentielle ω = dxdy -1.5 -1.0 -0.5 0.5 1.0 1.5
η = (1/2)(xdy − ydx).
-0.5
dérive de la 1-forme
-1.0
polaires.
1
(xdydz + ydzdx + zdxdy)
3
en déduire le volume d'une sphère, d'une ellipsoide de révolution et d'une ellip-
soide générale.
234
16 Les formes diérentielles et la dérivation extérieure.
φ = −dtdxdydz
235
17 Les équations de la physique.
Nous avons, à de nombreuses occasions, rencontré les diverses équations de
la physique. Nous voudrions donner ici une dérivation simple et intuitive de ces
équations. Comme nous le verrons, pour établir ces équations, nous discrétisons
le système et faisons ensuite un passage à la limite. La méthode plus rigoureuse
( et riche et élégante et ... ) d'aborder ces sujets est le calcul variationnel (voir
le chapitre correspondant) . La méthode utilisée dans ce chapitre est celle qui
avait été utilisée par Euler lui-même dans les années 1740 pour fonder le calcul
des variations. Cette vue consiste à regarder les équations diérentielles comme
des équations aux diérences, avec un pas ∆x qui peut être rendu aussi petit que
l'on souhaite. Cette vue a quelque peu disparu des mathématiques au début du
XIXème siècle quand Cauchy &Co ont donné de la rigueur aux mathématiques,
mais a donné très naturellement lieu au développement des calculs matriciels et
la formalisation des espaces vectoriels un siècle plus tard par Hilbert &Co. Avec
l'arrivée des ordinateurs et la résolution numérique des équations, cette approche
redevient tout a fait naturelle. Regardons quelques cas particuliers.
y 0 = f (x) (17.1)
y1 − y0 = ∆x.f (x0 )
y2 − y1 = ∆x.f (x1 )
... ...
yN − yN −1 = ∆x.f (xN −1 )
236
17 Les équations de la physique.
1 0 ... 0 y1 a + ∆x.f (x0 )
−1 1 0 .. 0
y2
f (x1 )
0 −1 1 .. 0
. =
.
... . .
0 ... −1 1 yN f (xN )
X1
U (..., yn−1 , yn , yn+1 , ...) = k(yn+1 − yn )2 (17.2)
n
2
237
17 Les équations de la physique.
y
y y
d
Y
k
x L x x
∂U
= k(2yn − yn−1 − yn+1 ) = 0 (17.3)
∂yn
Cette dernière relation indique simplement que la force exercée sur la n-ième
boule doit être nulle : en eet, la force n'est que le gradient (à un signe près) du
potentiel. L'extremum du potentiel correspond à une position d'équilibre où les
d → 0 et N → +∞ pour retrouver
forces exercées s'annulent. Faisons maintenant
x = nd devient continue, de même que la fonction y(x).
le continuum. La variable
Comme yn = y(xn ) = y(nd), nous avons, par un simple développement de Taylor,
dy 1 d2 y
yn+1 = yn + d+ d2
dx x=xn 2 dx2 x=xn
dy 1 d2 y
yn−1 = yn − d+ d2
dx x=xn 2 dx2 x=xn
∆y = 0 (17.4)
238
17 Les équations de la physique.
X
U= k(Y /L)2 d2 = (Y /L)2 N kd2 = (Y /L)2 Lkd = (Y 2 /L)kd
n
K
k= (17.5)
d
La constante de ressort microscopique (résultat de notre découpage discret ) k
est relié à une constante physique du système K, ( qui dénote l'amplitude de la
rigidité du système par rapport à un phénomène physique), par la relation (17.5).
Comme (yn+1 −yn ) = y 0 (x).d+O(d2 ), l'expression de l'énergie potentielle devient
XK
U = (1/2) y 0 (nd)2 d2
Z d
= (1/2) Ky 0 (x)2 dx quand d→0
(/2)|E|2 dτ =
R
Pour un champ électrique par exemple, l'énergie est donnée par
(/2)|∇V |2 dτ . V
R
est le potentiel électrostatique et l'opérateur gradient (∇) gé-
néralise la dérivée à plusieurs dimensions. Ici, le rôle de la constante de rigidité
du système (vis à vis du champs électrique ) est joué par la constante de perméa-
bilité électrique . En élasticité, la variable du champ est appelé déplacement, et
2
la rigidité du système est donnée par le module d'Young . Dans le cas des gaz,
nous somme en présence d'un champ de pression et K est l'inverse du coecient
de compressibilité.
239
17 Les équations de la physique.
d2 yn
m = −k(2yn − yn+1 − yn−1 ) (17.6)
dt2
Comment m dépend de notre découpage ? La réponse est plus simple cette fois.
Si nous désignons par ρ la densité (linéaire à une dimension), nous avons m = ρd.
Nous avons également, comme indiqué plus haut, k = K/d et (2yn − yn+1 −
yn−1 ) ≈ −(∂ 2 y/∂x2 )d2 . Quand d → 0, l'équation (17.6) devient
∂2y (K/d) ∂ 2 y 2
= d
∂t2 ρd ∂x2
K ∂2y
= (17.7)
ρ ∂x2
C'est ce qu'on appelle l'équation d'onde. Elle se généralise de la même manière à
plusieurs dimensions ( l'opérateur ∆ généralise la dérivée seconde). La constante
K/ρ possède la dimension d'une vitesse au carré (pourquoi ?) et désigne, comme
nous l'avons vu, la vitesse de propagation des ondes.
Question : qu'est ce qui joue le rôle de la densité pour les phénomènes élec-
triques ?
∂y ∂2y
=D 2
∂t ∂x
240
17 Les équations de la physique.
qui n'est rien d'autre que l'équation de la chaleur. Il est peut-être dicile pour le
lecteur de penser au champ de température comme des boulent qui se meuvent
3
dans du miel . Nous le référons à la théorie de la réponse linéaire en physique
statistique pour une dérivation de l'équation de la chaleur qui ait une plus grande
réalité physique.
Revenons encore une fois à notre image de boules de la gure (17.1.a) . Et
imaginons qu'en plus d'être relié par un ressort de raideur k les uns aux autres,
elles sont en plus reliés à l'axe x par un ressort de constante V d (nous normalisons
tout de suite la raideur par l'espacement, en laissant le soin au lecteur de démon-
trer que cela eectivement est la bonne forme). Nous n'avons aucune obligation
à penser que V doit être une constante. A certain endroit le long de l'axe x, elle
peut être forte, à d'autres endroit, faible. Nous notons donc Vn la constante du
ressort qui relie la n-ième boule à l'axe x. L'expression de l'énergie potentielle
totale est donc
X1K
U= (yn+1 − yn )2 + d.Vn yn2
n
2 d
Il ne sera pas alors dicile pour le lecteur de démontrer que l'équation d'onde
s'écrira
∂2y ∂2y
2
= c2 2 − V (x).y
∂t ∂x
et l'expression de l'énergie (potentielle) est de la forme
Z
(K/2)|∇y|2 + (1/2)V (x)y 2 dx
241
18 Qu'est ce qu'un nombre ?
Nous avons vu tout au long de ce cours divers outils de mathématiques très
utilisés en physique. Ces outils concernaient la manipulation des fonctions dans le
but très alimentaire de résoudre des équations issue de la physique. Les fonctions
elles même étaient dénies comme des boîtes noires transformant un nombre dans
un autre. Nous nous sommes jamais demandé ce qu'est un nombre, nous avons
pris cela comme une donnée dont la signication est à priori connu.
Nous allons dans ce chapitre revenir un peu sur ce concept et voir la construc-
tion des nombres réels. Nous verrons également que ce n'est pas la seule façon
de construire un ensemble complet de nombe, et d'autres ensembles qui déent
notre intuition de proche et de loin sont également constructible. Ce chapitre
n'a pas d'autre but que d'éveiller la curiosité du lecteur.
Le plan général que l'on va suivre est de d'abord construire les nombres en-
tiers, ensuite les nombres rationnels. Nous munirons alors notre ensemble d'une
topologie et construirons soit l'ensemble des nombres réels, soit celui des nombres
p-adiques. Munir un ensemble d'une topologie est un terme pour erayer l'étu-
diant. En langage profane, cela veut simplement dire que l'on va dénir les dis-
tances, la notion d'être proche. La topologie habituelle que l'on dénie, et à la-
quelle nous sommes habitué depuis notre tendre enfance nous dit par exemple
que 4.3 et plus proche de 4.2 que 5. Tant que nous construisons l'ensemble des
nombres rationnels, nous n'avons pas besoin de ce concept, celui d' avant et après
nous sura.
1. 0 ∈ N1
1. Grand débat philosophique pour savoir si il faut commencer par 0 ou par 1. Cette question
242
18 Qu'est ce qu'un nombre ?
n'a pas de sens tant que l'on a pas déni l'opération addition et son élément neutre. Tout ce
que l'on veut ici est de dénir un premier élément.
2. Notez comment l'operation +1 devient alors le synonyme de l'opération successeur.
243
18 Qu'est ce qu'un nombre ?
244
18 Qu'est ce qu'un nombre ?
corps k45 (dont par exemple le corps des rationnels). Nous demandons à cette
application d'avoir un minimum de propriétés : Pour tous a, b, c ∈ k ,
1. d(a, b) ≥ 0 et d(a, b) = 0 si et seulement si a = b.
2. d(a, b) = d(b, a).
3. d(a, b) ≤ d(a, c) + d(b, c) (l'inégalité du triangle).
p1 : |a| = 0 ssi a = 0.
p2 : |ab| = |a||b|
p3 : |a + b| ≤ |a| + |b|
alors nous pouvons facilement dénir la distance entre deux éléments par d(a, b) =
|a − b|. Nous laissons au lecteur le soin de démontrer cela. L'exemple usuel de la
valeur absolue sur Q est |x| = x si x≥0 et −x sinon. Bien sûr, ce n'est pas la
seule valeur absolue possible, nous en verrons des exemples plus bas.
Comme nous l'avons dit, dès que nous disposons d'une distance, nous pouvons
dénir la convergence des suites. Nous disons que la suite an converge vers la limite
a si tous les éléments de la suite, à partir d'un certain N sont aussi proche de la
limite que nous le souhaitons. Dans l'ensemble Q, nous écrirons par exemple que
a est la limite de an si pour tout ∈ Q, nous pouvons trouver N tel que si n>N
alors d(a, an ) < .
Un des problèmes de cette dénition de la convergence est que pour savoir si
une suite converge, nous devons connaître à l'avance sa limite ! Le grand Cauchy a
trouvé comment y remedier : une suite converge si la distance entre deux éléments
quelconques converge vers zero au delà d'un certain N : si pour tout ∈ Q, nous
pouvons trouver N tel que si n, m > N alors d(am , an ) < alors la suite est
convergente.
Cela nous pose un nouveau problème : la limite d'une suite dans un corps k n'a
aucune raison d'appartenir au même corps. Mais nous pouvons continuer notre
procédure d'enrichissement et considérer un ensemble qui contient et le corps k et
toutes les limites de toutes les suites convergentes. Nous verrons ci-dessous deux
4. Rappelons qu'un corps est un ensemble, muni des deux opérations + et × et fermée vis
à vis d'elles.
5. Bien sûr, pour dénir une norme, nous n'avons pas nécessairement besoin d'un corps.
Nous avons vu dès le début de ce livre comment en dénir une pour l'espace vectorielle des
fonctions de carré sommable.
245
18 Qu'est ce qu'un nombre ?
n
P
Exemple 1. Le nombre 1/e, n=0 (−1) /n! n'est pas
déni comme la limite de
un nombre rationnel. Pour voir cela supposons qu'il l'est et ecrivons le comme
p/q . Nous décomposons la série en une somme jusqu'au terme q et le reste :
q
p X
= (−1)n /n! + Rq
q n=0
Comme nous avons aaire à une série alternative convergente, le reste est plus
petit que le dernier terme : |Rq | < 1/q!. Multiplions maintenant les deux cotés
par q!. Nous avons à gauche un entier, et à droite un entier plus un terme plus
petit que l'unité. Le coté droit n'est donc pas un entier naturel. Notre hypothèse
de rationnalité de 1/e est donc fausse.
Nous dénissons l'ensemble des nombres réel R comme un ensemble qui contient
l'ensemble Q et les limites de toutes les suites convergentes dans Q au sens
de Cauchy. Les opérations + et × se généralisent aisement par continuité. Par
exemple,pour a, b ∈ R, (mais pas nécessairement rationnel) a + b = lim(an + bn )
où an et bn sont des suites dans Q convergeant vers a et b.
Nous pouvons pousser un ouf de soulagement, nous sommes au bout de notre
chemin (à part peut-être une extension triviale au nombre C). Mais est ce que
c'était vraiment la peine de faire tout ce parcours ? Est ce que l'ensemble R est
vraiment plus riche que l'ensemble des nombres algébriques ? La réponse est évi-
dement oui, mais est loin d'être évidente. Jusqu'à presque la n du dix-neuvième
siècle, la réponse à cette question n'était pas connu. On a pu démontrer à cet
époque avec peine que les nombre e et π ne sont pas algébrique, c'est à dire
que nous ne pouvons pas trouver un polynome de coecient entier dont une
des racines soit un de ces nombres. Mais combien y avait il de ces nombres
transcendant ? très peu, beaucoup ? La réponse, un coup de maître, est venu
de Greg Cantor : les nombres algébriques sont une minorité négligeable comparés
au nombres réels. Cette démonstration a provoqué beaucoup de débats furieux
à l'époque, puisque Cantor ne construisait pas un seul nombre transcendant. Sa
démonstration se fait en deux étapes très simple : (i) les nombres algébriques
sont dénombrables ; (ii) les nombres réels ne sont pas dénombrable. Voyons cela
de plus près.
246
18 Qu'est ce qu'un nombre ?
Comme nous l'avons dit, les nombres algébriques comprennent les racines de
tous les polynomes. Les nombres rationnels sont évidement des nombres aglé-
briques, puisque p/q est solution de l'équation px − q = 0.
Considérons maintenant un polynome à coecient entier du genre a0 + a1 x +
... + an xn (an 6= 0). Nous appelerons hauteur de ce polynôme le nombre H =
n − 1 + |a0 | + |a1 | + ...|an |. Il existe un seul polynome de hauteur 1 : x. Pour
H = 2, nous avons les polynômes suivants : x2 ; x ± 1. Pour H = 3, x3 ; ±2x2 ;
x2 ± x ; x2 ± 1 ; 2x ± 1 ; x ± 2 et ainsi de suite. Le fait intéressant est que le
nombre de racines de tous les polynomes d'un hauteur H est ni ( Combien y'en
a t'il au plus ?). Nous pouvons donc ranger les nombres algébriques de façon
suivante : On prend d'abord toutes les racines associées à l'hauteur 1, et on les
range dans l'ordre croissant, en éliminant les doublons. On prend ensuite toutes
les racines associées à H = 2, on les ranges dans l'ordre croissant en éliminant
les doublons et on continu le procédé pour H = 3, H = 4,... Cela nous donne
par A = {0 ; −1, 1 ; −2, −1/2, 1/2, 2 ; ...} et il n'est pas dicile de voir que nous
avons ainsi une procédure pour dénombrer les nombres algébriques !
La plupart des lecteurs ont déjà vu cette demonstration. Supposons que nous
avons réussi à denombrer tous les nombres réel entre 0 et 1et nous les listons dans
l'ordre croissant en utilisant leur representation décimal :
Si on voulait donner une image de nos nombres, les rationnels seraient des
points isolés dans un espace et les réels remplirait le vide qu'il y a entre. Peut on
encore inventer des nombres qui se mettraient entre les nombres réels ? Avant le
dix-neuvième siècle, les mathématicens avaient l'habitude de manipuler ce genre
de nombres qu'ils appelaient des inniment petits. Ces nombres cependant pro-
voquaient pas mal de contradictions et on vite été chassé du monde. Dans les
247
18 Qu'est ce qu'un nombre ?
p4 : |x + y| ≤ max{|x|, |y|}
nous l'appelons non-archimedien. Notons que la propriété 4 implique la propriété
3, puisque max{|x|, |y|} ≤ |x| + |y|.
Commençons par les nombres entiers. Donnons nous un nombre premier p.
N'importe quel entier n peut s'écrire de façon unique sous la forme
n = pvp (n) n0
2 = 50 2
5 = 51 1
6 = 50 6
150 = 52 6
et nous avons donc v5 (2) = v5 (6) = 0 ; v5 (5) = 1 ; v5 (150) = 2. vp (n) est appelé
la valuation p−adique du nombre n, et désigne la multiplicité du facteur premier
p pour former le nombre n. Par convention, vp (0) = ∞ : on peut diviser 0 par
p ; le résultat étant 0, on peut encore multiplier 0 par p et cela peut continuer
inniment.
248
18 Qu'est ce qu'un nombre ?
249
19 Bibliograhie.
Ce cours est un résumé rapide de ce que l'étudiant en physique doit absolument
savoir. Ce cours est une introduction qui devrait permettre à l'étudiant d'attaquer
les divers sujets en conslutant des livres plus avancés. Ci-dessous, je liste pêle-
mêle quelques livres que j'ai eu entre les mains et que j'ai trouvé particulièrement
intéressant pour des étudiants de niveau L3-M2.
F.W. Byron & R.W. Fuller, Mathematics of classical and quantum physics.
Le livre que chaque étudiant de physique devrait avoir lu.
250
19 Bibliograhie.
251