Développements: Pour L'Oral
Développements: Pour L'Oral
Développements: Pour L'Oral
MONTAGNON
P. LE BARBENCHON, T. PIERRON
131 DÉVELOPPEMENTS
POUR L’ORAL
AGRÉGATION EXTERNE
MATHÉMATIQUES / INFORMATIQUE
Conception de maquette de couverture : Hokus Pokus Création
iv
Avant-propos
L’espoir de ce livre. Sans exiger de l’agrégatif qu’il passe une année à naviguer
à travers une éclectique bibliographie spécialisée, nous souhaitons partager des
résultats que nous trouvons intéressants et enthousiasmants tant sur le plan
mathématique que pédagogique, en les regroupant dans un ouvrage qui nous a
semblé faire cruellement défaut pendant notre préparation à l’agrégation.
Nombre de livres considérés comme des sources classiques de développements
sont soit obsolètes, soit introuvables, soit cantonnés aux rappels de cours, et ne
proposent que très peu de développements dans un format directement exploitable
pour l’oral. Nous espérons que ce nouvel ouvrage, constitué de 131 développements
pensés comme tels, saura suppléer à ce manque et apporter une solution pratique
et efficace pour beaucoup d’agrégatifs. Ainsi, chaque leçon du programme actuel
de l’agrégation s’y trouve illustrée par au moins trois développements, et souvent
davantage. L’informatique n’a pas été oubliée, toutes les leçons étant illustrées
par au moins deux développements, de sorte à constituer une référence unique à
partir de laquelle préparer un plan de bataille pour les oraux.
Par-delà le public des agrégatifs, le taupin curieux trouvera indubitablement dans
ce livre un bon entraînement pour les notions qui le concernent, l’enseignant de
premier cycle universitaire en tirera des idées pour faire vivre des concepts de
manière originale, et tout amoureux des mathématiques pourra se régaler de ces
lectures brèves mais intenses.
Investissement personnel de l’agrégatif. L’existence de ce livre, comme de
tout autre recueil de développements que l’on trouverait sur les étals ou sur Internet,
ne saurait dispenser l’agrégatif d’un travail fondamental : celui d’appréhender
chaque développement de manière consciencieuse et personnelle. C’est également
une saine discipline d’apprentissage : les développements proposés mobilisent des
mathématiques en tout genre, jetant souvent des ponts entre différents domaines
et utilisant des résultats et arguments plus ou moins classiques. Certains lecteurs
seront à l’aise avec des arguments qu’ils estimeront même trop détaillés sur tel
thème, et devront reconstruire toute la démarche pourtant standard sur tel autre.
La préparation à l’agrégation constitue l’occasion parfaite d’orienter ses efforts et
d’investir du temps pour comprendre et assimiler les sujets les moins maîtrisés,
jusqu’à pouvoir présenter les développements associés avec aisance et conviction.
Seule la maîtrise des détails des développements permettra, lors de la préparation
de l’épreuve, de retrouver les idées sans encombres et de ne pas devoir redécouvrir
les difficultés qui étaient restées cachées.
Nul livre ni professeur ne saurait suppléer à cette quête d’une compréhension
profonde et personnelle qui doit être ultimement transmise à l’oral. Il est naturel de
passer plusieurs heures à découvrir et à digérer un développement. Comprendre les
mathématiques ou savoir faire les calculs ne sont pas les seuls ingrédients pour une
présentation claire et convaincante. Nous mettons fortement en garde contre cet
écueil et espérons que ce livre sera un juste compagnon en ce sens : une référence
qui donnera des idées et des sujets, mais qui n’empêchera pas le lecteur d’adapter
la présentation de chaque développement avec ses propres mots et moyens, et
l’aidera à affronter ses difficultés de compréhension grâce aux commentaires et
aux exercices.
v
La rédaction de cet ouvrage. Ce livre arrive au terme d’une aventure de
nombreuses années. Nous avons souhaité que chaque développement soit finement
abouti, calibré en termes de longueur et de difficulté, rédigé de manière limpide et
complète, et éclairé de plusieurs commentaires et questions d’approfondissement.
Pour cela, chaque développement a été affiné par au moins trois phases de
relectures indépendantes par les auteurs ou par des collègues et professeurs
extérieurs. Ces échanges, représentant une grande partie du travail de rédaction,
ont suscité de nombreuses discussions critiques et constructives qui ont contribué
à la richesse et à la qualité du contenu final de l’ouvrage. Cette dialectique a
permis de parfaire la rédaction des développements, de clarifier des arguments
passés sous silence, d’approfondir certains sujets par des commentaires utiles
(parfois susceptibles de constituer des développements à part entière) et d’enrichir
l’exposition par des remarques culturelles et heuristiques. Tous ces compléments,
nous l’espérons, permettront au lecteur de prendre le recul nécessaire sur les sujets
et les méthodes abordés sans avoir à consulter de nombreux autres ouvrages.
Nous sommes donc infiniment reconnaissants, pour les nombreuses propositions et
discussions qu’ils ont permises, à nos relecteurs et relectrices : Vincent Bansaye,
Lilian Besson, Maxence Brévard, Mathias Déhais, Clarence Kineider, Thomas
Lévy, Julie Parreaux, Luc Pellissier, François Wawrzyniak et David Xu.
Certains développements ont été rédigés par des contributeurs extérieurs avec le
même soin que nous avons passé à rédiger les autres développements ; ce livre ne
serait pas complet sans leurs contributions, et nous témoignons donc notre sincère
gratitude à Benjamin Dadoun, Julie Gauthier, Marc Pegon, Marcin Pulkowski,
Antonin Riffaut et François Wawrzyniak.
Notre reconnaissance va enfin aux soutiens et conseils mathématiques et typogra-
phiques de Simon Coste, Benjamin Dadoun et Vojislav Petrov, qui ont permis
à ce livre de voir le jour sous une forme bien meilleure qu’elle ne l’aurait été
originellement.
Si les efforts et le cœur mis dans la rédaction de cet ouvrage permettent aux
lecteurs, agrégatifs et curieux, d’enrichir leur culture et d’embrasser certains sujets
d’un regard un peu plus élevé, de trouver des chemins de traverse moins fréquentés
pour explorer les mathématiques, ou de rendre la préparation à l’agrégation plus
naturelle, efficace et aisée, les années passées à peaufiner ce livre auront été
couronnées de succès.
Nous espérons que vous profiterez pleinement de cette année de préparation à
l’agrégation et vous souhaitons une belle réussite au concours.
Bon courage et bonne lecture !
Le 12 juin 2020,
à travers le monde,
Pierre Le Barbenchon, Didier Lesesvre,
Pierre Montagnon et Théo Pierron
vi
Organisation de ce livre
viii
Table des matières
Avant-propos iii
Développements d’algèbre 1
Groupes, actions et représentations . . . . . . . . . . . . . . . . . . . . . 3
1. Incertitude de Heisenberg pour les groupes F . . . . . . . . . . 5
2. Théorème de Dixon F . . . . . . . . . . . . . . . . . . . . . . . 10
3. Générateurs de SL2 (Z) F . . . . . . . . . . . . . . . . . . . . . . 14
4. Ensembles de transpositions engendrant Sn F . . . . . . . . . . 18
5. Paires génératrices de sous-groupes de Sn FF . . . . . . . . . . 23
6. Ordre maximum des permutations FF . . . . . . . . . . . . . . 28
7. Commutativité de permutations aléatoires FF . . . . . . . . . . 35
8. Cyclicité des groupes d’ordre pq F . . . . . . . . . . . . . . . . 41
9. Groupes d’ordre 105 FFF . . . . . . . . . . . . . . . . . . . . . 44
10. Table des caractères des groupes diédraux F . . . . . . . . . . 49
11. Théorème pa q b de Burnside FFF . . . . . . . . . . . . . . . . . 54
Anneaux, corps et théorie des nombres . . . . . . . . . . . . . . . . . . . 61
12. Théorème de Cohn F . . . . . . . . . . . . . . . . . . . . . . . 63
13. Lemme de Hensel F . . . . . . . . . . . . . . . . . . . . . . . . 69
14. Méthodes polynomiales en combinatoire FF . . . . . . . . . . 73
15. C est algébriquement clos F . . . . . . . . . . . . . . . . . . . 78
16. Lemme d’intersection de Krull FF . . . . . . . . . . . . . . . . 81
17. Cyclicité de F× p FF . . . . . . . . . . . . . . . . . . . . . . . . 84
18. Automorphismes de Fpm F . . . . . . . . . . . . . . . . . . . . 89
19. Automorphismes d’un corps cyclotomique F . . . . . . . . . . 92
20. Automorphismes sauvages de C FFF . . . . . . . . . . . . . . 96
21. Théorème d’Artin FFF . . . . . . . . . . . . . . . . . . . . . . 103
22. L’unique entier entre un carré et un cube FF . . . . . . . . . . 109
23. Valeurs absolues sur Q FF . . . . . . . . . . . . . . . . . . . . 114
24. Théorème de Fermat et cyclotomie FFF . . . . . . . . . . . . 120
25. Problème de Waring modulo q FFF . . . . . . . . . . . . . . . 128
Algèbre linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
26. Perturbation par des matrices de rang un F . . . . . . . . . . 135
27. Quaternions et isomorphismes F . . . . . . . . . . . . . . . . . 138
28. Lemmes de Schwartz-Zippel et de Kakeya FF . . . . . . . . . 147
29. Calculs de polynômes caractéristiques F . . . . . . . . . . . . . 155
30. Endomorphismes conservant le déterminant F . . . . . . . . . 163
31. Endomorphismes conservant le rang FF . . . . . . . . . . . . . 167
32. Théorème de Chebotarev FFF . . . . . . . . . . . . . . . . . . 172
33. Images par l’exponentielle FF . . . . . . . . . . . . . . . . . . 178
34. Décomposition polaire F . . . . . . . . . . . . . . . . . . . . . 185
35. Réduction des endomorphismes nilpotents F . . . . . . . . . . 190
36. Décomposition de Dunford F . . . . . . . . . . . . . . . . . . . 194
37. Forme normale de Smith FF . . . . . . . . . . . . . . . . . . . 201
38. Sous-algèbres réduites de Mn (C) FF . . . . . . . . . . . . . . 207
39. Théorème d’Engel FFF . . . . . . . . . . . . . . . . . . . . . . 212
Formes quadratiques et géométrie . . . . . . . . . . . . . . . . . . . . . . 217
40. Billard circulaire F . . . . . . . . . . . . . . . . . . . . . . . . 219
41. Le plongeoir le plus long FF . . . . . . . . . . . . . . . . . . . 225
42. Théorèmes de Helly et de Carathéodory F . . . . . . . . . . . 235
43. Théorème des trois réflexions F . . . . . . . . . . . . . . . . . 239
44. Théorème de Killing-Hopf F . . . . . . . . . . . . . . . . . . . 243
45. Isométries directes des solides de Platon FF . . . . . . . . . . 251
46. Théorème d’Hermite F . . . . . . . . . . . . . . . . . . . . . . 260
47. Formes quadratiques semi-réduites FF . . . . . . . . . . . . . 264
48. Théorème de Minkowski pour les formes quadratiques FFF . . 268
x
TABLE DES MATIÈRES
xi
109. Turing-calculable implique µ-récursive FF . . . . . . . . . . . 687
110. Caractérisation de RE FF . . . . . . . . . . . . . . . . . . . . 692
111. µ-récursive implique λ-définissable FF . . . . . . . . . . . . . 696
112. Théorème de Scott-Curry FF . . . . . . . . . . . . . . . . . . 700
Théorie des graphes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 705
113. Polynôme chromatique F . . . . . . . . . . . . . . . . . . . . 717
114. Théorème de Turán FF . . . . . . . . . . . . . . . . . . . . . 724
115. Formule d’Euler par déchargement FF . . . . . . . . . . . . . 731
116. Problème du voyageur de commerce F . . . . . . . . . . . . . 738
117. Tri topologique F . . . . . . . . . . . . . . . . . . . . . . . . . 743
118. Séquençage ADN et graphe de De Bruijn F . . . . . . . . . . 747
Langages réguliers et algébriques . . . . . . . . . . . . . . . . . . . . . . 753
119. Recherche de motif FF . . . . . . . . . . . . . . . . . . . . . . 763
120. Problème de séparation par automate F . . . . . . . . . . . . 768
121. Universalité d’un automate FF . . . . . . . . . . . . . . . . . 774
122. Algorithme de Cocke-Younger-Kasami F . . . . . . . . . . . . 779
123. Caractérisation de Premier en analyse LL(1) FF . . . . . . 783
Logique et preuves . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 789
124. Théorème de Cook-Levin F . . . . . . . . . . . . . . . . . . . 791
125. Transformation de Tseitin F . . . . . . . . . . . . . . . . . . . 797
126. 2Sat est NL-dur FF . . . . . . . . . . . . . . . . . . . . . . . 802
127. Compacité de la logique propositionnelle F . . . . . . . . . . 807
128. Indécidabilité du problème ValidFO FF . . . . . . . . . . . 812
129. Indécidabilité du problème RelSat FFF . . . . . . . . . . . 817
130. Complétude de la logique de Hoare FFF . . . . . . . . . . . . 824
131. Équivalence entre deux sémantiques FFF . . . . . . . . . . . 830
Annexes 869
Liste des leçons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 871
Correspondances entre leçons et développements . . . . . . . . . . . . . 881
Bibliographie 897
Index 901
xii
Liste des notations
Algèbre linéaire
χA polynôme caractéristique de la matrice A
com(·) comatrice
An (K) espace des matrices antisymétriques de taille n sur K
Dn (K) espace des matrices diagonales de taille n sur K
Mn (K) espace des matrices carrées de taille n sur K
Sn (K) espace des matrices symétriques de Mn (K)
Sn++ (K) ensemble des matrices symétriques définies positives de Mn (K)
L(E) espace des endomorphismes de E
xiv
Liste des notations
xv
B(a, r) boule fermée de centre a et de rayon r
∂A bord topologique de l’ensemble A, soit ∂A = A\A◦
? opérateur de convolution
fb transformée de Fourier de f
C(a, r) cercle de centre a et de rayon r
E0 dual topologique de E
E∗ dual de E
f = Ω(g) notation Ω de Landau : f /g est bornée
f = Θ(g) notation Θ de Landau : f = O(g) et f = Ω(g)
f = O(g) notation O de Landau : f /g est bornée
H1 espace de Sobolev
Calcul différentiel
∆ opérateur laplacien
ẋ dérivée par rapport au temps de la quantité x
df (x) différentielle de f en x
∇f gradient de f en x
Df (x) matrice jacobienne de f en x
Probabilités, statistiques
E(X) espérance de la variable aléatoire X
Γ(k, θ) loi Gamma de paramètres k et θ
B(n, p) loi binomiale de paramètres n et p
B(p) = B(1, p) loi de Bernoulli de paramètre p
E(λ) loi exponentielle de paramètre λ
G(p) loi géométrique (sur N∗ ) de paramètre p
N (µ, σ 2 ) loi normale d’espérance µ et de variance σ 2
P(λ) loi de Poisson de paramètre λ
Cov(X, Y ) covariance des variables aléatoires X et Y
P mesure de probabilité
P(A|B) probabilité de A sachant B
L
−→ convergence en loi
n→+∞
xvi
Liste des notations
P
−→ convergence en probabilité
n→+∞
p.s.
−→ convergence presque sûre
n→+∞
Lp ensemble des variables aléatoires admettant un moment d’ordre p
xvii
Développements d’algèbre
Groupes, actions et représentations
Les prémices de la théorie des groupes remontent aux travaux de Lagrange autour
de 1770 ; motivé par l’étude des racines d’équations polynomiales, il expose un
calcul des combinaisons qui n’est autre que la loi de composition pour le groupe
symétrique Sn . Le groupe symétrique demeure un exemple omniprésent et très
riche de groupe (Développements 4, 5, 6, 7). C’est Galois qui, quelques décennies
plus tard, introduit explicitement le terme de groupe, toujours dans le cadre des
équations polynomiales. La première étude systématique de la structure de groupe
est due à Cayley, en 1854 mais il faudra attendre la fin du XIXe siècle pour voir
l’essor de la théorie des groupes.
Un groupe est une structure algébrique munie d’une opération binaire vérifiant
de « bonnes propriétés ». Il peut être intuitivement pensé comme un ensemble
de mouvements qui offre la possibilité de se déplacer de manière naturelle (en
faisant un mouvement après l’autre : la loi est interne et associative), de demeurer
au même point (existence d’un élément neutre) et de revenir en arrière (chaque
élément admet un inverse). Cela donne une structure qui modélise de nombreux
problèmes : Galois s’intéresse aux groupes de permutations de racines, Klein aux
groupes d’isométries (Dév. 45) dans sa vision nouvelle de la géométrie, Kummer
introduit le groupe des classes d’idéaux pour mieux comprendre les équations
diophantiennes, les physiciens utilisent les groupes de symétries des molécules...
L’étude théorique des groupes, domaine immense et encore très actif, s’épanouit
dans de nombreuses directions. Classifier ne serait-ce que les groupes finis fut
l’une des grandes quêtes mathématiques du XXe siècle, et tout un univers s’ouvre
des groupes discrets aux groupes continus, en passant par les groupes topologiques
ou différentiels. Quelle que soit la particularité des groupes considérés, l’étude des
groupes s’appuie sur la notion de quotient, permettant de « dévisser » les groupes
pour les ramener à l’étude de groupes plus petits, idée particulièrement utile une
fois combinée aux théorèmes de Sylow (Dév. 8, 9).
Plutôt qu’étudier les éléments d’un groupe, il est souvent plus riche de le faire agir
sur d’autres espaces ou sur lui-même. C’est le principe à l’origine de la théorie
des actions de groupes, qui permet de réaliser un groupe comme un ensemble de
mouvements, autrement dit (dans le cas des actions linéaires en dimension finie)
comme un groupe de matrices. La théorie des représentations (Dév. 10, 11) est
donc un moyen de donner corps à des groupes abstraits dans le cadre de l’algèbre
linéaire, plus concrète et familière, et d’en tirer de nombreux résultats sur les
groupes. De manière analogue, laisser un groupe connu agir sur un ensemble
permet souvent d’obtenir des informations sur ce dernier.
Groupes, actions et représentations
M
∀χ ∈ G,
b fb(χ) 6 |supp f |.
n
5
1. Incertitude de Heisenberg pour les groupes
Correction.
a) (i) Soit a ∈ G. Si a = 0, on a bien
X X
χ(a) = 1 = n.
χ∈G
b χ∈G
b
Si a 6= 0, alors il existe χ0 ∈ G
b tel que χ0 (a) 6= 1. Or l’application χ 7→ χ0 χ est une
bijection de G b dans lui-même, elle peut donc servir de changement de variable.
On obtient dans ce cas
(ii) Soit χ ∈ G.
b Puisque les caractères sont unitaires, χ est l’inverse de χ, et en
particulier par multiplicativité on a χ(a)χ(b) = χ(a − b) pour tous a, b ∈ G. Il
vient donc par ce qui précède, en remplaçant a par a − b,
X
χ(a)χ(b) = nδa,b .
χ∈G
b
6
Groupes, actions et représentations
M
fb(χ) 6 |supp f |.
n
(iii) En introduisant la majoration précédente dans (1), il vient
X M M
|f (a)| 6 |supp f | = |supp fb| · |supp f |.
n n
χ∈G b
f (χ)6=0
b
Commentaires.
© Ce développement propose de prouver le principe d’incertitude de Heisenberg
pour les groupes abéliens finis. Il s’agit de la généralisation du principe analogue
pour les fonctions périodiques, et un principe général en analyse de Fourier :
plus on souhaite localiser une fonction, plus il faut être prêt à concéder de
pertes sur la localisation de sa transformée de Fourier. Il s’agit bien du principe
d’incertitude de la physique quantique, qui énonce qu’il n’est pas possible de
connaître simultanément la position et le moment d’une particule avec une précision
arbitraire. La transformation de Fourier fournit un moyen de passer du formalisme
des positions au formalisme des moments, et le principe d’incertitude formulé dans
ce développement souligne qu’il n’est pas possible de sélectionner très précisément
les deux informations.
© On se réfère parfois aux « carrés de Heisenberg » pour parler de ce principe
d’incertitude. Géométriquement, en se plaçant dans l’espace des phases G × G,
b le
résultat obtenu stipule que le produit des supports recouvre un rectangle d’aire
au moins n.
7
1. Incertitude de Heisenberg pour les groupes
© Une situation élémentaire à garder en tête est celle des gaussiennes. Sans donner
de normalisation précise pour la transformée de Fourier d’une fonction sur R et
en ignorant les constantes, on a la dualité
2 x2 2 /α2
f (x) ' e−α et fb(x) ' e−x ,
de sorte que si le support (essentiel) de f est de mesure 1/α, alors le support (es-
sentiel) de f est de mesure α. L’heuristique demeure ainsi plus généralement : une
fonction et sa transformée de Fourier ne peuvent être toutes deux arbitrairement
concentrées autour d’un point. Pour des versions quantitatives de tels résultats,
on pourra se référer au Développement 85 sur les théorèmes de Paley-Wiener.
© Les arguments utilisés ici sont ceux de l’analyse harmonique sur les groupes.
L’idée principale est que l’analyse de Fourier, qui n’est qu’une décomposition
suivant les caractères du groupe R/Z, se généralise à bien des groupes abéliens,
notamment les groupes finis et les groupes topologiques compacts. Les fruits de
l’analyse harmonique en découlent alors de la même manière. Les idées ne sont en
rien plus difficiles que l’analyse de Fourier classique, une fois que les caractères
additifs exp(2iπn·) du tore R/Z sont remplacés par ceux de G.
© Explicitons la formule de Poisson pour illustrer le commentaire précédent. Soit f
une fonction sur G à valeurs complexes. Pour un sous-groupe H de G, on définit
n o
H⊥ = χ ∈ G
b : χ =1 .
|H
On a alors la formule
X 1 X
f (h) = fb(χ). (2)
h∈H
|G/H| ⊥χ∈H
À condition de remplacer les sommes par des intégrales contre une bonne mesure
de Haar et les cardinaux par des volumes, on arrive à une formule similaire pour
tout groupe abélien topologique. Dans le cas de G = R et H = Z, on retrouve
la forme de Poisson classique. En effet, le tore R/Z est alors de volume 1 et les
caractères de R (qui sont les exponentielles x 7→ exp(λx) avec λ ∈ C) qui sont
triviaux sur Z sont les x 7→ exp(2iπnx). La formule précédente s’écrit alors
X XZ X
f (n) = f (λ)e2iπnx dx = fb(n).
n∈Z n∈Z R n∈Z
8
Groupes, actions et représentations
Questions.
1. Expliquer pourquoi les χ(a), pour a ∈ G, sont des racines de l’unité.
2. Soit a 6= 0 dans G. Montrer qu’il existe χ ∈ G b tel que χ(a) 6= 1.
Indication : penser à définir le caractère χ sur le groupe cyclique hai (on pourra
penser au cas des racines n-ièmes de l’unité), puis l’étendre trivialement à G.
3. Rappeler pourquoi G et G
b ont le même cardinal.
? g = fb · gb.
Montrer que f[
×H =G
6. Soient deux groupes abéliens finis G et H. Montrer que G\ b × H.
b
Cette fonction est alors H-périodique et définit donc une fonction sur G/H. On
peut alors obtenir la formule, pour tout x ∈ G,
X 1 X
f (xh) = fb(χ)χ(x),
h∈H
|G/H| ⊥ χ∈H
9
2. Théorème de Dixon
Correction.
On rappelle que pour tout x ∈ G, on note
Cx = {g ∈ G : gx = xg}
le centralisateur de x dans G.
a) Comme G n’est pas abélien, il existe un élément x ∈ G dont le centralisateur Cx
n’est pas égal à G tout entier, et donc tel que l’indice [G : Cx ] de Cx dans G est
au moins égal à 2. Par ailleurs, le centre Z(G) de G est un sous-groupe de Cx ,
qui n’est pas égal à Cx puisqu’il ne contient pas x. Par conséquent, [Cx : Z(G)]
est lui aussi au moins égal à 2, d’où, par multiplicativité des indices,
[G : Z(G)] = [G : Cx ] · [Cx : Z(G)] > 4.
10
Groupes, actions et représentations
De plus, la question a) garantit que [G : Z(G)] > 4, ce qui se traduit par le fait
que |Z(G)| 6 14 |G|. On obtient donc comme voulu
c’est-à-dire
4(∆, ∆0 ) ≡ 0 mod 2π,
soit
(∆, ∆0 ) ≡ 0 mod π/2.
Une réflexion s ∈ D8 d’axe ∆ commute donc avec elle-même et avec la
réflexion dont l’axe est ∆⊥ , mais pas avec les autres réflexions.
• Si s est une réflexion de D8 d’axe ∆ et r une rotation de D8 , voyons à quelle
condition elles commutent. L’isométrie r ◦ s ◦ r−1 ∈ D8 est de déterminant
−1, donc c’est une réflexion. De plus, on voit facilement qu’elle préserve
la droite r(∆), et donc qu’elle est d’axe r(∆). Si s et r commutent, alors
r ◦ s ◦ r−1 = s, donc r(∆) = ∆ ; r est donc l’identité ou la rotation d’angle π,
c’est-à-dire −Id. Réciproquement, il est clair que Id et −Id commutent avec
toutes les réflexions de D8 .
11
2. Théorème de Dixon
Commentaires.
© On peut proposer une autre preuve du résultat de la question a). Puisque G
n’est pas abélien, Z(G) est d’indice au moins 2. Si cet indice était égal à 2 ou 3,
alors G/Z(G) serait cyclique en tant que groupe de cardinal 2 ou 3. Mais alors G
serait abélien : en effet, en notant aZ(G) ∈ G/Z(G) un générateur de G/Z(G) on
aurait pour tous x et y dans G l’existence de m et n entiers tels que x ∈ an Z(G)
et y ∈ am Z(G), et donc de z1 et z2 dans Z(G) tels que x = an z1 et y = am z2 . On
aurait alors
xy = an z1 am z2 = an am z1 z2 = am an z2 z1 = am z2 an z1 = yx
puisque z1 , z2 ∈ Z(G). Ainsi, l’indice de Z(G) est nécessairement supérieur ou
égal à 4.
© Le théorème de Dixon donne une majoration de la probabilité p(G). On voit dans
le Développement 7 qu’il est impossible de minorer p(G) par un réel strictement
positif indépendamment du cardinal de G puisque limn→+∞ p(Sn ) = 0.
Questions.
1. Démontrer que le centralisateur d’un élément x de G ainsi que le centre Z(G)
de G sont des sous-groupes de G.
2. Montrer que si G/Z(G) est abélien, alors G est abélien.
3. Montrer que si H est un sous-groupe de G et si K est un sous-groupe de H,
[G : K] = [G : H] · [H : K].
4. Justifier la majoration
|G| |G| |G| |G|
X X
|G| + 6 |G| + |G| −
x∈Z(G) x∈G\Z(G)
2 4 4 2
12
Groupes, actions et représentations
5. Montrer qu’il existe une infinité de groupes pour lesquels p(G) = 5/8.
6. Montrer qu’un groupe fini pour lequel l’égalité p(G) = 5/8 est vérifiée a
nécessairement un cardinal multiple de 4.
7. Justifier que p(G) = kG /|G|, où kG est le nombre de classes de conjugaison
dans G.
|G|
Indication : on pourra d’abord montrer que |Cx | = |Ω(x)| pour tout x ∈ G,
où Ω(x) est la classe de conjugaison de x dans G. On pourra aussi se référer au
Développement 7 pour trouver un raisonnement similaire dans le cas où G = Sn .
8. Rappeler comment est défini l’angle entre deux droites du plan euclidien.
9. Détailler l’argument permettant d’obtenir dans la question c) l’angle de la
rotation s ◦ s0 lorsque s ∈ D8 est la réflexion d’axe ∆ et s0 ∈ D8 est la réflexion
d’axe ∆0 .
10. Dresser la table de la loi de composition du groupe D8 .
11. Montrer qu’une présentation du groupe D8 par générateurs et relations est
donnée par hs, r | s2 , r4 , (sr)2 i, c’est-à-dire que tout groupe non abélien engendré
par deux éléments s et r tels que s ∈ / hsi et s2 = r4 = (sr)2 = 1 est
/ hri, r ∈
isomorphe à D8 .
12. Donner une présentation du groupe D2n par générateurs et relations pour
tout n > 1.
13. Déterminer les classes de conjugaison dans D8 .
14. Calculer p(D2n ), où D2n est le groupe diédral de cardinal 2n, avec n > 1.
15. Vérifier que p(H8 ) = 5/8, où H8 = {±1, ±i, ±j, ±k} est le groupe des quater-
nions de Hamilton, défini par les relations
i2 = j 2 = k 2 = ijk = −1.
13
3. Générateurs de SL2 (Z)
(i) Montrer que la réduction SL2 (Z) → SL2 (Z/N Z) est surjective.
(ii) En déduire l’isomorphisme SL2 (Z)/Γ(N ) ' SL2 (Z/N Z).
Ce développement propose de prouver que le groupe modulaire SL2 (Z) est engendré
par deux éléments S et T , et repose sur la compréhension de l’action de ces deux
éléments sur une matrice générique de SL2 (Z) de sorte à ramener tout élément à
l’identité par un produit de puissances de S et T . Cela en fait un très bon exemple
de méthodes utilisées pour les leçons sur les actions de groupes (101, 150), plus
particulièrement du groupe linéaire (106), ainsi que sur les systèmes générateurs
de groupes (108). Le développement utilise fortement l’aspect arithmétique des
entrées des matrices, et repose sur l’algorithme d’Euclide : en effet, la preuve
du résultat de la question a) n’est qu’une traduction matricielle de l’algorithme
d’Euclide, qui peut être réalisé par multiplications successives par des matrices S
ou T . Cela justifie la présence de ce développement dans les leçons dédiant une
partie au pgcd (122 et 142). Enfin, la question b) est un problème de relèvement
d’une matrice de SL2 (Z/N Z) dans SL2 (Z), qui demande l’intervention explicite
des relations de congruence ainsi que l’utilisation d’une identité de Bézout, faisant
une bonne illustration de la leçon 122 sur les anneaux Z/N Z.
Correction.
a) Soit G = hS, T i le sous-groupe de SL2 (Z) engendré par S et T . Regardons
l’effet des matrices S et T n , pour n > 1, sur une matrice générique de M2 (Z).
a b
Pour tous a, b, c, d ∈ Z, en notant M la matrice c d , on a les expressions
! !
−c −d n a + nc b + nd
SM = et T M = . (1)
a b c d
Considérons une telle matrice M dans SL2 (Z). Quitte à permuter a et c en valeur
absolue, ce qui est possible en multipliant à gauche par S d’après la première
opération dans les relations (1), on peut supposer que |a| > |c|. Supposons
que c 6= 0. La division euclidienne de a par c s’écrit a = cq + r pour un certain
14
Groupes, actions et représentations
entier q ∈ Z avec les conditions 0 6 r < |c|. Par le calcul (1), on a donc que T −q M
est de la forme
! !
a − qc ? r ?
T −q M = = ∈ SL2 (Z).
c ? c ?
L’élément en place (1, 1) de cette matrice est donc en valeur absolue strictement
inférieur à l’élément en place (2, 1). En multipliant à gauche par la matrice S, on
permute ces deux éléments au signe près, de sorte que l’on a strictement réduit, par
des multiplications à gauche par des matrices de G, la valeur absolue de l’élément
en place (2, 1). Tant que l’élément en (2, 1) est non nul, on peut itérer la procédure
en utilisant la division euclidienne, la multiplication par une puissance de T puis
la multiplication par S pour continuer à diminuer strictement la valeur absolue
de l’entrée (2, 1). Puisqu’il s’agit d’entiers, l’algorithme termine par une valeur
nulle en un nombre fini d’étapes. De plus, l’exécution de l’algorithme correspond
à une multiplication à gauche par un produit fini de puissances de S et T , qui est
donc une certaine matrice de G.
La matrice obtenue a son coefficient en place (2, 1) nul, est inversible et est à
coefficients entiers, de sorte qu’elle est de la forme
!
ε m
avec ε ∈ {−1, 1} et m ∈ Z. (2)
0 ε
Par définition de Z/N Z, il existe des entiers a, b, c, d ∈ Z qui sont des antécé-
dents de ā, b̄, c̄, d¯ par la réduction modulo N respectivement. Par définition de
SL2 (Z/N Z), on a ad − bc ≡ 1 modulo N , de sorte que pgcd(c, d, N ) = 1 par le
théorème de Bézout. Il existe alors des entiers c0 et d0 tels que, modulo N ,
c0 ≡ c, d0 ≡ d, pgcd(c0 , d0 ) = 1. (3)
ad − bc = 1 + kN.
15
3. Générateurs de SL2 (Z)
Puisque c et d sont premiers entre eux, il existe par le théorème de Bézout des
entiers u, v ∈ Z tels que
ud − vc = −k. (4)
On note alors a0 = a + uN et b0 = b + vN et on considère la matrice
!
a0 b0
M0 = .
c d
M 7−→ M
admet exactement Γ(N ) comme noyau. De plus, par la question précédente φ est
surjectif. On obtient ainsi, par le premier théorème d’isomorphisme,
Commentaires.
© Le groupe SL2 (Z) est fondamental en géométrie comme en théorie des nombres :
il joue en dimension 2 le rôle que Z joue dans R en dimension 1. Il s’agit du groupe
des isométries du demi-plan de Poincaré H muni de sa métrique hyperbolique,
l’une des représentations de la géométrie hyperbolique. Il apparaît donc comme
un objet central dans l’étude des réseaux ainsi que des fonctions vérifiant des
propriétés de périodicité sur des réseaux, comme les formes modulaires de la
théorie des nombres, qui sont des fonctions quasi-SL2 (Z)-périodiques. On pourra
se référer au Développement 81 et aux commentaires qui le suivent.
© Il existe une autre preuve classique, purement géométrique, de ce résultat, voir
par exemple [Ser67]. Cette dernière preuve fait de plus apparaître naturellement
le domaine fondamental classique de la surface modulaire H/SL2 (Z). Plus pré-
cisément, l’action de SL2 (Z) sur le demi-plan de Poincaré est donnée par les
homographies, pour z ∈ H et une matrice explicite de SL2 (Z),
!
a b az + b
·z = .
c d cz + d
16
Groupes, actions et représentations
Questions.
1. Interpréter l’algorithme de la question a) en termes d’algorithme d’Euclide.
Donner une borne sur le nombre d’étapes requises dans l’exécution de cet algo-
rithme (en comptant la division euclidienne comme une seule opération).
2. Justifier la forme (3) obtenue pour c0 et d0 à la question b)(i).
3. Soit M = ( 18 14
4 2 ) ∈ SL2 (Z/21Z). Trouver une matrice M0 ∈ SL2 (Z) telle que
l’on ait M0 ≡ M modulo 21.
4. Montrer que l’indice de Γ(N ) dans SL2 (Z) est fini.
5. Montrer que SL2 (Z/N Z) est engendré par deux éléments d’ordre N .
6. Montrer que le sous-groupe engendré par S et T 2 est d’indice 3 dans SL2 (Z).
7. Montrer que SL(2, Z) agit transitivement sur Z2 \{(0, 0)}.
17
4. Ensembles de transpositions engendrant Sn
Correction.
a) Soit C une composante connexe de GP . On doit montrer que :
∀µ ∈ P, µ(C) ⊂ C.
18
Groupes, actions et représentations
19
4. Ensembles de transpositions engendrant Sn
de sorte que la propriété est vraie pour |A| = m. Cela montre par récurrence que
l’inégalité (2) est vraie quel que soit le cardinal de A et clôt la preuve.
Commentaires.
© Il est possible de démontrer le résultat de la question c) sans utiliser la relation
c > |S| − |A|. Nous présentons ci-après une telle preuve alternative.
Montrons par récurrence forte qu’un graphe connexe possédant n sommets a au
moins n − 1 arêtes. C’est évident pour n = 1. Soit N > 1 ; supposons la propriété
vraie pour tous les entiers n ∈ J1, N K et considérons un graphe non orienté connexe
G = (S, A) ayant N + 1 sommets. Soit s un sommet de G et d(s) son degré,
c’est-à-dire le nombre d’arêtes qui sont issues de s. On considère le sous-graphe
G0 de G dont l’ensemble des sommets est S \ {s} et dont les arêtes sont les arêtes
de G qui ne sont pas issues de s. On partitionne G0 en ses composantes connexes
notées Gi = (Si , Ai ) où i ∈ J1, pK, si bien que :
p
X p
X
|S| = |Si | + 1 et |A| = |Ai | + d(s). (3)
i=1 i=1
20
Groupes, actions et représentations
Questions.
1. Expliquer comment on déduit du fait que µ(j) = µ ◦ σr ◦ . . . ◦ σ1 (i) qu’il existe
un chemin de i à µ(j) dans GP dans la question a).
2. Expliquer pourquoi le fait que C soit stable par σ pour tout σ ∈ Sn implique
que C = J1, nK dans la question a).
3. Comment définit-on les composantes connexes d’un graphe non orienté ?
4. Tout élément d’un groupe s’écrit-il comme produit des éléments d’une de ses
parties génératrices ?
5. Justifier que dans un graphe fini connexe, il existe pour n’importe quel choix
de sommets i et j distincts un chemin sans boucle entre i et j.
6. Pour tout i ∈ N∗ , on note r(i) l’unique entier de J1, nK congru à i modulo n.
3 3
4 2 4 2
5 1 5 1
6 8 6 8
7 7
Cas P = ir(i + 1), i ∈ J1, nK . Cas P = ir(i + 2), i ∈ J1, nK .
3 3
4 2 4 2
5 1 5 1
6 8 6 8
7 7
Cas P = ir(i + k), i ∈ J1, nK . Cas P = 1i, i ∈ J2, nK .
21
4. Ensembles de transpositions engendrant Sn
Dire si P génère Sn dans chacun des cas suivants (les graphes GP correspondants
sont représentés dans la Figure 1.1) :
(i) P = ir(i + 1), i ∈ J1, nK ,
(ii) P = ir(i + 2), i ∈ J1, nK ,
(iv) P = 1i, i ∈ J2, nK .
11. Décrire les cas d’égalité dans la relation c > |S| − |A| démontrée dans la
question c).
12. Soit σ ∈ Sn que l’on décompose en produit de cycles à supports disjoints (en
incluant les cycles de longueur 1) sous la forme σ = c1 . . . cr . On écrit σ comme
un produit de transpositions sous la forme σ = τ1 . . . τk . Montrer que k > n − r.
Indication : on pose P = {τ1 , . . . , τk }. Montrer que les orbites de J1, nK sous
l’action de σ sont contenues dans les composantes connexes de GP , puis en
déduire que r > c où c désigne le nombre de composantes connexes de GP et
conclure avec la relation (2).
22
Groupes, actions et représentations
b) En déduire que
1 1
tn = 1 − + O .
n n2
Ce développement est un résultat sur les groupes de permutations (105), qui s’insère
naturellement dans les leçons connexes 101 et 104. Le fait que le résultat concerne
des propriétés de générateurs en fait un développement original pour la leçon 108.
Les arguments de comptage présents à la première question le rendent également
bienvenu pour la leçon de combinatoire (190).
Correction.
a) Considérons une décomposition
n
G
J1, nK = Ai ,
i=1
23
5. Paires génératrices de sous-groupes de Sn
En effet, pour chaque j ∈ J1, nK, on peut choisir librement les restrictions des
permutations x|Aj et y|Aj au sein de l’une de leurs orbites Aj . Le groupe en-
gendré par ces restrictions est alors un sous-groupe hx|Aj , y|Aj i de Saj agissant
transitivement sur Aj , donc il y a (aj !)2 taj telles paires par définition de taj .
On obtient toutes les paires (x, y) ∈ S2n en sommant, sur les décompositions
possibles de J1, nK en A1 t · · · t An , le nombre de paires (x, y) ∈ S2n qui ont
exactement cette décomposition comme modèle. Cela donne
n n
X n! Y X Y (i!ti )ni
n!2 = n ((i!)2 ti )ni = n! ,
(ni )i
Y
ni i=1 (ni )i i=1
ni !
(i!) ni !
i=1
P
où les sommes sont sur les (n1 , . . . , nn ) tels que ni > 0 et i ini = n. En multipliant
par l’indéterminée X n et en sommant sur n > 0, on obtient l’identité entre séries
formelles
+∞ n
X X X Y (i!ti )ni
n!X n = Xn
n>0 n=0 (ni )i i=1
ni !
+∞ n n Y +∞
+∞
X X Y (i!ti )ni Y ni X (i!ti X i )j
= Xi = (1)
n=0 (ni )i i=1
ni ! i=0 i=0 j=0
j!
+∞
Y X
= exp(i!ti X i ) = exp i!ti X i .
i=0 i>0
d’après la relation (1). En particulier, en écrivant l’égalité entre les deux termes
d’ordre n − 1, on obtient l’identité voulue :
n n
!−1
1 X X n
n= i!(n − i)!iti = iti .
n! i=1 i=1
i
24
Groupes, actions et représentations
Pn−1 n−1
Soit cn = i=1 i i. On a, par la question a),
n
!−1 n−1
!−1
X n X n
rn = n − ntn = iti − ntn = iti (2)
i=1
i i=1
i
n−1
!−1 n−1
!−1
X n X n
= i− ri
i=1
i i=1
i
n−1
!−1
X n
= cn − ri .
i=1
i
Les ti sont des proportions, donc on a tn 6 1 et en particulier
0 6 rn 6 cn . (3)
Il suffit donc d’obtenir une information asymptotique sur cn . Par symétrie des
coefficients binomiaux, et en effectuant le changement de variables i 7→ n − i,
n−1
!−1 n−1
!−1
X n X n
cn = i= (n − i)
i=1
i i=1
n−i
n−1
!−1 n−1
!−1 n−1
!−1
X n X n X n
=n − i=n − cn ,
i=1
i i=1
i i=1
i
de sorte que, pour n > 6 (autrement la somme apparaissant ci-après est vide),
!−1 !−1
n n−1
X n 2 n n−3
X n
cn = =1+ + .
2 i=1 i n − 1 2 i=3 i
On peut alors majorer en utilisant les bornes sur les coefficients binomiaux
! !
n n
> , pour tout 3 6 i 6 n − 3.
i 3
On obtient donc la domination
!−1 !−1
n n−3
X n n2 n 1
6 =O .
2 i=3 i 2 3 n
Il vient donc
1
cn = 1 + O
.
n
En particulier, la suite (cn )n∈N est bornée. On obtient alors par l’inégalité (3) que
la suite (rn )n∈N est également bornée. Donc il existe une constante M > 0 telle
que
X n −1
n−1 X n −1
n−1
! !
cn 1
ri 6 M = 2M =O .
i=1
i i=1
i n n
Ainsi on obtient en fin de compte, par l’expression (2) de rn ,
n−1
!−1
n 1
X
rn = cn − ri = 1 + O .
i=1
i n
25
5. Paires génératrices de sous-groupes de Sn
Commentaires.
© Ce développement repose sur des arguments typiques de combinatoire concer-
nant les permutations et les partitions d’entiers, voir par exemple [Dix96]. Notam-
ment, la première question on donne les coefficients multinomiaux à l’invariance
près par permutation des blocs de même taille.
© En pratique, la relation de récurrence obtenue à la question a) permet de
calculer récursivement les valeurs de tn . Pour donner une idée, on obtient t1 = 1,
t2 = 0.75, t3 ' 0.722, t4 ' 0.738, etc.
© Les séries considérées ne convergent bien évidemment pas : il s’agit d’une
identité entre séries formelles. L’idée est que ce n’est qu’une manière pratique
d’écrire un système infini d’identités algébriques paramétrées par n. Les identités
formelles écrites utilisent les seules des opérations algébriques de distributivité du
produit sur la somme et de commutativité de l’addition et du produit, et peuvent
donc prendre place dans l’anneau des séries formelles R[[X]]. Voir par exemple le
premier chapitre de [Car97] pour un exposé élégant, efficace et rigoureux de cette
théorie.
© Netto a conjecturé à la fin du XIXe siècle que presque toutes les paires de
permutations de Sn engendrent Sn . Dixon a été le premier à prouver cette conjec-
ture, obtenant la minoration de la probabilité pn qu’une paire de permutations
engendre Sn par
2
pn > 1 − .
(ln ln n)2
Il conjecture alors que le terme d’erreur devrait être de l’ordre de n1 . Le résultat
présenté dans ce développement, également dû à Dixon (ainsi que la classification
des groupes finis), a permis à Babai de prouver en 1989 la conjecture de Dixon :
© La quantité tn apparaît dans d’autres résultats en théorie des groupes finis. Par
exemple, un théorème dû à Hall énonce que le nombre de sous-groupes d’indice n
dans un groupe libre de rang 2 est égal à n!ntn . Un théorème de Comtet prouve
que n!ntn est le nombre de permutations de Sn+1 qui sont indécomposables, dans
le sens où elles n’envoient pas J1, mK dans J1, mK pour aucun m 6 n.
26
Groupes, actions et représentations
Questions.
1. Justifier l’identité entre séries formelles obtenue en (1).
Indication : écrire le coefficient devant le terme X n pour chaque côté de l’égalité.
2. Donner des exemples de sous-groupes transitifs et intransitifs dans S4 .
n n
3. Prouver que i > 3 pour tout i ∈ J3, n − 3K.
4. Si G est un sous-groupe transitif de Sn , montrer que G admet au moins n − 1
éléments sans point fixe.
5. Soit G un groupe fini ayant k classes de conjugaison. Montrer que le nombre
de paires (x, y) ∈ G2 telles que xy = yx est k|G|.
Indication : considérer l’action de G sur lui-même par conjugaison.
6. Donner les valeurs de t1 , t2 , t3 en utilisant le résultat de la question a).
27
6. Ordre maximum des permutations
a) Pour i ∈ J1, rK, considérons des nombres premiers distincts pi et des entiers
ei > 1. Notons m = ri=1 pei i . On pose
Q
r
pei i .
X
S(m) =
i=1
r
X
(i) Si ppcm(a1 , . . . , ar ) = m, montrer que S(m) 6 ai .
i=1
(ii) En déduire que Sn contient un élément d’ordre m si et seulement si on
a S(m) 6 n. En particulier, G(n) = max{m ∈ N : S(m) 6 n}.
P
b) Introduisons P le plus grand nombre premier tel que p<P p 6 n où la
Q
somme porte sur les nombres premiers. On pose F (n) = p<P p.
(i) Soient q1 , . . . , qs les nombres premiers divisant G(n). Montrer que
s
X
ln qi < 2 + ln F (n) + ln P.
i=1
√
(ii) Si pe | G(n) avec e > 2, montrer que p 6 2P et pe 6 2P .
c) Prouver que ln F (n) ∼ ln G(n) et le théorème de Landau :
28
Groupes, actions et représentations
Correction.
a) (i) Soient a1 , . . . , ar des entiers admettant m comme ppcm, choisis de sorte
P
que la somme i ai soit minimale. Il suffit de prouver le résultat pour un tel choix
de ai . Nous déduisons de la minimalité les propriétés suivantes :
• Pour tout i ∈ J1, rK, on a ai > 2. En effet, si l’un des ai était égal à 1, on
pourrait le retirer de la famille (a1 , . . . , as ) sans changer le ppcm mais en
diminuant strictement la somme.
• Pour tout i ∈ J1, rK, ai est une puissance de nombre premier pei i . En effet, si
ce n’était pas le cas on pourrait écrire ai = bc avec b > c > 2 et premiers
entre eux, mais dans ce cas on pourrait remplacer ai par b et c, en diminuant
strictement la somme sans changer le ppcm.
Ainsi, on obtient que chaque ai est de la forme pei i , et on en déduit
r r
ei
X X
S(m) = pi = ai .
i=1 i=1
Puisque cela est vrai pour des entiers a1 , . . . , ar ayant m pour ppcm et de somme
minimale, on en déduit que pour tous entiers a1 , . . . , ar ayant m pour ppcm on a
r
X
S(m) 6 ai .
i=1
cycles disjoints sont de longueur pei i (ceci est possible car la somme des longueurs
des cycles ne dépasse pas n). Celui-ci est alors d’ordre m (rappelons qu’un cycle
de longueur p est d’ordre p et que les pi sont des nombres premiers distincts, donc
premiers entre eux).
P
Réciproquement, s’il existe une partition n = i ai telle que ppcm(ai )i = m (ce
qui est équivalent à l’existence d’une permutation d’ordre m), alors la question
précédente assure que S(m) 6 n.
Ainsi on a, pour tout n > 1,
G(n) = max m.
S(m)6n
29
6. Ordre maximum des permutations
ln P
En multipliant l’inégalité ci-avant par P , il vient
s
X ln P ln P X ln P
qi 62 + p .
i=1
P P p6P
P
qi >P p-G(n)
p impair
Puisque la fonction x 7→ lnxx est décroissante sur [e, +∞[ (c’est ce qui justifie
d’écarter le nombre premier 2 dans la somme ci-avant), on en tire les inégalités
s s s
X X ln qi X ln P
ln qi = qi 6 qi ,
i=1 i=1
qi i=1
P
qi >P qi >P qi >P
X ln P X ln p X
p 6 p = ln p.
p6P
P p6P
p p6P
p-G(n) p-G(n) p-G(n)
p impair p impair
On obtient ainsi s
X ln P X
ln qi 6 2 + ln p.
i=1
P p6P
qi >P p-G(n)
(ii) Soit q le plus petit premier ne divisant pas G(n). Raisonnons par l’absurde
et supposons que pe > 2q et notons k le plus petit entier positif tel que q k > p. En
particulier, p < q k < pq. Soit m = q k p−1 G(n) > G(n). Puisque p - q, l’entier m
admet la même décomposition en facteurs premiers que G(n), excepté pour le q k
supplémentaire et un exposant diminué de 1 pour p. Ainsi,
S(m) = S(G(n)) + q k − pe + pe−1 . (3)
Dans les deux cas, S(m) 6 n mais m > G(n), ce qui est absurde. Ainsi, on obtient
√
que pe 6 2q. Puisque e > 2, cela implique notamment p 6 2q.
De plus, on a q 6 P : en effet, si tous les nombres premiers p 6 P divisaient G(n),
alors on aurait égalité dans (1), ce qui est absurde. Ainsi il existe un nombre
premier divisant G(n) et inférieur à√P , c’est donc en particulier le cas pour q. On
obtient finalement pe 6 2P et p 6 2P comme souhaité.
30
Groupes, actions et représentations
ln F (n) 6 ln G(n) 6 ln n0 + ln n1
√
6 2 + ln F (n) + ln P + 2P ln 2P.
Il suffit enfin de prouver que le terme dominant dans ce dernier majorant est
donné par ln F (n). Cela est une conséquence du théorème des nombres premiers,
sous la forme de l’estimation de Mertens
X
ln p ∼ P, (4)
p6P
√
qui implique que ln F (n) ∼ P , devant quoi ln P et 2P ln 2P sont négligeables.
Cela prouve donc que ln G(n) ∼ ln F (n) ∼ P , terminant la preuve du théorème
de Landau.
Commentaires.
© Ce résultat donne un équivalent pour l’ordre maximum d’un élément du groupe
symétrique Sn , et est dû à Landau en 1902, et consiste en la preuve de Mil-
ler [Mil87]. Il préfigure tout un domaine de recherche très actuel : la théorie
statistique et probabiliste des groupes, dont les résultats fondateurs sont dus à
Erdős et Turán dans les années 1960. L’idée essentielle, déjà en germe dans le résul-
tat proposé ici, est celle de la statistique de manière générale : à défaut de pouvoir
connaître parfaitement un objet, par exemple les grands groupes symétriques, il
est possible d’obtenir des résultats précis en moyenne.
© Puisque l’ordre d’un élément de Sn est le ppcm de la taille de ses cycles, la
fonction de Landau G(n) est le maximum des ordres des éléments de Sn , justifiant
l’interprétation du résultat comme un équivalent de l’ordre maximal des éléments
de Sn .
© Le développement peut paraître long à cause de la lourdeur de certaines
notations. Il ne faut pas oublier la simplicité des idées qui sont sous-jacentes :
P
ainsi, des ai tels que i ai = n forment une partition de n, c’est-à-dire un type
de décomposition en cycles d’une permutation de Sn . La fonction F (n) est un
candidat assez naturel pour G(n), puisque S(m) est petit lorsqu’il y a peu de
31
6. Ordre maximum des permutations
ln x
π(x) ,
x
dû à Tchebychev, suffit), est classique et peut être utilisé tel quel dans les autres
leçons. Il est toutefois très utile d’avoir en tête sa formulation et ses conséquences
P P
pour les sommes telles que ln p ou p qui intervient dans le développement.
Toutes les équivalences entre ces formulations découlent de sommations par parties
à partir de la forme
X x
π(x) = 1∼ .
p6x
ln x
32
Groupes, actions et représentations
En notant Rque d(li(t)) = dt/ ln(t) et en écrivant une intégration par parties pour
l’intégrale ax f (t)dε(t) on a, pour tout x > 2,
Z x Z x Z x
f (t)
f (t)dπ(t) = dt + ε(x)f (x) − ε(t)f 0 (t)dt − ε(a)f (a).
a a ln t a
Des estimations directes donnent que le premier terme est équivalent à x2 /2 ln(x)
et que les autres sont négligeables devant x2 / ln(x). On obtient ainsi
X x2
p∼ .
p6x
2 ln x
Cela donne une importance particulière aux estimations précises sur le terme
d’erreur ε(t) apparaissant dans le théorème des nombres premiers. Le théorème
des nombres premiers donne une borne de √ la forme o(t/ ln(t)), les meilleurs
résultats connus sont de la forme O(x exp(−α ln x)), et l’hypothèse de Riemann
√
est équivalente à un terme d’erreur de l’ordre de x ln x.
© La version complète du théorème de Landau est plus explicite, et donne
√
ln G(n) ∼ n ln n.
33
6. Ordre maximum des permutations
Questions.
1. La décomposition en cycles d’une permutation est-elle unique ?
2. Rappeler pourquoi l’ordre d’une permutation est le ppcm de la taille de ses
cycles.
3. Montrer que tout groupe fini peut se plonger dans un groupe symétrique. Est-ce
qu’on peut déduire de ce théorème un résultat intéressant sur l’ordre maximal
d’un groupe fini en général ?
4. En utilisant le résultat sur les sommes de nombres premiers présenté en com-
mentaires, justifier l’estimation (4).
5. Utiliser le théorème des nombres premiers pour montrer les estimations de
Mertens :
X ln p
= ln x + O(1),
p6x
p
X1 1
= ln ln x + c + O ,
p6x
p ln x
lorsque r > 1 et x1 , . . . , xr ∈ N ?
Remarque : le résultat de cette question permet d’obtenir le plus grand résultat
possible étant donné un tirage de chiffres dans le jeu « Des chiffres et des lettres ».
34
Groupes, actions et représentations
Soit n ∈ N∗ . On note
n
( )
n
X
En = (a1 , . . . , an ) ∈ J0, nK : kak = n .
k=1
n!
na = n .
Y
ak
ak ! k
k=1
|En |
pn = .
n!
35
7. Commutativité de permutations aléatoires
Correction.
Remarquons pour commencer que si σ, µ ∈ Sn , alors σµ = µσ si et seulement si
on a σ = µσµ−1 . Cette caractérisation de la commutativité sous forme de relation
de conjugaison nous servira plusieurs fois dans la suite.
On rappelle par ailleurs le fait important suivant :
σ= Ck,i .
k=1 i=1
k=1 i=1
Or tout µ Ck,i µ−1 est un k-cycle d’après (1), et on voit aisément par injectivité
de µ que les supports des µ Ck,i µ−1 sont disjoints. Il vient donc, par unicité de la
décomposition de σ en produit de tels cycles :
σ = µσµ−1 ⇔ ∀k ∈ J1, nK , ∀i ∈ J1, ak (σ)K , ∃j ∈ J1, ak (σ)K , µCk,i µ−1 = Ck,j .
En d’autres termes, µ et σ commutent si et seulement si pour tout k ∈ J1, nK,
l’ensemble des k-cycles intervenant dans la décomposition de σ en produit de
cycles disjoints est stable par conjugaison par µ.
Soient k ∈ J1, nK et i, j ∈ J1, ak (σ)K. On souhaite dans un premier temps dénombrer
les façons possibles de définir µ sur le support de Ck,i de sorte à avoir l’égalité
µCk,i µ−1 = Ck,j .
On note pour cela ck,i le plus petit élément du support de Ck,i . Alors on a l’égalité
voulue µCk,i µ−1 = Ck,j si et seulement si µ envoie ck,i sur un élément du support
de Ck,j et envoie σ m (ck,i ) sur σ m (µ(ck,i )) pour tout m ∈ J1, k − 1K. L’image par µ
des éléments du support de Ck,i est donc entièrement déterminée par le choix de
l’image µ(ck,i ). Cette image peut être choisie librement dans Ck,i , ce qui implique
qu’il existe exactement k façons différentes de définir µ sur Ck,i de sorte à avoir
µCk,i µ−1 = Ck,j .
À présent, supposons seulement k ∈ J1, nK fixé. Il existe exactement ak (σ)! façons
de permuter les k-cycles de σ entre eux, c’est-à-dire de choisir bijectivement pour
tout i l’indice j tel que µCk,i µ−1 = Ck,j .
36
Groupes, actions et représentations
Pour chacune des permutations considérées et pour chacun des ak (σ) cycles
Ck,i , on vient de voir qu’il existe k façons de définir µ sur Ck,i de façon à avoir
µCk,i µ−1 = Ck,j . Les supports des différents k-cycles Ck,i étant disjoints, il existe
exactement k ak (σ) ak (σ)! façons de définir µ sur l’union de ces supports. On a
donc :
n
−1
Y
ak (σ)! k ak (σ) ,
µ ∈ Sn : µσ = σµ = µ ∈ Sn : µσµ =σ =
k=1
|Sn |
= |Ω(σ)|
|Cσ |
n!
n = na ,
Y
ak (σ)
ak (σ)! k
k=1
37
7. Commutativité de permutations aléatoires
|En |
= .
n!
Commentaires.
© On propose une preuve plus graphique du résultat de la question b), reposant
sur l’écriture parenthésée d’un produit de cycles disjoints.
Une permutation est de type a ∈ En si et seulement si elle peut être décomposée
comme un produit contenant ak cycles de longueur k pour tout k ∈ J1, nK, tous
ces cycles étant à supports disjoints. Pour écrire une permutation de type a sous la
forme d’un tel produit, on place donc les éléments de J1, nK entre les parenthèses
suivantes :
· ··· · · | · ··· · | · ··· · | ··· | · ... · | ··· | · .
| {z } | {z } | {z }
a1 parenthèses a2 parenthèses an parenthèses
à 1 emplacement à 2 emplacements à n emplacements
38
Groupes, actions et représentations
Or :
2n
! !
2n X 2n
6 = 22n ,
n k=0
k
ce qui montre que la majoration obtenue dans le commentaire précédent est loin
d’être optimale.
© La limite obtenue ci-avant est à comparer à un résultat démontré dans le
Développement 2, le théorème de Dixon, qui stipule que si G est un groupe fini
non abélien, alors la probabilité pour que deux éléments tirés uniformément et
indépendamment dans ce groupe commutent est majorée par 5/8. En revanche,
on ne peut pas minorer cette probabilité par un réel strictement positif dans le
cas général, précisément parce que lim pn = 0.
n→+∞
Questions.
1. Rappeler pourquoi, si k ∈ J1, nK et si (x1 . . . xk ) est un k-cycle de Sn , alors
pour tout µ ∈ Sn on a
39
7. Commutativité de permutations aléatoires
n aY
k (σ)
−1
µ Ck,i µ−1 .
Y
µσµ =
k=1 i=1
40
Groupes, actions et représentations
41
8. Cyclicité des groupes d’ordre pq
Commentaires.
© Les sous-groupes de Sylow sont des sous-groupes importants du groupe G. Il
s’agit de sous-groupes de G dont le cardinal est une puissance maximale de nombre
premier : si G est de cardinal pr m où p est un nombre premier et p - m, alors un
p-sous-groupe de Sylow de G est un sous-groupe d’ordre pr .
Rappelons les trois théorèmes de Sylow. Ils ne sont plus officiellement au pro-
gramme de l’agrégation, il est donc de bon ton d’avoir une idée des outils nécessaires
à leur preuve.
• G admet un p-sous-groupe de Sylow. De plus, chaque sous-groupe de G
d’ordre une puissance de p est contenu dans un p-Sylow.
• Tous les p-Sylow de G sont conjugués dans G.
• Soit np le nombre de p-Sylow de G. Alors
np | m et np ≡ 1 mod p.
© Dans le cas d’un groupe G abélien, le résultat est immédiat. En effet, par le
théorème de structure des groupes abélien, G est isomorphe à un produit de
groupes cycliques et donc est isomorphe à Z/pqZ ou à Z/pZ × Z/qZ ; le théorème
des restes chinois assure alors que ces deux derniers groupes sont isomorphes, de
sorte que G est cyclique.
42
Groupes, actions et représentations
Questions.
1. Montrer qu’un groupe de cardinal pq n’est pas simple.
2. Pour x ∈ G, justifier que P et xP x−1 ont même cardinal.
3. Si x est d’ordre n et y est d’ordre m, et si x et y commutent, montrer que xy
est d’ordre ppcm(n, m).
4. Donner la démonstration des théorèmes de Sylow.
5. Montrer que le groupe S5 a dix sous-groupes d’ordre 3 et six d’ordre 5.
6. Montrer que tous les sous-groupes de Sylow d’un groupe fini sont abéliens si,
et seulement si, ce groupe est isomorphe au produit direct de ses sous-groupes de
Sylow.
7. Soit N distingué dans G et P un p-Sylow de N . Montrer que si P est distingué
dans N , alors il l’est dans G.
8. Soient p et q deux nombres premiers distincts, et P (resp. Q) un p-Sylow (resp.
q-Sylow) de G. Quel est le cardinal de P ∩ Q ?
9. Soit H un p-Sylow de G et soit K un sous-groupe distingué de G. Montrer que
l’intersection H ∩ K est un p-Sylow de K.
10. Montrer que les sous-groupes de Sylow d’un groupe diédral sont cycliques.
11. Soient p et q des nombres premiers distincts. Montrer qu’un groupe d’ordre p2 q
n’est pas simple.
12. Que se passe-t-il lorsque p = q ? et lorsque q ≡ 1 modulo p ?
43
9. Groupes d’ordre 105
44
Groupes, actions et représentations
n5 | 21 et n5 ≡ 1 mod 5,
n7 | 15 et n7 ≡ 1 mod 7.
45
9. Groupes d’ordre 105
Ainsi, les sous-groupes de Sylow de H sont distingués dans G. Mais ce sont des
groupes d’ordre 5 et 7, donc ce sont également des sous-groupes de Sylow de G.
Or, si un sous-groupe de Sylow est distingué, il est unique, on peut donc conclure
que n5 = 1 et n7 = 1.
e) Soient N5 et N7 les uniques 5-Sylow et 7-Sylow de G respectivement, qui
existent par la question d). Soit P un 3-Sylow de G. Puisque N7 est distingué
dans G comme unique 7-Sylow, le produit H = P N7 est un sous-groupe de G, et
il est d’ordre 21. Puisque 21 et 5 sont premiers entre eux, l’intersection N5 ∩ H
est triviale, de sorte que HN5 est de cardinal 105 ; il est donc égal à G.
On montre à présent que G = HN5 est isomorphe au produit direct H × N5 .
Introduisons l’application
H × N5 −→ HN5
(h, n) 7−→ hn
qui est clairement bijective. Montrons qu’il s’agit bien d’un morphisme, ce qui
revient à prouver que les éléments de H et de N5 commutent.
Comme N5 est un sous-groupe distingué de G, on en déduit que H agit par
conjugaison sur N5 . Cela définit un morphisme
∼ (Z/5Z)× ∼
φ : H −→ Aut(N5 ) = = Z/4Z
h 7−→ n 7→ hnh−1 .
Commentaires.
© De nombreuses propriétés élémentaires sur les groupes sont exploitées dans ce
développement. Il convient bien évidemment d’être à l’aise sur tous ces points
de détail, et d’avoir en tête les hypothèses cruciales mobilisées à chaque étape
(notamment la particularité du caractère distingué d’un sous-groupe, impliquant
que les classes à droite ou à gauche sont égales et forment un groupe). Il est donc
aisé d’adapter le développement selon ses préférences, en détaillant plus ou moins
certains arguments lors de sa présentation. Plusieurs questions demandant de
telles clarifications font suite à ces commentaires.
© Les théorèmes de Sylow ne sont plus officiellement au programme de l’agrégation,
ce qui justifie le niveau de difficulté annoncé du développement. Il va de soi qu’un
candidat présentant ce développement doit maîtriser leurs énoncés, que nous
rappelons ici :
46
Groupes, actions et représentations
Ces théorèmes constituent un outil important pour l’étude des groupes finis et
ont toute leur place dans les leçons 101, 103 et 104.
© Le résultat du développement est satisfaisant dans l’esprit de la classification
des groupes finis, puisqu’on a ramené l’étude des groupes d’ordre 105 à celle des
groupes d’ordre 21, qui sont plus petits et donc plus simples à étudier.
© On admet pour ce développement deux résultats du même type, plus faciles
à démontrer : les groupes d’ordre 35 sont cycliques et il n’y a que deux groupes
d’ordre 21 à isomorphisme près. Ils peuvent être mentionnés dans le plan comme
premiers exemples d’illustration des théorèmes de Sylow.
© Avec des arguments de comptage similaires à ceux de la preuve, on prouverait
qu’il n’existe que deux groupes d’ordre 21 à isomorphisme près, ce qui permet
de conclure grâce à la question e) qu’il n’existe que deux groupes d’ordre 105 à
isomorphisme près. Bien évidemment, il y a le groupe cyclique d’ordre 21. On
peut par ailleurs montrer qu’il existe un unique groupe d’ordre 21 non abélien.
Plus généralement, ce résultat est valable pour tous les cardinaux de la forme pq
lorsque p et q sont deux nombres premiers tels que p|(q − 1).
© La classification des groupes finis a été une des grandes aventures du XXe
siècle. Dès qu’un groupe G possède un sous-groupe distingué N , il est possible de
considérer son groupe quotient G/N et l’étude de G se ramène essentiellement
à celle des groupes plus petits N et G/N . En effet, G est isomorphe au produit
semi-direct N o G/N , voir par exemple [PCD96]. C’est le dévissage donné par la
suite exacte
1 → N → G → G/N → 1.
On se ramène donc à l’étude des groupes finis qui n’ont pas de sous-groupes
distingués non triviaux : ce sont les groupes simples. La classification des groupes
finis simples a été l’œuvre colossale de nombreux mathématiciens, et a été achevée
à travers un travail de compilation virtuose de Gorenstein [Gor82], répertoriant
tous les cas possibles après de nombreuses réductions du problème. La preuve
entière constitue une somme d’une dizaine de milliers de pages, et pose encore
aujourd’hui des problèmes épistémologiques concernant la valeur d’un tel résultat,
que personne hormis peut-être Gorenstein n’a pu lire minutieusement. Parmi les
outils essentiels de cette classification se trouvent les théorèmes de Sylow, qui
47
9. Groupes d’ordre 105
donnent des informations très précises sur un groupe à partir de la seule donnée
de son ordre. Ce développement en est une bonne illustration.
© Nous profitons de cette discussion pour citer le théorème de Feit-Thompson,
énonçant que tout groupe fini simple non cyclique est d’ordre pair. La longue
et technique preuve de ce théorème a été publiée dans un volume entier d’une
revue de recherche et a été formalisée puis vérifiée par l’assistant de preuve Coq,
soulevant aussi des questions épistémiques.
Questions.
1. S’il n’existe qu’un unique p-Sylow, pourquoi est-il distingué ?
2. Si N est distingué dans G et si X est un sous-ensemble de G/N , montrer que
la préimage de X par la projection G → G/N est de cardinal un multiple de |N |.
Sous quelle condition la préimage a-t-elle pour cardinal |X| × |N | ? Donner un
exemple explicite de cas où l’égalité n’est pas vérifiée.
Indication : quelle est la forme d’une image réciproque par cette projection ?
3. Soit p le plus petit facteur premier divisant l’ordre de G. Soit H un sous-groupe
de G d’indice p. Prouver que H est distingué.
Indication : que dire du centralisateur de H dans G ?
4. Si N est distingué dans G et H est un sous-groupe de G, montrer que HN est
un sous-groupe de G.
5. Montrer que la relation « être distingué dans » n’est pas transitive.
Indication : considérer le groupe S4 et ses sous-groupes donnés par h(12)(34)i et
{Id, (12)(34), (13)(42), (23)(41)}.
6. Si G est d’ordre 30, montrer qu’il admet un 3-Sylow et un 5-Sylow distingués.
7. Si G est d’ordre 100, montrer qu’il admet un 5-Sylow distingué.
8. Montrer que tous les sous-groupes d’ordre 35 sont cycliques.
Indication : raisonner par l’absurde et montrer que, si ce n’était pas le cas, il
existerait des éléments d’ordre 5 et d’ordre 7. Montrer qu’il n’existerait alors qu’un
unique 7-Sylow. Déduire qu’il existerait 28 éléments d’ordre 5, donc 7 sous-groupes
d’ordre 5, contrairement à la condition n5 ≡ 1 mod 5.
9. Montrer qu’il n’existe que deux groupes d’ordre 21 à isomorphisme près.
Indication : montrer qu’un tel groupe admet un unique 7-Sylow, qui est donc
distingué. Le groupe est donc isomorphe au produit semi-direct Z/7Z oφ Z/3Z
où φ est un morphisme φ : Z/3Z → Aut(Z/7Z) ∼ = Z/6Z. Il n’y en a que deux qui
conviennent, et on peut voir que les deux groupes obtenus ne sont pas isomorphes.
48
Groupes, actions et représentations
ρj : G −→ GL2 (C)
a 7−→ Aj
b 7−→ B.
(i) Vérifier que ρj définit un unique morphisme de groupes et que c’est une
représentation de G. Donner une interprétation géométrique de ρj .
(ii) Montrer que ρj est irréductible pour tout j ∈ J1, n − 1K.
(iii) Montrer que ρj et ρk ne sont pas semblables si j, k ∈ J1, n − 1K et j =
6 k.
b) Supposons que n est impair.
(i) Combien y a-t-il de caractères irréductibles de G ?
(ii) En considérant le sous-groupe hai, trouver des caractères de G.
(iii) Dresser la table des caractères de G.
c) Supposons que n est pair.
(i) Combien y a-t-il de caractères irréductibles de G ?
(ii) En considérant le sous-groupe ha2 i, trouver des caractères de G.
(iii) Dresser la table des caractères de G.
Correction.
a) (i) Puisque G est engendré par a et b, ses éléments s’écrivent comme des
mots sur l’alphabet {a, b}. La relation supplémentaire (ba)2 = 1 peut se formuler
comme ba = a−1 b−1 de sorte que tous les éléments de G peuvent s’écrire sous
49
10. Table des caractères des groupes diédraux
la forme ar bs pour certains r, s ∈ Z. Il est aisé de voir qu’une telle écriture est
unique, de sorte que l’application ρj est entièrement définie par les images de a
et b.
Soit j ∈ J1, n − 1K. Un calcul matriciel donne Anj = B 2 = (Aj B)2 = I2 . En
particulier, les images des éléments de G par ρj satisfont les mêmes relations que
les éléments de G et notamment la même règle de réécriture que précédemment.
En particulier, pour deux éléments x = ar bs et y = at bu de G, avec r, s, t, u ∈ Z,
on a
de sorte que ρj est bien définie et est une représentation de G dans GL2 (C).
(ii) L’image du vecteur (1, 0) ∈ C2 est envoyée par Aj sur (εj , 0) et par B
sur (0, 1), qui forment une base de C2 . Ainsi, toute sous-représentation de ρj est
au moins de dimension 2 : les représentations ρj sont donc irréductibles.
(iii) Notons i 6= j deux entiers entre 1 et n/2 − 1. Si ρi et ρj étaient équivalentes,
alors ρi (g) et ρj (g) seraient conjuguées pour tout g ∈ G. Or, en particulier
avec g = a, les spectres de ρi (a) et ρj (a) sont distincts, à savoir {εi , ε−i } et {εj , ε−j }
respectivement : elles ne sont donc pas conjuguées. Ainsi, en notant ψj le caractère
irréductible associé à ρj , pour 1 6 j < n/2, on obtient certains des caractères
irréductibles de G.
b) (i) Les classes de conjugaison dans G sont :
• l’identité {1},
• les rotations {ar , a−r } pour r ∈ J1, (n − 1)/2K,
• {as b : 0 6 s 6 n − 1}.
Il y a ainsi (n+3)/2 classes de conjugaison, et donc (n+3)/2 caractères irréductibles.
Nous en connaissons déjà (n − 1)/2 qui sont associés aux ρj . Il en reste donc 2 à
obtenir.
(ii) Le groupe hai engendré par a est distingué dans G et G/hai ' Z/2Z. Cela
motive l’introduction des deux caractères distincts définis en relevant des deux
caractères de Z/2Z, à savoir le caractère trivial χ1 = 1 et le caractère
(
1 si g = ar , r > 1,
χ2 : g ∈ G 7→
−1 si g = ar b, r > 1.
50
Groupes, actions et représentations
g 1 ar b
χ1 1 1 1
χ2 1 1 −1
ψj 2 ε + ε−jr
jr 0
Nous avons ainsi déterminé tous les caractères irréductibles de G.
c) Notons n = 2m avec m ∈ N.
(i) Les classes de conjugaison de G sont, pour r ∈ J1, (n − 1)/2K,
• l’identité {1},
• les rotations {ar , a−r },
• {as b : s pair},
• {as b : s impair}.
Il y a ainsi m + 3 caractères irréductibles de G, et nous en connaissons déjà m − 1
qui sont donnés par les caractères associés aux représentations irréductibles ρj . Il
en reste donc 4 à obtenir.
(ii) Considérons le sous-groupe ha2 i de G engendré par a2 . C’est un sous-groupe
distingué dans G et
Cela motive la définition des quatre caractères relevés des caractères bien connus
de Z/2Z × Z/2Z. Les quatre caractères de Z/2Z × Z/2Z sont donnés par les images
possibles de chaque générateur (1, 0) et (0, 1), et elles sont égales à ±1. On peut
alors déduire des caractères sur G à partir de ceux-ci, en les définissant comme
triviaux sur ha2 i. Ils sont irréductibles puisque de dimension 1.
(iii) On obtient la table de caractères suivante, où r parcourt J1, m − 1K et j
parcourt J1, n − 1K :
g 1 ar b ab
χ1 1 1 1 1
χ2 1 1 −1 −1
χ3 1 (−1)r 1 −1
χ4 1 (−1)r −1 1
ψj 2 εjr + ε−jr 0 0
Nous avons ainsi déterminé tous les caractères irréductibles de G.
Commentaires.
© Les représentations d’un groupe sont un moyen de réaliser le groupe comme un
groupe de matrices, et en particulier d’en tirer une intuition très géométrique. Les
représentations ρj considérées ici sont les représentations naturelles pour le groupe
diédral, défini comme le groupe des isométries d’un polygone régulier du plan. Il
est engendré par une rotation d’ordre n, qui est exactement l’isométrie associée à
la matrice Aj , et par la symétrie associée à la matrice B. Travailler formellement
51
10. Table des caractères des groupes diédraux
52
Groupes, actions et représentations
Questions.
1. Justifier que l’écriture des éléments de G sous la forme ar bs avec r, s ∈ Z est
unique.
2jπ
2. En notant θj = n , montrer que Aj est conjuguée à la matrice de rotation
!
cos θj − sin θj
.
sin θj cos θj
53
11. Théorème pa q b de Burnside
54
Groupes, actions et représentations
∀x ∈ Ui , π(g)x = ωi x.
Or, g étant d’ordre n, π(g) est également d’ordre divisant n, de sorte que les ωi
sont des racines n-ièmes de l’unité. On obtient ainsi une base de diagonalisation
de π(g) dont les valeurs propres associées sont des racines de l’unité. Puisque la
dimension de Vπ est égale à χ(1) et que les Ui sont de dimension 1, on en déduit
que dimVπ = k = χ(1). On obtient que la trace de π(g), c’est-à-dire χ(g) par
définition, est la somme des valeurs propres de π(g), donc une somme de χ(1)
racines de l’unité. Puisque les racines de l’unité sont de module 1, l’inégalité
triangulaire permet de conclure.
(ii) Supposons que x = χ(g)/χ(1) est un entier algébrique et que 0 < χ(g)
χ(1) < 1.
Montrons qu’alors χ(g) = 0, ce qui est contradictoire. Soit P le polynôme minimal
de x, écrit sous la forme
C’est un élément qui commute avec tous les π(x) pour x ∈ G, donc par le lemme
de Schur, il existe un scalaire λ ∈ C tel que π(C) = λId sur Vπ .
En prenant la trace de cette égalité, puisque χ ne dépend que de la classe de
conjugaison de g, il vient λχ(1) = |C|χ(g). De plus |C| = |G/CG (g)|, de sorte que
la quantité λ = |C|G|χ(g)
G (g)|χ(1)
est celle recherchée.
Il reste à montrer que λ est algébrique. Par ce qui précède, λ est une valeur propre
de π(C). Introduisons h1 , . . . , hn les éléments de G, et les coefficients aij ∈ {0, 1}
tels que
r
X
π(hi )π(C) = aij π(hj ). (2)
j=1
55
11. Théorème pa q b de Burnside
Puisque λ est valeur propre de π(C), il est valeur propre de la matrice A = (aij )i,j
qui est à coefficients entiers. Il est donc racine du polynôme det(A − XIn ) qui est
à coefficients entiers. On conclut donc que λ est algébrique.
b) Soit g ∈ G. Notons G · g sa classe de conjugaison, et supposons |G · g| = pa > 1.
(i) La classe de conjugaison de g n’est pas trivialement réduite à g par hypothèse,
donc G n’est pas abélien et g =6 1. Notons χ1 , . . . , χk les caractères irréductibles
de G avec χ1 = 1. Les relations d’orthogonalité énoncent que
k
X
1+ χi (g)χi (1) = 0.
i=2
Supposons que chaque χi (1)/p est un entier algébrique si χi (g) est non nul.
Les χi (g) sont des entiers algébriques comme sommes de racines de l’unité. Comme
les entiers algébriques forment un anneau, on déduirait que 1/p est un entier
algébrique par l’équation (3). En particulier, puisqu’il est rationnel, il devrait être
entier, ce qui est une contradiction. Ainsi, l’un des χi (1)/p n’est pas un entier
algébrique, pour un i tel que χi (g) est non nul. En particulier, il existe un i tel
que p - χi (1) et χi (g) 6= 0, comme voulu.
(ii) La question précédente implique que |G · g| = pa et χ(1) sont premiers entre
eux. Il existe donc par l’identité de Bézout des entiers u et v tels que
u|G · g| + vχ(1) = 1.
Par la question a)(i), on sait que χ(g) est un entier algébrique comme somme
de racines de l’unité. Par la question b)(i), |G|χ(g)/|CG (g)|χ(1) est un entier
algébrique. Ainsi, le membre de gauche de (4) est un entier algébrique, et il est
non nul puisque χ(g) 6= 0. On obtient alors que χ(g)/χ(1) est un entier algébrique
non nul, et par suite la question a)(ii) assure que |χ(g)/χ(1)| = 1.
(iii) Soit π une représentation de G de caractère χ. Puisque |χ(g)| = χ(1) par
la question précédente, le cas d’égalité de l’inégalité triangulaire implique qu’il
existe un scalaire λ ∈ C tel que toutes les valeurs propres de π(g) sont égales à λ
et donc tel que π(g) = λId. Soit K = Ker(π) ; c’est un sous-groupe distingué de G
comme noyau de morphisme de groupes. Puisque χ n’est pas trivial, π n’est pas
trivial et donc K 6= G. Si K 6= {1}, alors G n’est pas simple car K est distingué.
Supposons alors K = {1}. Dans ce cas, π est une représentation fidèle. Or π(g)
est une homothétie, donc commute avec tous les autres π(h) pour h ∈ G. Puisque
56
Groupes, actions et représentations
la représentation est fidèle cela implique que g commute avec tous les h ∈ G,
autrement dit on a g ∈ Z(G). Ainsi, le centre Z(G) de G n’est pas trivial, et
puisque c’est un sous-groupe distingué de G il vient que G n’est pas simple. Ainsi,
dans tous les cas nous avons prouvé que G n’est pas simple.
c) Supposons que a ou b est nul. Dans ce cas, l’ordre de G est puissance d’un
nombre premier donc son centre n’est pas trivial. Soit g ∈ Z(G) d’ordre premier,
qui existe par les théorèmes de Sylow. Le groupe hgi est alors distingué dans G et
non trivial, donc G n’est pas simple.
Supposons a > 1 et b > 1. Par les théorèmes de Sylow, il existe un sous-groupe H
de G d’ordre q b . Le même argument que précédemment implique que Z(H) 6= {1}.
Soit alors g ∈ Z(H)\{1}. On a que H est un sous-groupe de CG (g), en particulier
il existe un certain 0 6 u 6 b tel que la classe de conjugaison de g vérifie
|G · g| = |G/CG (g)| = pu .
Soit u = 0 et alors g ∈ Z(G), de sorte que G n’est pas simple comme précédemment.
Soit u > 1, et G contient la classe de conjugaison de g qui est de cardinal pu > 1.
La question précédente implique alors que G n’est pas simple, terminant la preuve.
Commentaires.
© Ce développement est très modulable quant à son contenu de sorte à se concen-
trer sur les propriétés des caractères, ou au contraire sur les propriétés des groupes
ou des entiers algébriques. Des résultats tels ceux des questions a)(i) ou b)(i)
peuvent être admis et intégrés au plan.
© La question a)(i), bien que classique, regorge de propriétés sur les caractères,
les représentations et la réduction des endomorphismes. Une version présentée en
détails de ce résultat pourrait constituer un développement de niveau F.
© Ce développement utilise le langage des actions de groupes qui admet plusieurs
conventions et formalismes. Ici, l’action considérée est souvent celle de G agissant
sur lui-même par conjugaison. On note ainsi G · g la classe de conjugaison de
g ∈ G et CG (g) son stabilisateur, appelé le centralisateur dans le cas de l’action
par conjugaison.
© La question a)(ii) utilise un résultat non trivial sur les conjugués au sens de
la théorie algébrique des nombres. Si un nombre x est algébrique, alors il est
racine d’un polynôme à coefficients entiers, et admet en particulier un polynôme
minimal P . Les conjugués de x sont alors les autres racines de P . Le résultat
utilisé est le lemme suivant :
Si x et y sont des nombres algébriques, les conjugués de x + y sont de
la forme x0 + y 0 où x0 (resp. y 0 ) est un conjugué de x (resp. y).
57
11. Théorème pa q b de Burnside
© Un des grands enjeux des mathématiques du XXe siècle a été la classification des
groupes finis. Si un groupe G n’est pas simple, il admet un sous-groupe distingué
non trivial H, de sorte que l’étude du groupe se réduit à celle des deux groupes
plus petits H et G/H. Ainsi, le problème se réduit essentiellement à comprendre
les groupes simples, et le résultat de Burnside énonce qu’il n’y a pas de groupe
simple de cardinal pa q b avec a + b > 2.
© Toutes les représentations considérées dans ce développement sont des repré-
sentations sur un C-espace vectoriel. L’usage est généralement de confondre la
représentation π et l’espace Vπ sur lequel la représentation agit, de manière à
alléger les notations. Nous avons ici opté pour conserver la distinction entre les
deux objets, mais il est évident que le lecteur averti peut faire la confusion en
conservant à l’esprit la signification de ce qu’il fait. De même pour la notation
des représentations comme C[G]-modules, où gv est la notation choisie pour
g · v = π(g)v.
© L’un des résultats élémentaires majeurs de la théorie des représentations est le
lemme de Schur, utilisé dans ce développement. Puisque ce résultat n’est pas au
programme officiel de l’agrégation, nous le rappelons ici, bien qu’il ait une place
naturelle dans toute leçon traitant de théorie des représentations :
∀g ∈ G, ∀v ∈ Vπ , φ(π(g)v) = π 0 (g)φ(v).
58
Groupes, actions et représentations
{1} / G1 / · · · Gs = H
{1} = Gs /H / Gs+1 /H / · · · / Gr /H = G/H
où tous les quotients Gi /Gi−1 sont cycliques d’ordre premier. Alors on peut
composer les séries de résolubilité pour obtenir la série de résolubilité de G
{1} / G1 / · · · / Gr = G.
Questions.
Soit G un groupe fini, et χ un caractère irréductible de G.
1. Montrer que si |χ(g)| = χ(1) alors π(g) est une homothétie.
2. Justifier pourquoi π(C) = λId à partir du lemme de Schur.
3. Expliquer pourquoi les coefficients aij dans a)(iii) sont parmi 0 ou 1.
4. Expliciter un vecteur propre considéré pour la matrice A en a)(iii).
5. Justifier l’identité (2).
6. Si G est de cardinal la puissance d’un nombre premier, montrer que Z(G) 6= {1}.
7. Dans un p-groupe non trivial, existe-t-il toujours un élément d’ordre premier ?
8. Rappeler pourquoi les entiers algébriques sur un corps forment un anneau.
9. Si x et y sont deux nombres algébriques, montrer que les conjugués de x + y
sont les nombres de la forme x0 + y 0 où x0 est un conjugué de x et y 0 est un
conjugué de y.
10. Prouver le lemme de Schur rappelé en commentaires.
11. Montrer que si G est abélien, alors ses représentations sont des caractères.
12. Montrer que l’élément π(C) défini en (1) commute avec π(g), pour tout g ∈ G.
13. Montrer qu’un entier algébrique qui est de plus un nombre rationnel est entier.
59
Anneaux, corps et
théorie des nombres
P = am X m + · · · + a1 X + a0 , m > 1, a0 , . . . , am ∈ Z.
(ii) Supposons qu’il existe un nombre premier p et un entier b > 2 tels que
le développement en base b de p est donné par
p = am bm + · · · + a1 b + a0 = P (b), a0 , . . . , am ∈ J0, b − 1K .
63
12. Théorème de Cohn
ce qui donne |α| < H + 1, finissant de prouver l’inégalité pour tous les cas.
(ii) Supposons que P soit réductible dans Z[X]. Cela signifie qu’il existe deux
polynômes non constants A, B ∈ Z[X] tels que P = AB. En évaluant cette égalité
en n, puisque P (n) est premier, on en déduit que A(n) ou B(n) est égal à ±1.
Quitte à échanger A et B, on peut supposer que A(n) = ±1. Puisque A est scindé
dans C[X], on peut écrire
k
Y
A=a (X − αi ), (1)
i=1
Puisque A(n) = ±1, ce n’est pas possible. On en déduit que P est irréductible
dans Z[X].
64
Anneaux, corps et théorie des nombres
b) (i) De deux choses l’une : soit Re(α) 6 0, soit Re(α) > 0. Si Re(α) 6 0, l’une
des conditions voulues est déjà satisfaite. Considérons désormais le cas Re(α) > 0.
Considérons deux cas possibles.
• Soit |α| 6 1, et il est clair que |α| < ρH .
• Soit |α| > 1. Dans ce cas, pour tout z ∈ C tel que |z| > 1 et Re(z) > 0, on peut
utiliser l’inégalité triangulaire et les hypothèses faites sur am et am−1 pour écrire
P (z) am−1 a0
m
= am + + ··· + m
z z z
am−1 1 1
> am + −M + · · · +
z |z|2 |z|m
+∞
am−1
|z|−k
X
> am + −M
z k=2
am−1 M
> Re am + − 2
z |z| − |z|
P (z) M |z|2 − |z| − M
> 1 − = . (2)
zm |z|2 − |z| |z|2 − |z|
|α|2 − |α| − M
< 0.
|α|2 − |α|
Le dénominateur de cette fraction est positif car |α| > 1, donc le numérateur est
nécessairement négatif. Ainsi le module de α est situé entre les deux racines du
polynôme X 2 − X − M . La plus grande de ces racines est ρH , par conséquent on
a |α| < ρH .
(ii) Supposons que P est réductible dans Z[X]. Il existe donc A, B ∈ Z[X] non
constants tels que P = AB. Puisque P (b) = A(b)B(b) est premier, A(b) ou B(b)
est égal à ±1 et, quitte à permuter A et B, on peut supposer que A(b) = ±1. Par
définition de la décomposition en base b, chaque coefficient ai est entre 0 et b − 1,
si bien que l’on peut appliquer le résultat de la question b)(i) avec M = b − 1 :
les zéros de P sont soit de partie réelle négative, soit de valeur absolue inférieure
à ρb−1 .
Si pour une telle racine α, on est dans le cas Re(α) 6 0, alors on peut écrire les
minorations |b − α| > Re(b − α) = b − Re(α) > b > 1. Sinon, |α| 6 ρb−1 par la
question b)(i) On vérifie alors que
p
1+ 1 + 4(b − 1)
|α| < 6 b − 1.
2
65
12. Théorème de Cohn
Nous avons supposé que |arg(α)| < π/4, donc Re( α1 ) > 0 et Re( α12 ) > 0, de sorte
que, en remplaçant z par la racine α dans ce qui précède, on obtient
P (α) 1 |α|3 − |α|2 − 1
0= > 1 − = .
αm |α|2 (|α| − 1) |α|2 (|α| − 1)
Le numérateur et le dénominateur de la fraction ci-avant sont donc de signes
opposés. Une étude de fonction prouve que le polynôme X 3 − X 2 − 1 admet une
unique racine réelle, qui est positive et inférieure à 3/2. Ainsi, compte tenu du
signe du terme dominant, on en déduit que |α| < 3/2.
(ii) Supposons qu’il existe A, B ∈ Z[X] non constants tels que P = AB.
Puisque P (2) est premier, quitte à permuter A et B, on peut supposer que
|A(2)| = 1. Soit v > 0 tel que Re(α) < v. En notant d > 1 le degré de A, on a
m
Y
A(X + v) = c (X + v − αi ), où α1 , . . . , αm ∈ C.
i=1
66
Anneaux, corps et théorie des nombres
67
12. Théorème de Cohn
Questions.
1. Détailler les études de fonctions mentionnées aux questions b)(i) et c)(i).
2. Pourquoi le raisonnement utilisé pour b > 3 ne s’applique-t-il plus pour b = 2 ?
3. Montrer que la réciproque à la conjecture de Buniakowski est vraie. Autrement
dit, montrer que si un polynôme P ∈ Z[X] prend une infinité de fois une valeur
première, alors P est irréductible.
4. Rappeler la preuve du lemme de Gauss : un polynôme unitaire de Z[X] est
irréductible dans Q[X] si, et seulement si, il est irréductible dans Z[X]. Cette
propriété est plus généralement vraie pour les polynômes primitifs, i.e. dont le
plus grand commun diviseur de ses coefficients vaut 1. Donner un contre-exemple
dans le cas où le polynôme n’est pas primitif.
5. Montrer que (X − 1)(X − 2) · · · (X − n) − 1 est irréductible dans Z[X].
6. Soit P ∈ C[X]. Montrer que les racines de P 0 sont contenues dans l’enveloppe
convexe des racines de P (théorème de Gauss-Lucas).
Indication : on pourra considérer la dérivée logarithmique P 0 /P , et l’évaluer en
une racine de P 0 qui n’est pas racine de P .
68
Anneaux, corps et théorie des nombres
Correction.
a) On souhaite prouver que X 2 divise le polynôme P (X +a)−P (a)−P 0 (a)X (cette
quantité peut être interprétée comme l’erreur dans la première approximation
affine de P ). Par linéarité en P de cette expression, il suffit de le prouver le
résultat pour les monômes X n pour n > 1. On a alors par la formule du binôme
de Newton, pour tout n > 1 et P = X n ,
69
13. Lemme de Hensel
et cette quantité est divisible par X 2 puisque que chacun de ses termes l’est. On
obtient ainsi le résultat voulu.
b) Par la question précédente, il existe un polynôme Q ∈ Z[X] tel que
Commentaires.
© L’un des grands thèmes de l’arithmétique et de la théorie des nombres est
l’étude des équations diophantiennes. Un outil puissant pour leur étude est la
possibilité de les étudier modulo les puissances de nombres premiers pk et, en
s’autorisant des puissances tendant vers l’infini, dans les nombres p-adiques Qp ,
voir Développement 23. L’espoir est de pouvoir en tirer des informations sur les
solutions globales, dans Z ou Q. Un résultat dans cette direction est le principe
de Hasse, qui est un principe local-global pour les équations diophantiennes
polynomiales de degré deux :
70
Anneaux, corps et théorie des nombres
© Toutefois, ce principe cesse d’être vérifié pour les degrés supérieurs. Déjà pour
le degré trois (le problème est alors celui de trouver les points rationnels d’une
courbe elliptique), certaines équations admettent des solutions locales, modulo
tout pk , et des solutions réelles, mais aucune solution rationnelle. C’est le cas par
exemple pour l’équation de Selmer,
3x3 + 4y 3 + 5z 3 = 0.
71
13. Lemme de Hensel
© Nous donnons ici une version plus fine du lemme de Hensel, utilisant la valeur
absolue p-adique et les nombres p-adiques :
Questions.
1. Soit p un nombre premier impair. Montrer que si u ∈ Z∗p est un carré modulo p,
alors c’est un carré dans Zp . Généraliser ce résultat à toute racine simple d’un
polynôme unitaire.
2. Trouver les solutions de l’équation
x3 − 2x ≡ 1 mod 125.
72
Anneaux, corps et théorie des nombres
Cet exercice trouve naturellement sa place dans les leçons 123 et 144, grâce aux
propriétés des corps finis utilisées dans la preuve du théorème de Chevalley-
Warning et à la manipulation de racines de polynômes. De plus, en remplaçant la
question e) par une sélection des questions 2 à 5 ci-après, on peut aussi illustrer
l’utilisation de la méthode polynomiale en combinatoire (190) et en théorie des
graphes (925).
Correction.
a) L’énoncé revient à montrer qu’un polynôme P à coefficients dans un corps, de
degré au plus d et admettant d + 1 racines est nul.
Si d < 0, alors P = 0 par définition du degré. Soit d ∈ N. Supposons que la
propriété ci-avant est vraie pour tout polynôme de degré strictement inférieur à d
et montrons qu’elle est vraie pour tout polynôme de degré d. Soit P ∈ K[X1 ] de
degré d ayant d + 1 racines. Soit α ∈ K une racine de P . Comme K est un corps,
l’anneau K[X1 ] est euclidien et on peut effectuer la division de P par X1 − α :
P = (X1 − α)Q + R
73
14. Méthodes polynomiales en combinatoire
où, pour tout j ∈ J1, nK, hj et Rj sont respectivement le quotient et le reste dans
la division de P − j−1
P
i=1 gi hi par gj . On note R = Rn .
À chaque étape j ∈ J1, nK, comme deg(Rj ) < deg(gj ) 6 deg(gj hj ), on a
j−1
X
deg(gj hj ) = max{deg(gj hj ), deg(Rj )} = deg P − gi hi = deg(Rj−1 ).
i=1
74
Anneaux, corps et théorie des nombres
75
14. Méthodes polynomiales en combinatoire
Commentaires.
© Le résultat de la question a) est classique et peut naturellement être admis
dans le cadre de l’agrégation.
© Le résultat prouvé dans les quatre premières questions s’utilise aussi pour sa
contraposée, qui porte le nom de Nullstellensatz combinatoire :
76
Anneaux, corps et théorie des nombres
Questions.
1. Soient A un anneau, et D, P ∈ A[X] deux polynômes tels que D est unitaire.
Pourquoi peut-on toujours trouver Q, R ∈ A[X] tels que P = DQ + R avec
deg R < deg D, même si A[X] n’est pas euclidien ? Quid de l’unicité de Q et R ?
2. Soient A et B des sous-ensembles non vides de Fp . Montrer qu’on a :
Indication : on pourra distinguer les cas |A| + |B| > p et |A| + |B| 6 p. Dans le
second, on pourra considérer le polynôme c∈C (X + Y − c) où C est un ensemble
Q
Pd
où j=1 ai,j xj = 1 est l’équation normalisée d’un hyperplan pour tout i ∈ J1, nK.
4. Soit n un entier pair. Soit G le graphe cyclique de taille n. On donne à chaque
sommet deux couleurs autorisées. Montrer qu’on peut trouver une coloration de G
où chaque sommet utilise une de ses couleurs autorisées, et où toute paire de
sommets adjacents reçoit deux couleurs différentes (cf. Développement 113).
Indication : on pourra introduire un polynôme dont les racines correspondent aux
colorations impropres de G.
5. Soit G un graphe simple, de degré moyen strictement supérieur à 2p − 2 et
de degré maximal au plus 2p − 1 où p est un nombre premier. Montrer que G
contient un sous-graphe dont tous les sommets sont de degré d.
Indication : on pourra introduire une variable Xe pour chaque arête de G, et
|E(G)|
évaluer sur F2 le polynôme
p−1
Y X Y
1 − av,e Xe − (1 − Xe )
v∈V (G) e∈E(G) e∈E(G)
77
15. C est algébriquement clos
Soit P ∈ C[X] unitaire non constant. L’objectif est de prouver que P admet
une racine complexe.
a) Supposons que P est de degré d = 2n q, où n > 0 et où q est impair.
(i) Montrer que l’on peut supposer que P est à coefficients réels.
(ii) Si d est impair, prouver que P admet une racine réelle.
b) Soit K un corps de décomposition de P . Notons xi les racines de P dans K,
pour 1 6 i 6 d. Soit c ∈ R. Considérons les éléments yij = xi + xj + cxi xj
de K, pour 1 6 i 6 d. Soit
Y
Qc = (X − yij ). (1)
16i6j6d
78
Anneaux, corps et théorie des nombres
b) (i) Prouvons que les coefficients de Qc sont des fonctions symétriques réelles
en les xi . En effet, les coefficients de Qc sont des polynômes symétriques élé-
mentaires en ses racines yij . De plus, les yij sont des polynômes symétriques à
coefficients réels en (xi , xj ), donc les coefficients de Qc sont aussi des polynômes
symétriques à coefficients réels en les xi . Tout polynôme symétrique à coefficient
réel des xi s’écrit comme polynôme à coefficients réels des fonctions symétriques
élémentaires des xi , or ceux-ci sont les coefficients de P par le théorème de Newton.
En fin de comptes, les coefficients de Qc sont des polynômes à coefficients réels en
les coefficients de P . Puisque ceux-ci sont réels, les coefficients de Qc sont réels.
(ii) Puisque zc est une racine de Qc , elle est par définition l’un des yij puisque Qc
est scindé sur K, ce qui implique que zc = yi(c), j(c) pour certains indices i(c)
et j(c) de J1, nK.
On a donc construit une application c ∈ R 7→ (i(c), j(c)) ∈ J1, nK2 , qui ne peut
pas être injective puisqu’elle est à valeurs dans un ensemble fini et que R est infini.
Ainsi, il existe deux réels distincts c et c0 tels que
qui est à coefficients complexes. Ses racines sont donc complexes, ce qui signifie
que P admet les racines complexes, éventuellement confondues, xr et xs .
(iii) Raisonnons par récurrence sur n ∈ N pour prouver que tout polynôme
de R[X] dont le degré est de la forme 2n q, avec q entier impair, admet une racine
dans C. La question a)(ii) correspond au cas n = 0. Soit n > 1. Supposons
la propriété vraie au rang n − 1. Soit P ∈ R[X] de degré d = 2n q où q est un
entier impair. Pour tout paramètre réel c, introduisons le polynôme Qc donné
par (1) où les xi sont les racines de P dans une clôture algébrique de R. Le degré
de Qc est le cardinal de l’ensemble {(i, j) ∈ J1, dK2 : i 6 j}. Celui-ci est égal à
1 n−1 q(d + 1) où q(d + 1) est un entier impair. Par l’hypothèse de
2 d(d + 1) = 2
récurrence, Qc admet donc une racine complexe zc pour tout c ∈ R. La question
b)(ii) assure alors que P admet une racine complexe. Ainsi la propriété est prouvée
au rang n, et par récurrence elle est vraie pour tout n ∈ N. On en déduit que
tout polynôme P ∈ R[X] non constant admet une racine complexe, i.e. que tout
polynôme P ∈ C[X] non constant admet une racine complexe a)(i), i.e. que C
est algébriquement clos.
79
15. C est algébriquement clos
Commentaires.
© Les relations entre coefficients et racines sont un outil puissant, offrant le
choix du langage le plus adapté pour caractériser un polynôme en fonction du
contexte. Ainsi, les problèmes de nature additive sont adaptés aux coefficients,
qui s’additionnent ; alors que les problèmes multiplicatifs sont naturellement
mieux exprimés en termes de racines, qui se concatènent. Voici deux exemples
de propositions immédiates dans le bon langage, mais difficilement démontrables
dans l’autre :
• Soit K une extension de corps de Fq et P ∈ K[X]. Alors P ∈ Fq [X] si,
et seulement si, P (X)q = P (X q ). La preuve est limpide en développant la
puissance q-ième et en faisant apparaître les coefficients ; autrement moins
évidente en considérant la forme multiplicative.
• Soit P ∈ C[X]. Alors pgcd(P, P 0 ) 6= 1 si, et seulement si, P admet une racine
double. C’est immédiat en regardant la décomposition comme produit de
facteurs linéaires, mais très difficile à voir sur les coefficients.
© Cette preuve relativement élémentaire est la porte ouverte à des questions assez
générales sur les polynômes et les relations de Newton, qu’il convient de bien
savoir écrire.
Questions.
1. À quel endroit de la preuve utilise-t-on le fait d’être dans C et non dans R ?
2. Donner un exemple de polynôme de C[X] ayant deux racines x1 et x2 dans
C\R, mais telles que x1 + x2 et x1 x2 soient dans R.
xi x2j en fonction des polynômes symétriques élémentaires.
P
3. Exprimer i6=j
4. Rappeler pourquoi il existe toujours un corps de décomposition pour un
polynôme non constant.
5. Prouver que les racines simples d’un polynôme complexe sont des fonctions
continues de ses coefficients.
Indication : penser au théorème des fonctions implicites.
6. Soit L/K une extension de corps et P ∈ K[X]. Supposons que P est scindé
dans L sous la forme i (X − ai ). Montrer que pour tout r > 1, le polynôme
Q
r
i (X − ai ) est dans K[X].
Q
80
Anneaux, corps et théorie des nombres
Soit A un anneau noethérien, i.e. un anneau dans lequel toute famille non
vide d’idéaux admet un élément maximal pour l’inclusion.
a) Soit a un idéal de A. Montrer que tout ensemble de générateurs de a
contient un sous-ensemble fini de générateurs.
Supposons que A admet un unique idéal maximal m (A est un anneau local).
b) Montrer que A× = A\m.
c) Soit M un A-module engendré par un nombre fini d’éléments. Montrer que
si M = mM , alors M = 0. (Lemme de Nakayama)
d) Montrer le lemme d’intersection de Krull :
\
mn = {0}.
n>1
Correction.
a) Soit S un ensemble de générateurs de a. La famille des idéaux engendrés
par un sous-ensemble fini de S est une famille d’idéaux de A, qui est non vide
car il contient l’idéal trivial {0} (engendré par la sous-partie ∅). Puisque A
est noethérien, il existe donc un idéal maximal m dans cette famille. C’est en
particulier un idéal engendré par une partie finie de S.
Il reste à montrer que m = a. Puisque tout sous-ensemble fini de S ⊆ a est inclus
dans a, il vient que m est engendré par des éléments de a, en particulier m ⊆ a.
De plus, on a nécessairement S ⊆ m. En effet, si tel n’était pas le cas, il existerait
un élément s ∈ S\m. On pourrait alors considérer l’idéal m + (s), qui est finiment
engendré par des éléments de S, car m l’est et s ∈ S. Mais il contiendrait alors
strictement m, contredisant l’hypothèse de maximalité. Ainsi on a S ⊆ m, et donc
on a l’inclusion a ⊆ m. Par suite, on a m = a.
Finalement, l’idéal a est engendré par une sous-partie finie de S.
b) Soit x ∈ A qui n’est pas une unité. Alors l’idéal engendré par x est propre, il
est donc inclus dans un idéal maximal. Ainsi, x est contenu dans un idéal maximal,
qui est donc nécessairement m par unicité de l’idéal maximal, puisque A est local.
Le complémentaire des unités A\A× est donc inclus dans m, et par passage au
complémentaire on en tire A\m ⊆ A× .
De plus, m ne contient pas d’unité, sinon il contiendrait l’idéal engendré par cette
unité, qui est tout l’anneau A. Ainsi, on a A× ⊆ A\m, et donc l’égalité souhaitée.
81
16. Lemme d’intersection de Krull
Il viendrait alors
(1 − a1 )e1 = a2 e2 + · · · + an en . (1)
Par la question b), les unités sont exactement les éléments hors de m. Or 1 − a1 ne
peut pas être dans m, sinon on aurait 1 = (1 − a1 ) + a1 ∈ m, et on aurait m = A,
contredisant la définition de m. Ainsi, 1 − a1 est une unité, et l’équation (1)
impliquerait que e1 est dans le module engendré par (e2 , . . . , en ), et donc que
la famille (e2 , . . . , en ) engendrerait M , contredisant la minimalité de (e1 , . . . , en ).
Ainsi, M est nécessairement nul.
d) La stratégie est d’arriver à prouver que m n mn = n mn , de sorte à appliquer
T T
le lemme de Nakayama. L’inclusion ⊂ est évidente car les mn sont des idéaux.
Il reste à prouver que, si n est assez grand, un élément de mn est combinaison
linéaire d’éléments de mk à coefficients dans m pour un certain k fixé.
Soit (a1 , . . . , ar ) un système générateur de m, qui existe par la question a). Alors,
pour tout n > 1, l’idéal mn est l’ensemble des f (a1 , . . . , ar ) où f ∈ A[X1 , . . . , Xr ]
est un polynôme homogène de degré n.
Soit Sm l’ensemble des polynômes f ∈ A[X1 , . . . , Xr ] homogènes de degré m
tels que f (a1 , . . . , ar ) soit dans n>1 mn . Soit a l’idéal de A[X1 , . . . , Xr ] engendré
T
S
par la réunion m>1 Sm . Puisque A est noethérien, A[X1 , . . . , Xr ] est également
noethérien et par la question a) il existe une famille finie (f1 , . . . , fs ) d’éléments
S
de m>1 Sm engendrant a. Notons di le degré de fi et d le maximum de ces degrés.
Soit b ∈ n>1 mn . Alors en particulier b ∈ md+1 , donc b = f (a1 , . . . , ar ) pour un
T
Les fi et f sont homogènes, donc on peut donc supposer que les gi sont homogènes
de degrés d(f )−di = d+1−di > 0 : en effet, les contributions des monômes de plus
petits degrés dans les gi se compensent nécessairement. Ainsi, gi (a1 , . . . , ar ) ∈ m
pour tout i ∈ J1, sK. On en déduit donc que
X \
b = f (a1 , . . . , ar ) = gi (a1 , . . . , ar )fi (a1 , . . . , ar ) ∈ m mn .
i n>1
82
Anneaux, corps et théorie des nombres
Commentaires.
© Les anneaux noethériens sont une ouverture naturelle à partir des anneaux
principaux : alors que les anneaux principaux ont leurs idéaux engendrés par
un seul élément, ceux des anneaux noethériens sont engendrés par un nombre
fini d’éléments. Cette propriété de finitude est souvent utilisée comme un bon
substitut à la principalité, par exemple pour faire de l’algèbre linéaire sur les
A-modules.
© Il existe trois définitions équivalentes des anneaux noethériens qu’il est important
de garder en tête :
(i) toute suite croissante d’idéaux est stationnaire ;
(ii) toute famille non vide d’idéaux admet un élément maximal ;
(iii) tout idéal est de type fini, i.e. finiment engendré.
La preuve de l’équivalence de ces trois propriétés est classique mais importante : elle
contient de nombreux arguments typiques de la théorie des anneaux noethériens.
Ainsi, la question a) est triviale si l’on considère la définition (iii), mais beaucoup
moins pour les deux autres.
© Le lemme de Nakayama est un des premiers résultats d’algèbre commutative
générale. Il peut être formulé de nombreuses manières équivalentes, dont certaines
sont mentionnées en exercice.
© Grâce au lemme de Nakayama, on peut prouver le corollaire suivant :
Questions.
1. Dans la question a), il est supposé que a est un anneau finiment engendré.
Montrer que cette hypothèse n’est pas nécessaire dans un anneau vérifiant (ii).
2. Répondre à la question a) en utilisant la définition (i) des anneaux noethériens.
3. Donner des exemples d’anneaux locaux.
4. Soit A un anneau local d’idéal maximal m. Supposons que N ⊂ M sont des
A-modules finiment engendrés. Montrer que si N + mM = M , alors N = M .
5. Soit A un anneau local d’idéal maximal m et M un A-module finiment engendré.
Supposons que les classes {x1 , . . . , xn } modulo mM engendrent M/mM comme
espace vectoriel sur A/m. Montrer que {x1 , . . . , xn } engendre M en tant que
A-module.
6. Soit G le groupe abélien de générateurs x et yk pour k ∈ N et de relations
données par px = 0, x = py1 = p2 y2 = · · · = pk yk = . . . pour un certain nombre
premier p fixé. Vérifier que Gω = k>1 pk G = hxi, mais que pGω = 0 6= Gω .
T
Conclure que le lemme d’intersection de Krull n’est plus vrai lorsque M n’est plus
finiment engendré.
Indication : les groupes abéliens sont des Z-modules.
7. Si A est noethérien, montrer que A[X] est noethérien.
83
17. Cyclicité de F×
p
Développement 17 (Cyclicité de F×
p
FF)
Correction.
a) Notons n l’ordre de G, et n = q1e1 q2e2 · · · qm em sa décomposition en facteurs
premiers, où les qi sont des premiers distincts et ei > 1 pour tout i ∈ J1, mK. Pour
tout i ∈ J1, mK, notons Gi = Gqi . Puisque Gi est supposé cyclique, il est engendré
par un élément que l’on note gi ∈ Gi .
Prouvons que les gi engendrent G. Notons que n est divisible par chaque qiei , en
particulier les n/qiei sont des entiers. Ces entiers sont premiers entre eux dans leur
ensemble, de sorte qu’il existe une relation de Bézout entre eux : autrement dit, il
existe des ui ∈ Z, pour i ∈ J1, mK, tels que
m
X n
ui = 1.
i=1
qiei
vaut g ui n = 1), donc c’est une puissance de gi car Gi est engendré par gi . Ainsi g
est un produit de puissances des gi , i ∈ J1, mK, autrement dit
G = hg1 , . . . , gm i.
84
Anneaux, corps et théorie des nombres
Puisque chaque gi est d’ordre divisant qiei , par le théorème des restes chinois il
existe r ∈ N tel que
r ≡ r1 mod q1e1 ,
r ≡ r2 mod q e2 ,
2
..
.
r ≡ rm em .
mod qm
Dans ce cas, on a bien giri = gir pour tout i ∈ J1, mK. Ainsi, tout élément de G est
de la forme g1r1 · · · gm
rm = (g · · · g )r pour un certain r ∈ N, donc G = hg · · · g i
1 m 1 m
est cyclique.
b) Puisque Gp est abélien et que ses éléments sont d’ordre des puissances de p,
le groupe Gp est d’ordre une puissance de p. Notons ps l’ordre de Gp , pour un
certain entier s > 1. Puisque Gp n’est pas cyclique par hypothèse, on a s > 2.
Considérons pt l’ordre maximal d’un élément de Gp , pour un t ∈ J1, sK, et notons g
t−1
un élément d’ordre pt . Alors g p est d’ordre p, donc solution de xp = 1.
Il reste à trouver au moins p autres solutions de l’équation xp = 1 dans Gp . Il
suffit pour cela de trouver un élément d’ordre p dans Gp qui n’est pas dans le
sous-groupe hgi. Puisque Gp n’est pas cyclique, il existe h ∈ / hgi. Soit ` un entier
p ` p `−1
tel que h ∈ hgi. Quitte à remplacer h par h , on peut supposer que ` = 1.
Ainsi, il existe un élément h ∈ p
/ hgi tel que h ∈ hgi. Cela signifie que, pour un
certain n ∈ N, on a hp = g n . Notons pr 6 pt l’ordre de h, pour un r ∈ N∗ . L’ordre
de hp = g n doit donc être au plus pr−1 < pt . Cela implique p | n : autrement p et n
seraient premiers entre deux, et donc l’ordre de g n serait l’ordre de g, c’est-à-dire pt ,
ce qui n’est pas le cas puisque hp est d’ordre pr−1 < pt .
Il existe donc k ∈ N tel que n = pk, et on a donc hp = g pk . Cette égalité
peut s’écrire sous la forme (hg −k )p = 1 avec hg −k ∈ / hgi (puisque h ∈ / hgi). En
particulier, on obtient que hg ∈−k / hgi est d’ordre p.
p
Ainsi, l’équation x = 1 admet pour solutions tous les éléments du sous-groupe
engendré par hg −k , qui sont distincts de g et au nombre de p, ainsi que g. Cela
donne donc p + 1 solutions à l’équation xp = 1 dans Gp , comme souhaité.
c) Notons p − 1 = q1e1 q2e2 · · · qm
em la décomposition en facteurs premiers de p − 1,
avec qi premier et ei > 1. Pour tout i ∈ J1, mK, notons comme précédemment
n ei o
Gi = g ∈ F×
p : g
qi
≡ 1 mod p .
85
17. Cyclicité de F×
p
Commentaires.
© Ce développement est élémentaire dans ses arguments. Sa longueur et le for-
malisme peuvent justifier le niveau de difficulté FF proposé. Il est envisageable
de présenter uniquement le résultat de la question a) avec sa réciproque (plus
facile, voir questions pour des détails complémentaires). Cela permettrait de
mettre l’accent sur le résultat important discuté dans le commentaire suivant, et
correspondrait à un développement de niveau F.
© La structure des groupes (Z/nZ)× se réduit à celle des (Z/pk Z)× où p est
un nombre premier et k > 1, par le théorème des restes chinois. En effet, si la
m
décomposition de n en produit de facteurs premiers prend la forme n = pk11 · · · pkm
où les pi sont des nombres premiers et ki ∈ N∗ pour tout i ∈ J1, mK, on a
(Z/nZ)× ' (Z/pk11 Z)× × · · · × (Z/pkmm Z)× .
Le résultat prouvé ici est la cyclicité des (Z/pZ)× . Ce résultat n’est plus vrai
lorsque p n’est plus premier, ainsi (Z/12Z)× n’est pas cyclique. La structure des
groupes d’unités des Z/pk Z est toutefois entièrement connue, plus précisément :
(
k × Z/2k−2 Z × Z/2Z si p = 2 et k > 3,
(Z/p Z) '
Z/pk−1 Z sinon.
86
Anneaux, corps et théorie des nombres
Ker(f ) = {h ∈ H : hn = 1},
Im(f ) ⊆ {h ∈ H : hm = 1}.
|Ker(f )| 6 n,
|Im(f )| 6 m.
Questions.
1. Montrer qu’un groupe d’ordre un nombre premier p est cyclique.
2. Soit p un nombre premier. Soit G un groupe abélien et Gp un sous-groupe de G
constitué d’éléments d’ordre des puissances de p. Montrer que Gp est d’ordre une
puissance de p. Et dans le cas non abélien ?
3. Justifier que, si n et p sont premiers entre eux et g ∈ Gp , alors l’ordre de g et
l’ordre de g n sont égaux.
4. Montrer que l’équation xq = 1 ne peut avoir strictement plus de q solutions
dans un corps. Qu’en est-il dans Z/nZ en général ?
Indication : pour la seconde partie, considérer x2 = 1 dans Z/8Z.
87
17. Cyclicité de F×
p
88
Anneaux, corps et théorie des nombres
σj : Fpm −→ Fpm
j
x 7−→ xp .
Ce développement est avant tout un résultat sur les corps finis (123) et plus
précisément la détermination de tous les automorphismes de Fpm laissant fixe Fp ,
autrement dit les automorphismes de l’extension de corps Fpm /Fp . Cela en fait
un résultat adéquat pour la leçon sur les extensions de corps (125). Les méthodes
reposent avant tout sur l’utilisation d’éléments générateurs des extensions de corps
et des polynômes minimaux de ces éléments (141) : en effet, les automorphismes de
corps considérés fixent les coefficients, et permutent donc les racines des polynômes
considérés.
Correction.
n
a) Supposons que P | X p − X pour un n ∈ N. Soit α une racine de P dans
n
un corps de décomposition de P sur Fp . Alors αp = α puisque c’est une racine
n
de X p − X, en particulier α ∈ Fpn . Par multiplicativité des degrés, on a donc
En particulier, m | n.
b) Puisque P est irréductible dans Fp [X], on a [Fp (α) : Fp ] = m, de sorte que
l’on a Fp (α) ' Fpm , en particulier on a α ∈ Fpm (à isomorphisme près, que l’on
considère désormais comme une égalité).
Soit x ∈ Fpm une racine de P , montrons que xp est également une racine de P .
Rappelons que l’application x 7→ xp est un morphisme de corps sur Fpm qui fixe Fp .
En particulier, en écrivant explicitement les coefficients
m
X
P = ai X i , a0 , . . . , am ∈ Fp ,
i=0
89
18. Automorphismes de Fpm
il vient
P (xp ) = am xpm + · · · + a1 xp + a0
= apm (xm )p + · · · + ap1 xp + ap0
= (am xm + · · · + a1 x + a0 )p
= P (x)p = 0.
Ainsi, la puissance p-ième conserve les racines de P , donc par une récurrence
2 m−1
immédiate on en déduit que α, αp , αp . . . , αp sont également racines de P .
Il reste à prouver que les éléments ci-avant sont distincts. Supposons qu’il existe
j k
des entiers 0 6 j < k 6 m − 1 tels que αp = αp . En élevant cette égalité à la
puissance pm−k -ième, il vient
m−k+j m
αp = αp = α.
m−k+j
Ainsi α est une racine de X p − X ∈ Fp [X]. Puisque P est le polynôme
m−k+j
minimal de α dans Fp [X], on a nécessairement P | X p − X. Par la question
précédente, cela implique m | m − k + j ∈ J1, m − 1K ce qui est impossible. Ainsi,
2 m−1
les m éléments α, αp , αp . . . , αp sont des racines distinctes de P . Puisque P
est de degré m sur le corps Fp , il admet au plus m racines, de sorte que ses racines
2 m−1
sont exactement les éléments α, αp , αp . . . , αp .
c) Vérifions que les σj sont des Fp -automorphismes de Fpm . Soit j ∈ J0, m − 1K.
Par commutativité de Fpm on a σj (x)σj (y) = σj (xy). De plus, puisque l’exponen-
tiation par p est un morphisme, on a σj (x + y) = σj (x) + σj (y). Le morphisme σj
est injectif comme morphisme de corps, et donc surjectif puisqu’il s’agit d’un
endomorphisme du corps fini Fpm . Enfin, les σj sont distincts puisque leur valeur
en l’élément α de Fpm sont distinctes par la question précédente.
Soit σ un Fp -automorphisme de Fpm . Soit β un élément primitif de Fpm sur Fp ,
et P son polynôme minimal dans Fp [X], de coefficients ai ∈ Fp . On a alors
0 = σ(P (β))
= σ(β m + am−1 β m−1 + · · · + a0 )
= σ(β)m + am−1 σ(β)m−1 + · · · + a0
= P (σ(β)).
On conclut donc que σ(β) est une racine de P dans Fpm . Par la question précédente,
j
on a donc σ(β) = β p pour un certain j ∈ J0, m − 1K. Puisque σ est un Fp -
automorphisme de Fpm et que β est primitif, cela détermine entièrement le
morphisme σ sur Fpm = Fp (β), de sorte que σ = σj .
90
Anneaux, corps et théorie des nombres
Commentaires.
© Les Fp -automorphismes de Fpm forment un groupe pour la composition des
applications, appelé le groupe de Galois de Fpm sur Fp . Le résultat prouvé dans ce
développement est que ce groupe de Galois est cyclique et engendré par x 7→ xp . On
constate notamment que les sous-groupes de Gal(Fpm /Fp ) sont en correspondance
bijective avec les extensions intermédiaires de Fpm /Fp : on retrouve un cas très
particulier de l’importante correspondance de Galois, voir Développement 21.
© Le morphisme x 7→ xp est appelé le morphisme de Frobenius. Il est un morphisme
uniquement en caractéristique p, et est souvent mentionné comme étant le « rêve
de l’étudiant », puisque c’est un morphisme lorsque (x + y)p = xp + y p . Ses
puissances donnent des éléments particuliers du groupe de Galois d’une extension
de corps de caractéristique p ; nous avons prouvé dans ce développement qu’il
engendre même tout le groupe de Galois dans le cas d’une extension finie de Fp .
Ce morphisme est un objet d’une richesse insoupçonnée en algèbre et en géométrie,
encore au cœur de nombreux domaines de recherche actuels.
Questions.
1. Rappeler une manière de construire le corps Fpn . En déduire que si l’on a
n
l’égalité αp = α, alors α ∈ Fpn .
m n
2. Montrer que si m | n, alors X p − X | X p − X.
3. Quels sont les sous-corps de Fpn ?
4. Montrer que le morphisme de Frobenius x 7→ xp est un morphisme de Fp .
Indication : utiliser la formule du binôme de Newton.
5. Expliciter la correspondance mentionnée en commentaires.
6. Si E, F, G sont trois corps tels que E ⊂ F ⊂ G, montrer qu’on a la multiplica-
tivité des degrés : [G : E] = [G : F ] · [F : E].
Indication : introduire les bases le l’espace vectoriel F (resp. G) sur E (resp. F ).
7. Déduire de la question b) que le corps de décomposition d’un polynôme
irréductible de degré m dans Fp [X] est Fpm .
8. Soit A un anneau. Est-ce qu’un polynôme P ∈ A[X] de degré m admet au plus
m racines distinctes ?
9. Montrer que tout morphisme de corps est injectif.
10. Montrer que F×
pm est un groupe cyclique (Théorème de Wedderburn).
11. Montrer que Fpm admet un élément primitif β ∈ Fpm , i.e. tel que Fpm = Fp (β).
Indication : utiliser le théorème de Wedderburn.
91
19. Automorphismes d’un corps cyclotomique
∀x ∈ µn , σ(x) = xaσ .
ψ : G −→ (Z/nZ)×
σ 7−→ aσ
Correction.
a) (i) Les racines de f et de g sont des racines n-ièmes de l’unité. En effet, ζ
et ζ p sont des racines n-ièmes de l’unité, donc sont racines de X n − 1 ∈ Q[X].
Puisque f (resp. g) est le polynôme minimal de ζ (resp. ζ p ) dans Q[X], on en
déduit que f et g divisent X n − 1 dans Q[X]. Ainsi, les deux polynômes f et g
sont distincts, unitaires et de plus irréductibles dans Q[X] comme polynômes
minimaux ; ils sont donc premiers entre eux. On en déduit que f g divise X n − 1.
Il existe donc h ∈ Q[X] tel que
X n − 1 = f gh. (1)
92
Anneaux, corps et théorie des nombres
Ainsi, tout facteur irréductible de f¯ est un facteur de ḡ p , donc de ḡ. Or, par
la question a)(ii), les polynômes f¯ et ḡ sont premiers entre eux : c’est une
contradiction. Ainsi, on a bien f = g.
b) (i) Commençons par prouver l’existence de aσ . Soit ζ une racine primitive
n-ième de l’unité, autrement dit un générateur de µn . En particulier, ζ n = 1 et
ζ k 6= 1 pour tout 1 6 k < n. Alors, puisque σ est un automorphisme de corps, on
a σ(ζ)n = 1 et σ(ζ)k = 6 1 pour tout 1 6 k < n, de sorte que σ(ζ) est aussi une
racine primitive n-ième de l’unité et donc il existe a ∈ (Z/nZ)× tel que σ(ζ) = ζ a .
Puisque tous les éléments de µn sont de la forme ζ k pour un certain k ∈ N, on
peut se contenter d’écrire l’image pour des éléments de cette forme. Pour k ∈ N,
σ(ζ k ) = σ(ζ)k = (σ a )k = (σ k )a .
(σ ◦ τ )(ζ) = ζ aστ .
93
19. Automorphismes d’un corps cyclotomique
Soit σ dans Ker(ψ), autrement dit tel que aσ = 1 dans Z/nZ. On a alors σ(ζ) = ζ
pour une racine primitive. Puisque cette racine engendre le groupe µn , on en
déduit que σ vaut l’identité sur µn . Puisque c’est un Q-automorphisme, il agit
comme l’identité sur Q, c’est donc l’identité sur tout Q(µn ). Ainsi Ker(ψ) = {id}
et donc ψ est injectif.
(iii) Il reste à montrer que ψ est surjectif. Soit ζ ∈ µn une racine primitive
n-ième de l’unité. Montrons qu’un Q-morphisme σ ∈ G est un Q-automorphisme
si et seulement si σ(ζ) a le même polynôme minimal que ζ. Autrement dit, on
peut paramétrer les Q-automorphismes par l’image du générateur ζ.
Premièrement, supposons que l’image σ(ζ) a même polynôme minimal que ζ (qui
est plus précisément le n-ième polynôme cyclotomique), c’est donc une racine
primitive n-ième de l’unité. Ainsi, σ(ζ) est un générateur de µn et on en déduit que
σ est surjectif, et donc un automorphisme de corps. Réciproquement, supposons
que σ est un Q-automorphisme. L’image σ(ζ) est également une racine n-ième de
l’unité de même polynôme minimal que ζ : en effet, si f ∈ Q[X], il est invariant
par σ et on en déduit que f (σ(ζ)) = σ(f (ζ)). Puisque σ est injectif, on en déduit
que f (ζ) = 0 si et seulement si f (σ(ζ)) = 0, de sorte que ζ et σ(ζ) ont les mêmes
polynômes annulateurs et donc le même polynôme minimal.
Ainsi le cardinal du groupe G des Q-automorphismes de µn est égal au nombre
de racines n-ièmes de l’unité ayant même polynôme minimal que ζ.
Pour prouver la surjectivité de ψ il suffit donc de démontrer que, pour tout élément
a ∈ (Z/nZ)× , les éléments ζ et ζ a ont même polynôme minimal. Écrivons la
décomposition en facteurs premiers a = p1 · · · pr où r > 1 et les pi sont des
nombres premiers. Puisque a est inversible dans Z/nZ, il est premier avec n et
les nombres premiers pi ne divisent pas n. Par la question a)(iii), ζ et ζ p1 ont
même polynôme minimal et ζ p1 ∈ µn . En itérant ce procédé, on en déduit que les
éléments ζ et ζ p1 ···pr = ζ a ont même polynôme minimal. Ainsi, il est possible de
choisir σ(ζ) parmi toutes les racines primitives n-ièmes de l’unité. On en conclut
que |G| > |(Z/nZ)× | et donc ψ est surjectif.
Commentaires.
© Si on manque de temps ou que l’on souhaite prouver des détails, on peut s’arrêter
à l’injectivité de ψ prouvée dans la question b)(ii), explicitant par exemple les
preuves de la cyclicité de µn et de la détermination de ses générateurs. Cela donne
un développement de niveau F. La question b)(iii) demande un peu plus de
recul pour comprendre que les éléments de G = Gal(Q(ζ)/Q) sont en bijection
avec les « conjugués » de ζ, autrement dit les autres racines de son polynôme
minimal sur Q. Ces arguments sont à la source de la théorie de Galois, et on
pourra se reporter au Développement 21 pour plus d’arguments dans cette veine.
Traiter l’intégralité du développement nécessite d’être plus rapide sur certains
arguments de la question a) et de maîtriser sans hésitation les manipulations sur
les générateurs et les réductions de polynômes, ce que nous proposons pour un
développement de niveau FF.
94
Anneaux, corps et théorie des nombres
Questions.
1. Montrer que le groupe des racines n-ièmes de l’unité est cyclique.
2. Montrer que pour un groupe cyclique d’ordre n engendré par un élément x, les
générateurs sont les xk avec pgcd(k, n) = 1.
3. Rappeler pourquoi on a g(X p ) = g(X)p modulo p.
4. Montrer que tout morphisme de corps est injectif.
5. Détailler l’argumentation de b)(ii) : montrer que si un Q-automorphisme de
corps vérifie σ(ζ) = ζ pour ζ ∈ µ× n , alors σ = {id} sur Q(µn ).
0
6. Si P ∈ Q[X] avec pgcd(P, P ) = 1, montrer que P n’a que des racines simples.
7. Si K est un corps, expliquer pourquoi P ∈ K[X] et P 0 sont premiers entre eux
si, et seulement si, ils n’ont pas de racine commune. Est-ce que ce résultat demeure
vrai si K est seulement supposé être un anneau commutatif, par exemple Z ?
8. Illustrer la question c) avec le cas de la conjugaison : pour toute racine n-
ième de l’unité ζ ∈ C, l’extension cyclotomique Q(ζ)/Q peut être considérée
comme sous-corps de C. En considérant l’injection de Gal(Q(ζ)/Q) dans (Z/nZ)×
considérée dans le développement, quelle est l’image de la conjugaison complexe ?
9. Soit m > 1. Montrer que le nombre de racines de l’unité dans Q(ζm ) est égal à
ppcm(2, m). En déduire que pour n 6= m, on a Q(ζm ) = Q(ζn ) si, et seulement si,
l’ensemble {m, n} est de la forme {k, 2k} pour un entier impair k.
95
20. Automorphismes sauvages de C
ψ1 6 ψ2 si K1 ⊂ K2 , L1 ⊂ L2 et ψ2 |K1 = ψ1 .
96
Anneaux, corps et théorie des nombres
Correction.
a) (i) Comme ϕ est un morphisme de corps, on a ϕ(1) = 1. Une récurrence
immédiate fournit alors que, pour tout n ∈ N, on a
De plus, on a
97
20. Automorphismes sauvages de C
somme et le produit sont bien définis car (Kt )t∈Λ est totalement ordonnée pour
l’inclusion). Ces deux opérations munissent K0 d’une structure de corps. De plus,
on a
K ⊂ K0 ⊂ K.
On montre de même que L0 = ∪t∈Λ ψt (Kt ) est un sous-corps de L contenant L. On
définit alors ψ 0 : K0 → L0 par ψ 0 (x) = ψt (x) pour tout x ∈ Kt . Pour tout s, t ∈ Λ,
si ψs et ψt sont définis sur x, alors ψs (x) = ψt (x) puisque l’un est restriction de
l’autre. Ainsi, l’application ψ 0 est bien définie, et on montre facilement que c’est
un automorphisme de corps, qui prolonge tous les ψt pour t ∈ Λ.
Ainsi, ψ 0 est un majorant de l’ensemble des termes de la famille (ψt )t∈Λ . L’en-
semble E est donc inductif et non vide. D’après le lemme de Zorn, il possède donc
un maximum noté ψe : K e → L.
e
(iii) Supposons que Ke ne soit pas algébriquement clos. Alors il existe un poly-
Pd i
nôme P = i=0 ai X ∈ K[X] e e avec d > 2. Comme ψe est un
irréductible sur K,
Pd e
isomorphisme, le polynôme image Q = i=0 ψ(ai )X i est aussi irréductible sur L. e
L’application
K[X]/P
e −→ L[X]/Q
e
d−1
X d−1
X
pk X k 7−→ e )X k
ψ(pk
k=0 k=0
(iv) Comme ψe est un isomorphisme, son image L e est aussi algébriquement close
et contenue dans L par définition de E, d’où L
e = L. Ainsi, ψe est un isomorphisme
entre les clôtures algébriques K et L prolongeant ψ.
c) (i) L’ensemble F est non vide car ϕ ∈ F . Montrons maintenant que F est
inductif. Soit (ψt : Lt → Lt )t∈Λ une partie non vide et totalement ordonnée
d’éléments de F . Par le même raisonnement qu’à la question b)(ii), L = ∪t∈Λ Lt
est un sous-corps de C contenant K et l’application ψ : L → L définie par
ψ(x) = ψt (x) pour tout x ∈ Lt est un majorant de l’ensemble des termes de la
famille (ψt )t∈Λ . L’ensemble F est donc inductif et non vide. D’après le lemme de
Zorn, il possède donc un maximum noté ϕ : L → L.
(ii) Montrons par l’absurde que C/L est algébrique. Supposons qu’il existe un
élément α ∈ C transcendant sur L. En particulier, L(α) contient strictement L.
Alors L(α) est isomorphe (en tant que L-algèbre) à L(X). Par propriété universelle
de l’algèbre L(X), tout automorphisme de L se prolonge de manière unique en un
automorphisme de L(X) fixant X.
Ainsi, on peut étendre ϕ en un automorphisme de L(α) tel que ϕ(α) = α, ce qui
contredit la maximalité de ϕ dans E. On en conclut que tout élément de C est
algébrique sur L, autrement dit, l’extension C/L est algébrique.
98
Anneaux, corps et théorie des nombres
ϕ: K √ −→ K√
a + b 2 7−→ a − b 2
Ainsi, ϕ(Q + xQ) (et donc a fortiori ϕ(R)) est dense dans C.
Commentaires.
© Il est important de sélectionner scrupuleusement les points à détailler selon la
leçon dans laquelle ce développement est utilisé, et le niveau de difficulté souhaité.
Tel que présenté ici, le développement est dense, il ne faut donc pas le présenter
dans son intégralité. La question a) constitue à elle seule un développement de
niveau F. Elle peut néanmoins être admise en tant que résultat assez classique pour
se concentrer sur les questions suivantes, plus intéressantes bien que nécessitant
de maîtriser des outils plus élaborés. Si on souhaite traiter la question d), il peut
être utile d’admettre le lemme démontré question b), à savoir :
Soit ψ : K → L un isomorphisme de corps. Alors on peut prolonger ψ
en un isomorphisme de corps entre des clôtures algébriques K → L.
La preuve de ce lemme utilise les mêmes arguments que la question c) et peut
donc être raisonnablement admise (à condition de pouvoir l’expliquer en quelques
mots). Ce lemme et sa preuve à eux seuls peuvent constituer un développement
de niveau FF adapté aux leçons sur les prolongements et les corps de rupture.
99
20. Automorphismes sauvages de C
100
Anneaux, corps et théorie des nombres
lemme de Zorn soit maximal parmi les isomorphismes et pas seulement parmi les
automorphismes.
© On montre ici un résultat plus général que l’existence d’un automorphisme
sauvage : tout automorphisme d’un sous-corps de C peut être prolongé en un
automorphisme de C lui-même. Comme on l’a vu dans le développement, on peut
facilement prolonger des isomorphismes ou des automorphismes à des « petites »
extensions de corps, par exemple K(α)/K (en distinguant les cas selon que α
est algébrique ou transcendant). Malheureusement, on ne peut en général pas
atteindre C avec un nombre fini (même dénombrable) de telles extensions. C’est
pourquoi on utilise ici le lemme de Zorn, qui permet d’obtenir des prolongements
maximaux. Les « petites » extensions permettent alors de montrer que le prolon-
gement maximal est défini sur tout C. On verra dans les questions que ce résultat
est faux si on part initialement d’un isomorphisme et non d’un automorphisme.
© Le lemme de Zorn est un résultat équivalent à l’axiome du choix. Son énoncé
est le suivant :
Soit E un ensemble non vide muni d’un ordre noté <. Si (E, <) est
inductif, i.e. si toute sous-partie totalement ordonnée de E admet un
majorant, alors E admet un maximum.
101
20. Automorphismes sauvages de C
Questions.
1. Justifier que l’application ψ définie en b)(ii) est bien un isomorphisme.
2. Justifier que si α est transcendant sur L, alors L(α) est isomorphe à L(α) en
tant que L-algèbre.
3. Expliciter l’automorphisme de L(α) décrit en question c)(ii).
4. Expliciter l’application K[α]
e → L[β]
e définie dans la preuve du lemme, et
montrer qu’il s’agit bien d’un isomorphisme.
√
5. Montrer qu’il√ existe un sous-corps maximal K de R ne contenant pas 2.
Montrer que K[ 2] ( R, puis que R/K est une extension algébrique, et en déduire
que K est indénombrable (un tel corps est appelé sous-corps exotique de R).
6. Soient (an )n∈N une suite de complexes transcendants sur Q et algébriquement
indépendants. On définit un morphisme de corps ϕ : Q(a0 , . . .) → Q(a1 , . . .) par
ϕ(ai ) = ai+1 pour tout i ∈ N.
En appliquant le lemme de Zorn à la famille des isomorphismes ψ : K → L
prolongeant ϕ et tels que L ⊂ K et α0 est transcendant sur L, construire un
isomorphisme de C sur un corps K ne contenant pas α0 . En déduire que cet
isomorphisme n’est pas prolongeable en un automorphisme de C.
7. Montrer que si tout ensemble peut être muni d’un bon ordre, alors l’axiome du
choix est vrai.
8. Appliquer le lemme de Zorn pour montrer l’existence d’une base dans tout
espace vectoriel E, et en déduire l’existence d’une forme linéaire discontinue dans
tout K-espace vectoriel de dimension infinie (pour K = R ou C).
Indication : on pourra considérer l’ensemble des familles libres de E, muni de
l’inclusion.
9. À l’aide du lemme de Zorn, montrer que tout ensemble E peut être muni d’un
bon ordre.
Indication : on pourra considérer l’ensemble des couples (X, <X ), où X ⊂ E et
où <X est un bon ordre sur X, et l’ordonner par (X, <X ) < (Y, <Y ) si X ⊂ Y et,
pour tous x ∈ X et y ∈ Y , y <Y x si et seulement si y ∈ X et y <X x.
102
Anneaux, corps et théorie des nombres
E G = {α ∈ E : ∀σ ∈ G, σ(α) = α}.
Les F -morphismes d’une extension algébrique sont peu nombreux, et sont en-
tièrement déterminés par les images de générateurs. Ceux-ci sont des nombres
algébriques dont l’étude se fait en considérant leur polynôme minimal, justifiant
la présence de ce résultat dans les leçons 141 et 144. Ce développement est au
seuil de la théorie de Galois et de la théorie des extensions de corps, en faisant
une très bonne illustration pour la leçon 125. L’argument central est l’étude et
la manipulation astucieuse d’un système linéaire et en fait donc également un
développement pertinent pour la leçon 162.
Correction.
a) Soit φ : F [α] → K un morphisme de corps qui prolonge φ0 . Montrons que φ(α)
est une racine de φ0 (P ). Puisque φ est un morphisme de corps qui prolonge φ0 , on
a φ(P ) = φ0 (P ). En effet, en notant P = ni=0 ai X i avec des coefficients ai ∈ F
P
et un degré n = deg(P ) ∈ N, on a
n n n n
! !
X X X X
φ(P ) = φ ai X i = φ(ai )X i = φ0 (ai )X i = φ0 ai X i = φ0 (P ).
i=0 i=0 i=0 i=0
103
21. Théorème d’Artin
contient l’idéal (P ) dans son noyau puisque P annule γ. Elle se factorise donc par
le quotient F [X]/(P ). En composant par l’inverse de F [X]/(P ) ' F [α] qui est
défini par X + (P ) 7→ α, on obtient un morphisme φ : F [α] → K, résumé dans le
diagramme
evalγ
F [X] K
F [X]/(P ) φ
'
F [α]
104
Anneaux, corps et théorie des nombres
que σ(c1 ) = c1 pour tout σ ∈ E G . Prouvons que tous les ci sont dans E G .
En appliquant σk au système d’équations (2) et puisque σk ∈ G permute les
éléments de G, on obtient que (c1 , σk (c2 ), . . . , σk (cn )) est aussi une solution du
système, autrement dit
105
21. Théorème d’Artin
Commentaires.
© Ce développement est très modulable et peut être abordé avec de nombreux
niveaux de lecture différents :
• le développement présenté ci-avant est ambitieux, et demande une aisance
certaine avec les morphismes de corps, les extensions et les arguments de
factorisation. Cela justifie son niveau FFF ;
• on peut se contenter de présenter seulement le théorème d’Artin de la
question d), qui est très bref et permet de se concentrer sur les arguments
de la théorie des systèmes linéaires. Cela nécessite de bien comprendre les
notations et définitions, et constituerait un développement FF ;
• les résultats sur les correspondances bijectives entre racines et extensions
de morphismes de la question a) peuvent constituer un développement F,
mettant l’accent sur les extensions de corps et les racines de polynômes. Nous
encourageons dans ce cas à prendre φ0 = Id.
© Ce résultat est une des prémisses de la théorie de Galois, sans en avoir les
restrictions : c’est un résultat vrai pour tout corps et nécessitant peu de prére-
quis. La théorie de Galois est justement une correspondance descriptive entre
extensions de corps et sous-groupes du groupe de Galois associé, déjà en germe
dans les arguments ci-avant. Plus précisément, une version simple du théorème
fondamental de la théorie de Galois est la suivante, formulée dans le cadre du
présent développement :
K 7−→ Aut(E/K)
EH ←−[ H.
On dit dans ce cas que l’extension E/F est galoisienne, propriété qui admet de
nombreuses formulations équivalentes par un théorème d’Artin, parmi lesquelles :
• E est le corps de décomposition d’un polynôme séparable (i.e. admettant
des racines distinctes dans une clôture algébrique) à coefficients dans F ;
106
Anneaux, corps et théorie des nombres
• tout polynôme irréductible de F [X] admettant une racine dans E est scindé
dans E et à racines simples ;
• F est le corps fixe de Aut(E/F ) ;
• |Aut(E/F )| > [E : F ].
Notons que tout polynôme est séparable dans les corps de caractéristique nulle
(tels que Q, Qp , C(X)), dans les corps finis ou dans les corps algébriquement clos.
© La correspondance de Galois ci-avant n’est pas seulement une bijection entre
sous-groupes du groupe de Galois et extensions intermédiaires : elle préserve de
nombreuses informations structurelles.
• la correspondance renverse l’ordre : H1 ⊂ H2 ⇔ E H1 ⊃ E H2 ;
• l’indice correspond au degré : [H1 : H2 ] = [E H2 : E H1 ] ;
• H est distingué si et seulement si E H est normale, i.e. si tout polynôme
minimal d’un élément de E H est scindé dans E H [X].
Ce dictionnaire est ainsi très adapté à la reformulation d’un problème de théorie
des corps en termes de problème de théorie des groupes et réciproquement. On
pourra par exemple se référer à [Tau08] pour un exposé clair de la théorie et de
nombreux exemples. Nous laissons toutefois
√ un exemple assez simple de cette
3
correspondance pour l’extension Q( 2, j)/Q, où nous notons j pour l’une des
racines primitives 3-ièmes de l’unité :
√
Q( 3 2, j)
3 2
2
2
√ √ √
Q(j) Q( 3 2) Q(j 3 2) Q(j 2 3 2)
3 3
2 3
Q
√
Figure 1.2 – Corps intermédiaires de l’extension Q( 3 2, j)/Q ; les valeurs
indiquées correspondent aux degrés des extensions intermédiaires.
{1}
2
2
3 2
A3 h(12)i h(13)i h(23)i
3
3
2 3
S3
√
Figure 1.3 – Sous-groupes du groupe de Galois Aut(Q( 3 2, j)/Q) ' S3 ; les
valeurs indiquées correspondent aux indices des sous-groupes.
107
21. Théorème d’Artin
Questions.
1. Montrer que le corps fixe E G de G dans E est bien un corps.
2. Soit φ0 : F [α] → K un morphisme de corps et P le polynôme minimal de α.
Montrer que φ0 (P ) est le polynôme minimal de φ(α).
Indication : se rappeler que tous les morphismes de corps sont injectifs, et en
déduire qu’ils sont bijectifs F → F et donc bijectifs F [X] → F [X].
3. Soit α un nombre algébrique sur F et P son polynôme minimal. Pourquoi le
morphisme K[X]/(P (X)) → K[α] donné par X +(P ) 7→ α est-il un isomorphisme ?
4. Soient P et Q deux polynômes unitaires tels que P | Q. Montrer que si Q est
scindé, alors P est scindé.
5. Soit K un corps de décomposition de P . Montrer qu’il existe un F -morphisme
de corps E → K.
√
6. Vérifier l’énoncé à la main sur l’exemple E = Q( 2).
7. Soit P ∈ F [X] un polynôme de corps de décomposition E. Montrer que
[E : F ] 6 (degP )!.
108
Anneaux, corps et théorie des nombres
x2 + 2 = y 3 (1)
d’inconnues x, y ∈ N.
√
a) Dans un premier temps, on étudie l’anneau Z[i 2]. On montre d’abord qu’il
est factoriel, puis on s’intéresse à certains éléments remarquables (inversibles
et irréductibles).
√ √
(i) Soient a, b ∈ Z[i 2] avec b =6 0. Montrer qu’il existe q ∈ Z[i 2] tel qu’on
ait | ab − q| < 1.
√
(ii) En déduire que l’anneau Z[i 2] est euclidien.
√
(iii) Montrer que z ∈ Z[i 2] est√inversible si et seulement si |z|2 = 1. En
déduire les inversibles de Z[i 2].
√ √
(iv) Montrer que i 2 est irréductible dans Z[i 2].
b) Soit (x, y) ∈ Z2 une solution de l’équation x2 + 2 = y 3 .
√ √ √
(i) Montrer que√ kle pgcd de x + i 2 et x − i 2 dans Z[i 2] est de la
forme ±(i 2) pour k = 0, 1, 2 ou 3.
√ √
(ii) Si k 6= 0, montrer que i 2 divise x dans Z[i 2], puis que c’est impossible.
(iii) En déduire que x = ±5.
(iv) Conclure quant aux solutions de l’équation (1) et aux valeurs possibles
d’un entier n tel que n − 1 est un carré et n + 1 un cube.
Correction.
a
√ √
a) (i) Soient x, y ∈ R tels que = x + i 2y, ce qui est possible car j(1, i 2)
b k
est une base de C en tant que R-espace vectoriel. On définit x0 = x + 12
j k √
(respectivement y 0 = y + 12 ) et on pose q = x0 + i 2y 0 . Alors x0 (resp. y 0 ) est un
√
entier le plus proche de x (resp. y) et q est un élément de Z[i 2] le plus proche
de ab (voir Figure 1.4).
109
22. L’unique entier entre un carré et un cube
a
b
√
q = x0 + i 2y 0
√
Figure 1.4 – La maille du réseau Z[i 2] contenant ab .
On a alors
2
a 1 1
−q = (x − x0 )2 + 2(y − y 0 )2 6 + 2 × < 1.
b 4 4
√
(ii) Soient a, b ∈ Z[i 2]√ tels que b 6= 0. On cherche à montrer l’existence de
deux éléments q, r ∈ Z[i 2] √ tels que a = bq + r et |r| < |b|. D’après la question
√
précédente, il existe q ∈ Z[i 2] tel que | ab − q| < 1. En posant r = a − bq ∈ Z[i 2],
on obtient que a = bq + r et | rb | < 1. Ainsi, il existe une division euclidienne
√
sur Z[i 2], qui est donc un anneau euclidien.
√ √
(iii) Soit z = a + i 2b un inversible de Z[i 2]. Alors on a
1 = |zz −1 |2 = |z|2 |z −1 |2 .
110
Anneaux, corps et théorie des nombres
Commentaires.
© Les équations diophantiennes forment un domaine vaste et difficile dans lequel
peu de choses sont connues. De manière générale, il n’y a pas de méthode systé-
matique de résolution d’une équation diophantienne. C’était l’objet du dixième
problème de Hilbert, résolu négativement par Matiyasevich.
On peut en revanche résoudre le cas des petits degrés. Par exemple, le cas du
degré 1 (c’est-à-dire des équations diophantiennes de la forme ax + by = c) est
classique, et peut être résolu algorithmiquement via l’algorithme d’Euclide.
Le degré 2 fournit déjà des exemples difficiles. On peut par exemple citer les
équations de Pell-Fermat x2 ± ny 2 = ±1 pour n ∈ N∗ fixé. Dans ce cas, on peut
quand même obtenir des informations grâce au principe de Hasse, qui prouve
l’existence d’une solution rationnelle si et seulement s’il n’y a pas d’obstruction
locale, c’est-à-dire s’il existe une solution réelle, ainsi que modulo tout nombre
premier. Ceci est détaillé dans le Développement 23.
Le degré 3 a donné naissance à la riche théorie des courbes elliptiques.
© On trouve des traces de l’équation
x2 + c = y 3
111
22. L’unique entier entre un carré et un cube
dans les travaux de Bachet en 1621 (d’où le nom « équation de Bachet » donné à
ce type de relation). Il montre que si (x, y) est une solution rationnelle, alors c’est
aussi le cas de !
y 4 − 6cy −y 6 − 20cy 3 + 8c2
, ,
4x2 8x3
ce qui permet d’obtenir une infinité de solutions dès qu’on part d’une solution
où x et y sont non nuls et que c ∈/ {−1, 432}.
Le cas des solutions entières apparaît (avec c = 2) dans un défi lancé par Fermat à
la Royal Society vers 1650. Fermat conjecturait qu’il n’y avait que deux solutions
entières, ce qu’on montre ici. Euler proposa une preuve de ce résultat en 1730,
malheureusement fausse. La résolution complète de l’équation date seulement
du XIXe siècle. En 1908, Thue montre un résultat plus fort : pour tout entier
c 6= 0, l’équation de Bachet n’admet qu’un nombre fini de solutions entières. On
connaît même une borne explicite due à Baker (1968) :
112
Anneaux, corps et théorie des nombres
Questions.
√
1. Dans la question a)(i), justifier que q est un élément de Z[i 2] le plus proche
de ab . Quand y a-t-il unicité ?
2. Lors de l’identification des composantes dans la question d), pourquoi la
deuxième équation fournit-elle b = 1 et pas seulement b = ±1 ?
3. Soit n un entier et A un anneau factoriel. Montrer que si a et b sont deux
éléments de A premiers entre eux, et que ab est une puissance n-ème, alors a et b
sont aussi des puissances n-ièmes.
4. Montrer que tout élément premier d’un anneau intègre est irréductible. La
réciproque est-elle vraie ? Et dans un anneau factoriel ?
√
5. Montrer que Z[ 3] est euclidien.
6. Soit p un nombre premier. Montrer l’isomorphisme Fp [X]/(X 2 + 1) ' Z[i]/(p)
et en déduire que p est somme de deux carrés si et seulement si p = 2 ou p − 1 est
multiple de 4.
7. Étant donnés deux entiers a, b non nuls, quelles sont les solutions de l’équation
diophantienne ax + by = 1 d’inconnues entières x et y ?
8. Résoudre l’équation x2 + 4 = y 3 d’inconnues x, y ∈ Z.
9. Résoudre l’équation x2 + 1 = y 3 d’inconnues x, y ∈ Z.
Indication : on pourra considérer l’équation dans Z[i].
10. Résoudre l’équation x2 − 2 = y 3 d’inconnues x, y ∈ Z.
√
Indication : cette fois, l’anneau Z[ 2] comporte une infinité d’inversibles (les-
quels ?). Néanmoins, on peut suivre la méthode de l’énoncé : au lieu de calculer
explicitement le pgcd d,
√ on peut distinguer
√ deux cas
√ selon qu’il existe ou non un
élément premier de Z[ 2] divisant x + 2 et x − 2.
11. Montrer que l’équation y 3 = x2 + 432 n’admet que deux solutions rationnelles.
Indication : on pourra montrer que cette équation admet une solution rationnelle
si et seulement si l’équation (36z + x)3 + (36z − x)3 = (6y)3 admet une solution
entière, puis utiliser le grand théorème de Fermat.
12. Sans utiliser le grand théorème de Fermat, montrer que l’équation diophan-
tienne y 3 = x2 + 432 n’admet que deux solutions (dans Z2 ).
h √ i
1+i 3
Indication : on pourra considérer l’équation dans Z 2 .
113
23. Valeurs absolues sur Q
a) Montrer que pour tout nombre premier p, | · |p est une valeur absolue.
b) Soit | · | une valeur absolue non triviale telle que Z soit borné, i.e. il existe
un entier N tel que |n| 6 N pour tout n ∈ Z.
(i) Montrer qu’il existe un nombre premier p tel que |p| < 1.
(ii) Montrer que pour tout entier n premier à p, on a |n| = 1. En déduire
que | · | est équivalente à | · |p .
c) Soit | · | une valeur absolue non triviale telle que Z soit non borné. Soit a
un entier supérieur à 2 tel que |a| =
6 1, et M = max{|1|, . . . , |a − 1|}.
(i) Montrer que pour tout entier n ∈ N∗ , il existe un entier rn 6 ln n
ln a tel que
rn
X
|n| 6 M |a|m .
m=0
ln n
k
|n| 6 M k +1 ,
ln a
et en déduire une contradiction.
ln |n| ln |a|
(iii) Si |a| > 1, montrer que pour tout entier n on a ln n 6 ln a .
(iv) En déduire que | · | est équivalente à | · |∞ .
114
Anneaux, corps et théorie des nombres
Correction.
a) Soit p un nombre premier. Montrons que | · |p est une valeur absolue.
• Par définition, | · |p est bien à valeurs positives, et vérifie la condition de
séparation.
• Montrons maintenant que |·|p est multiplicative. Soient x et y deux rationnels,
k `
et a, b, c, d, k, ` des entiers relatifs vérifiant bd 6= 0, x = p b a et y = pdc avec
t ∧ p = 1 pour tout t ∈ {a, b, c, d}. Alors
pk+` ac
xy = avec ac ∧ p = bd ∧ p = 1,
bd
d’où |xy|p = p−(k+`) = p−k · p−` = |x|p |y|p . Ainsi | · |p est multiplicative.
• Il reste à montrer que | · |p satisfait l’inégalité triangulaire. Reprenons les
notations précédentes, en supposant de plus par symétrie que k 6 `. Alors
on peut écrire
!
k a p`−k c ad + p`−k b
x+y =p + = pk .
b d bd
Ainsi, | · |p vérifie l’inégalité triangulaire et est donc bien une valeur absolue.
b) (i) Commençons par montrer qu’il existe n ∈ N∗ tel que |n| < 1.
Tout d’abord, on utilise que | · | est non triviale pour construire un entier n non
nul tel que |n| =
6 1. Si un tel entier n’existe pas, alors tout entier non nul a pour
valeur absolue 1. En particulier, pour tout rationnel non nul x = ab , on a
|a|
|x| = = 1.
|b|
115
23. Valeurs absolues sur Q
|p|k |a| α
|x| = = |p|k = p−kα = pk = |x|αp .
|b| p
Si |a| 6 1, on obtient
!
ln(nk ) ln n
k
|n| 6 M (rnk + 1) 6 M +1 =M k +1 .
ln a ln a
En passant à la racine k-ième, on obtient finalement
1
ln n
1 k
|n| 6 M k k +1 .
ln a
Le membre droit converge vers 1 quand k tend vers +∞, ce qui montre l’inéga-
lité |n| 6 1. Ainsi, Z est borné pour | · |, ce qui est contraire à l’hypothèse.
116
Anneaux, corps et théorie des nombres
(iii) On sait donc maintenant que |a| > 1. Soient n, k deux entiers non nuls. On
passe à nouveau à la racine k-ième dans l’équation (1), en majorant différemment :
1 !1
r
nk k 1
|a|rnk +1 − 1 k
M |a| 1
k
|a|rnk − |a|−1
X
m k
|n| 6 M |a| 6 M 6
m=0
|a| − 1 |a| − 1
1 1 1 1
M |a| M |a|
k n k ln n ln n
k ln
−1
|a| ln a 1 − |a|−k ln a −1
k k
6 |a| ln a − |a| = .
|a| − 1 |a| − 1 | {z }
−→ 1
| {z }
−→ 1 k→+∞
k→+∞
ln n ln |n| ln |a|
On a donc |n| 6 |a| ln a , d’où finalement ln n 6 ln a .
(iv) D’après la question c)(ii), on sait que tout entier n > 1 vérifie |n| > 1.
Si |n| > 1, on peut refaire les calculs des questions précédentes, cette fois en écrivant
a en base n. On obtient alors que lnln|n| ln |a| ln |x|
n = ln a . Autrement dit, le rapport ln x est
constant sur les entiers x de valeur absolue strictement plus grande que 1. Notons
α cette constante, qui est positive.
Comme | · | n’est pas triviale, il existe un entier a tel que |a| > 1. Soit n ∈ N∗ .
Pour tout entier k, on a |nak | = |n| · |a|k . Comme |a| > 1, on peut trouver un k
assez grand pour que |nak | > 1. Alors on a
d’où |n| = nα .
Ainsi, on a |n| = nα = |n|α∞ pour tout entier n, ce qu’on peut étendre par
multiplicativité à Z puis à Q. On obtient finalement que | · | est équivalente à la
valeur absolue usuelle | · |∞ .
Commentaires.
© Chaque valeur absolue | · | permet de définir une topologie (métrique) sur Q :
celle engendrée par les boules ouvertes pour la distance associée (x, y) 7→ |x − y|.
La topologie usuelle est obtenue avec la valeur absolue | · |∞ , la topologie discrète
provient de la valeur absolue triviale et, enfin, la topologie p-adique est celle fournie
par la valeur absolue | · |p pour tout entier p premier. Bien que ce ne soit pas le
point de vue abordé dans le développement, l’équivalence de valeurs absolues est
traditionnellement définie comme l’équivalence des topologies associées. Comme
on le verra dans les questions, les deux points de vue sont équivalents : deux
valeurs absolues sont équivalentes (au sens du développement) si et seulement si
elles engendrent la même topologie.
© Le théorème d’Ostrowski assure qu’il n’existe que trois types de (topologies
associées à des) valeurs absolues sur Q : la valeur absolue triviale, la valeur absolue
usuelle, et les valeurs absolues p-adiques. Ces dernières sont qualifiées de non-
archimédiennes, à la différence de | · |∞ , dite archimédienne. La propriété « être
archimédien » peut s’énoncer de différentes manières : « il n’y a pas d’élément
117
23. Valeurs absolues sur Q
infiniment petit », « on peut vider l’océan avec une petite cuillère », ou plus
formellement :
∀M, ε ∈ Q∗ , ∃n ∈ N, |M | 6 |nε|.
© Les valeurs absolues p-adiques vérifient une inégalité plus forte que l’inégalité
triangulaire. Il s’agit de l’inégalité ultramétrique :
118
Anneaux, corps et théorie des nombres
Questions.
1. Montrer que pour toute valeur absolue sur Q, on a |1| = 1, |−n| = |n| et
| ab | = |a|
|b| pour tout a, b, n ∈ N avec b 6= 0.
2. Justifier l’égalité |n| = | − n| utilisée en question b)(i).
3. Justifier les limites obtenues dans les questions c)(ii) et (iii).
4. Montrer que | · |∞ et les | · |p sont deux à deux non équivalentes.
5. Montrer la formule du produit :
∀x ∈ Q∗ ,
Y
|x|∞ · |x|2 · |x|3 · |x|5 · · · = |x|∞ · |x|p = 1.
p premier
119
24. Théorème de Fermat et cyclotomie
xp + y p = z p , (1)
120
Anneaux, corps et théorie des nombres
Ainsi, l’inverse de uj ∈ Z[ζ] dans Q(ζ) est dans Z[ζ], donc uj ∈ Z[ζ]× , autrement
dit uj est une unité de Z[ζ]. Ainsi, tous les 1 − ζ j sont associés à l’élément 1 − ζ,
et par transitivité tous les 1 − ζ j associés entre eux.
(ii) On déduit en particulier de ce qui précède que 1 − ζ 2 = (1 − ζ)(1 + ζ) est
égal à 1 − ζ à une unité près, donc en simplifiant par 1 − ζ on déduit que 1 + ζ
est une unité.
(iii) Rappelons la décomposition du polynôme cyclotomique
p−1
Y
Φp = 1 + X + · · · + X p−1 = (X − ζ j ),
j=1
1. Pour éviter les confusions, nous notons explicitement l’anneau sous-jacent aux idéaux dans
ce développement. En effet, « modulo p » signifie modulo l’idéal engendré par p, mais celui-ci
est pZ lorsque considéré comme idéal de Z, et pZ[ζ] lorsque considéré comme idéal de Z[ζ].
121
24. Théorème de Fermat et cyclotomie
où les uj , et donc leur produit, sont des unités par le résultat obtenu en (i).
Ainsi, p est associé à (1 − ζ)p−1 .
(iv) En considérant les normes 2 de la relation ci-avant, pp−1 = N (1 − ζ)p−1
où N dénote la norme dans Z[ζ]. Puisque N (1 − ζ) ∈ Z, on a N (1 − ζ) = ±p qui
est premier, donc que l’idéal (1 − ζ) est premier. Le point (iii) ci-avant implique
que pZ[ζ] = (1 − ζ)p−1 . Par unicité de la factorisation des idéaux en produit
d’idéaux premiers, on en déduit que (1 − ζ) est le seul idéal premier divisant pZ[ζ]
dans l’anneau Z[ζ].
c) La conjugaison complexe est un automorphisme de corps de Q(ζ)/Q, donc un
élément du groupe de Galois associé. Puisque ce groupe de Galois est abélien,
comme pour toute extension cyclotomique 3 , on en déduit que pour tout auto-
morphisme σ ∈ Gal(Q(ζ)/Q) et v ∈ Z[ζ]× , on a σ(v̄) = σ(v). Rappelons que la
norme d’un corps de nombres est le produit de tous les conjugués par le groupe de
Galois, ce qui implique que N v = N v̄. En particulier, v/v̄ et ses conjugués sont de
norme 1. Puisque son polynôme minimal est à coefficients entiers, cela implique
donc que ce sont des racines de l’unité dans C par le lemme de Kronecker (voir
les commentaires suivant le développement pour une preuve de ce fait).
d) L’équation de Fermat (1) se factorise en
p−1
Y
z p = xp + y p = (x + ζ j y). (3)
j=0
x + ζy = utp .
t = a0 + a1 ζ + · · · + ap−2 ζ p−2 ,
2. La norme d’un élément est égal au produit de tous ses conjugués, i.e. de toutes les racines
de son polynôme minimal. Elle est notamment multiplicative.
3. Voir Développement 19 pour une preuve élémentaire de ce fait.
4. Rappelons que le polynôme minimal de ζ est Φp = 1 + X + · · · + X p−1 le polynôme
cyclotomique d’indice p. En particulier, ζ p−1 est combinaison linéaire des ζ i pour i ∈ J0, p − 2K,
et ceux-ci forment une base du Z-module Z[ζ].
122
Anneaux, corps et théorie des nombres
On en tire que, dans le cas où u/ū = ζ j , en rappelant que pour les racines de
l’unité ζ̄ = ζ −1 ,
x + yζ − xζ j − yζ j−1 ≡ 0 mod pZ[ζ], (4)
123
24. Théorème de Fermat et cyclotomie
et cela donne une relation linéaire non triviale, exprimant les ζ j , pour
2 6 j 6 p − 3, comme combinaison linéaire des autres ζ i .
L’équation (5) donne x(ζ + ζ 2 ) + y(1 + ζ 3 ) ≡ 0 modulo pZ[ζ], aboutissant
également à une relation de dépendance linéaire non triviale.
Ainsi, aucun des cas précédents n’est possible, et l’équation de Fermat xp +y p = z p
n’admet pas de solution entière avec p - xyz pour p > 3.
Commentaires.
© Ce développement repose sur l’arithmétique élémentaire dans différents anneaux.
Plus précisément, le cadre est parfois relatif à l’arithmétique dans Z, parfois relatif
à celle dans l’anneau des entiers cyclotomiques
Z[ζ] = {a0 + a1 ζ + · · · + ap−2 ζ p−2 : ai ∈ Z}.
Les arguments doivent donc soigneusement rappeler l’anneau dans lequel la
notion de divisibilité est considérée, ainsi que les idéaux par rapport auxquels
les congruences ont lieu : les idéaux pZ et pZ[ζ] sont différents et les deux
interviennent dans ce développement. On évitera donc d’utiliser la notation
habituelle (p) pour parler de l’idéal engendré par p, puisque cette notion dépend
de l’anneau de base. Seuls les idéaux faisant intervenir ζ seront notés de cette
manière, étant nécessairement relatifs à Z[ζ]. Cet incessant ballet entrelaçant
les deux arithmétiques illustre joliment la puissance de la théorie algébrique des
nombres, introduite par Kummer à qui est dû ce résultat important sur l’équation
de Fermat, et qui est à la base de tous les développements récents aboutissant à
la preuve par Wiles du grand théorème de Fermat.
124
Anneaux, corps et théorie des nombres
n’a pas de solution avec x, y et z entiers non nuls. Dès 1630 on retrouve cette
assertion dans les travaux de Fermat, en marge de laquelle une fameuse annotation
manuscrite indique qu’il en connait une preuve que la marge en question est trop
petite pour contenir. Il donne toutefois une preuve explicite et élémentaire du cas
n = 4.
En 1753, Euler donne une preuve de cette assertion pour n = 3. Encore près d’un
siècle plus tard, un pas de plus est fait par Dirichlet et Legendre qui résolvent le
cas n = 5 à travers une preuve de haute voltige technique. Il faut attendre Sophie
Germain pour avoir le premier résultat général. Elle prouve en effet que pour p
premier tel que 2p + 1 est également premier, alors l’équation xp + y p = z p n’a
pas de solution avec x, y et z entiers premiers à p.
Kummer apporte une véritable première révolution dans l’approche de ce problème
diophantien en introduisant les idées de la théorie algébrique des nombres, et
notamment en utilisant l’arithmétique dans des corps plus généraux : les corps
cyclotomiques Q(ζ). Ce développement illustre la puissance de cette étape, qui
ouvre la porte aux développements futurs menant jusqu’à la preuve de Wiles du
grand théorème de Fermat en 1994. Pour plus de détails sur cette épopée, voir
par exemple [Hel01].
© L’hypothèse (?) sous laquelle Kummer prouve le résultat est que p est régulier,
autrement dit que p ne divise pas le nombre de classes d’idéaux de l’anneau des
entiers cyclotomiques Z[ζ]. Cela est équivalent à dire que si un idéal a est tel
que ap est principal, alors a est principal. Cette hypothèse peut être remplacée,
pour ne pas avoir à parler d’idéaux, par la version explicite suivante : pour tous
éléments premiers entre eux x1 , . . . , xn dans Z[ζ], si leur produit x1 · · · xn est une
puissance p-ième, alors chacun d’eux est associé à une puissance p-ième. Elle peut
aussi être remplacée par l’hypothèse, toutefois beaucoup plus forte, que Z[ζ] est
un anneau factoriel ou principal. Donnons une idée de la force de ces hypothèses :
• on estime avec quelques heuristiques et des résultats numériques que 61%
des nombres premiers sont réguliers (toutefois, la question de savoir s’il y en
a une infinité est encore ouverte) ;
• à l’inverse, l’hypothèse que l’anneau Z[ζ] des corps cyclotomiques est factoriel
est beaucoup plus restrictive : c’est le cas si, et seulement si, p 6 23.
© La disjonction en deux cas p - xyz et p | xyz introduite dans ce développement
est omniprésente dans les différentes étapes et résultats intermédiaires nécessaires
au théorème de Fermat. Le cas p - xyz est appelé le premier cas du théorème,
le second étant celui où l’une des valeurs est divisible par p. Le second cas est
plus difficile, et il nécessite essentiellement un ingrédient supplémentaire — le
lemme de Kummer — pour pouvoir être abordé. Cela permettrait de compléter
125
24. Théorème de Fermat et cyclotomie
la preuve du grand théorème de Fermat dans les cas de premiers réguliers avec
des arguments similaires à ceux ci-avant.
© Fondamentalement, ce développement est une application élémentaire de l’arith-
métique modulaire dans des anneaux d’entiers de corps de nombres. Le point
central faisant que cette arithmétique vérifie les propriétés usuelles des congruences
est le théorème fondamental de l’arithmétique associé : malgré le fait que certains
anneaux d’entiers tels Z[ζ] ne sont pas factoriels, il y a toutefois unique factorisa-
tion des idéaux en produit d’idéaux premiers, voir [Sam67]. Il faut simplement
garder ce fait à l’esprit, et que la relation d’équivalence naturelle dans ce cadre
est celle d’éléments associés, i.e. égaux à une unité multiplicative près.
© Pour prouver que l’équation de Fermat n’a pas de solution, il suffit de le prouver
pour des puissances premières. En effet, toute solution de xn + y n = z n induit
également une solution pour xk +y k = z k pour tout k divisant n. Plus précisément,
si n = qk et xn + y n = z n , alors (xq )k + (y q )k = (z q )k . L’hypothèse des puissances
premières considérées dans ce développement n’est donc pas restrictive.
© Dans la question c), on se sert d’un résultat qu’il est bon de savoir redémontrer,
et qui est un résultat bienvenu dans les plans de leçons sur les racines de l’unité
ou sur les racines de polynômes. Il s’agit du lemme de Kronecker :
Soit P un polynôme unitaire à coefficients entiers. Si les racines de P
sont de valeurs absolues inférieures à 1, alors ce sont des racines de
l’unité.
Donnons une preuve de ce fait, qui peut être ou non intégrée au développement
selon, les goûts et les besoins. Introduisons les notations, pour n > 1,
d
Y d
Y
P = (X − αi ) et Pn = (X − αin ),
i=1 i=1
(Pn )n∈N ne contient qu’un nombre fini de polynômes, il existe donc k > 1 et
k
` > 1 tels que P2k = P2k+` . Ainsi, élever à la puissance 2` permute les αi2 . En
particulier, un nombre fini m > 1 d’itérations de cette procédure agit comme
k k+`m
l’identité, autrement dit αi2 = αi2 pour tout i, ce qui fait que les αi sont des
`m
racines (2 -ièmes) de l’unité.
126
Anneaux, corps et théorie des nombres
Questions.
1. Que se passe-t-il si x, y et z ne sont pas premiers entre eux ?
2. Justifier que si la norme d’un idéal est un entier premier, alors l’idéal est
premier.
3. Justifier la décomposition (2).
4. Montrer que l’anneau des unités Z[ζ]× est {±ζ j : j ∈ J0, p − 2K}.
5. Montrer que Z[ζ] est l’anneau des entiers du corps cyclotomique Q[ζ].
6. Montrer que le polynôme cyclotomique Φp est irréductible.
7. Démontrer que Z[ζ]/(1 − ζ)2 ' (Z/pZ)[X]/(1 − X)2 pour p > 3 mais pas pour
p = 2.
8. Démontrer que (Z/pZ)[X]/Φp ' (Z/pZ)[X]/(X − 1)p−1 .
Indication : montrer que, pour k ∈ J0, p − 1K, on a p−1 ≡ (−1)k modulo p.
k
9. Que dire du cas p = 2 ? Connait-on des solutions de l’équation de Fermat dans
ce cas ? Quelle est la forme de toutes les solutions ?
Indication : factoriser l’équation en x2 = (z − y)(z + y), et justifier que l’on peut
se limiter au cas où z − y et z + y sont premiers entre eux. Ce sont donc tous les
deux des carrés.
127
25. Problème de Waring modulo q
φ(pγ )
.
(k, φ(pγ ))
e) Supposons que
p
s> (k, φ(pγ )).
p−1
Montrer que pour tout n > 1, on a Mn∗ (pγ ) > 0.
128
Anneaux, corps et théorie des nombres
Correction.
a) Puisque p est impair, le groupe multiplicatif des unités de Z/pγ Z est cyclique
d’ordre n = φ(pγ ). Soit x un générateur de ce groupe, de sorte qu’on peut
écrire (Z/pγ Z)× = hxi. Pour k > 1, l’ordre de xk dans ce groupe est donc n/(k, n).
Considérons l’ensemble des puissances k-ièmes dans (Z/pγ Z)× . Il s’agit d’un sous-
groupe de (Z/pγ Z)× , il est donc lui-même cyclique. Vérifions qu’il est engendré
par xk . Tout d’abord, les puissances de xk sont bien sûr des puissances k-ièmes,
donc hxk i est constitué de puissances k-ièmes dans (Z/pγ Z)× . Réciproquement
toute puissance k-ième de (Z/pγ Z)× s’écrit comme y k avec y ∈ (Z/pγ Z)× = hxi.
Or y est de la forme xa pour un certain a > 0, et en particulier
a D E
y k = (xa )k = xk ∈ xk .
Ainsi, le sous-groupe de (Z/pγ Z)× formé de ses puissances k-ièmes est hxk i. En
particulier, il y a exactement n/(k, n) puissances k-ièmes dans (Z/pγ Z)× .
b) Soit t > γ. Soit y ∈ Z∗ une puissance k-ième modulo pt . Nous allons prouver
que y est alors une puissance k-ième modulo pt+1 , ce qui permettra de conclure
la preuve de la propriété voulue par récurrence.
Puisque y est une puissance k-ième modulo pt , il existe x ∈ Z tel que xk − y ≡ 0
modulo pt . Nous voulons trouver un a ∈ Z tel que (x+apt−τ )k −y ≡ 0 (mod pt+1 ).
En développant par la formule du binôme et en divisant par pt , cela se réécrit
k
!
xk − y −τ k−1
X k k−j j j(t−τ )−t
t
+ kp x a + x a p ≡ 0 mod p.
p j=2
j
Le coefficient de a dans le second terme est inversible modulo p, car pτ ||k par
définition de τ et puisque x est premier à p (car y est premier à p). Il reste à
prouver que tous les termes de la somme pour k > 2 sont divisibles par p, ce qui
permettra d’obtenir la valeur explicite
xk − y
a=− · (kp−τ xk−1 )−1 mod p .
pt
En écrivant le terme de la somme ci-avant pour un j ∈ J2, kK, on obtient
! !
k k − 1 k−j j j(t−τ )−t kp−τ k − 1 k−j j (j−1)(t−τ )
x a p = x a p .
j j−1 j j−1
Le facteur kp−τ est un entier, pour les mêmes raisons que précédemment. Il
reste à prouver que le dénominateur j ne compense pas de facteur de p(j−1)(t−τ ) ,
autrement dit que vp (j) < (j − 1)(t − τ ). Puisque t > τ , il suffit que vp (j) < j − 1.
Puisqu’on a j < pj−1 pour tout j > 2 (car p > 2), on en déduit que j ne peut pas
être divisible par pj−1 , ce qui permet de conclure.
Ainsi, y est une puissance k-ième modulo pt+1 . Puisque c’est une puissance k-ième
modulo pγ , par récurrence immédiate c’est aussi une puissance k-ième modulo pt
pour tout t > γ.
129
25. Problème de Waring modulo q
que de classes yj modulo pt telles que yj ≡ xj mod pγ , pour tous t > γ et j > 2.
En effet, si on prend de tels y2 , . . . , ys , alors la quantité n − y2k − · · · ysk est congrue
à n − xk2 − · · · xks = xk1 modulo pγ . C’est donc une puissance k-ième modulo pγ
qui est relativement première à p, donc aussi modulo pt par la question b).
Comptons désormais le nombre de tels (s − 1)-uplets : chaque yj a autant de
choix que de solutions de l’équation yj ≡ xj mod pγ dans Z/pt Z. Ces solutions
correspondent aux m ∈ Z tels que 0 6 yj = xj + mpγ < pt , c’est-à-dire aux m tels
que 0 6 m < pt−γ . Il y a pt−γ telles solutions.
s−1
On obtient donc pt−γ solutions correspondant aux choix des yj . Ainsi,
mais alors cela donnerait aβ ≡ 0 mod q, ce qui n’est pas possible car a < q et β
est premier à q. Introduisons alors les ensembles
C = {β ∈ B : α + β ∈
/ A},
A0 = A ∪ (α + C),
B 0 = B\C.
L’hypothèse de récurrence est donc vérifiée au rang b, ce qui achève la preuve par
récurrence.
e) Prouvons-le par récurrence. Soit Ar = {xk1 + · · · + xkr − n : xi ∈ Z/pγ Z}
et B l’ensemble des puissances k-ièmes dans (Z/pγ Z)× , ainsi que l’élément nul.
Introduisons ω = φ(pγ )/(k, φ(pγ )). Pour r > 0, soit P(r) la propriété :
P(r) : « |Ar + B| > min(pγ , (r + 1)ω) ».
130
Anneaux, corps et théorie des nombres
Commentaires.
© Ce développement, très technique, peut être modulé en fonction de la leçon
dans laquelle il est présenté. Ainsi, les questions a) et b) peuvent être seulement
citées de sorte à donner de l’importance aux arguments combinatoires ; ou alors
la question d) peut être utilisée comme un outil de sorte à gagner du temps pour
les arguments arithmétiques.
© Le résultat de la question a) est intéressant en soi et illustre les arguments de
comptage typiques de l’arithmétique classique. Le résultat de la question b) est
surprenant : généralement une puissance k-ième modulo pγ est une puissance k-
ième modulo pt pour t 6 γ, mais on ne peut pas dire mieux. Ici, la propriété
est vraie pour tout t grâce au choix particulier de γ. Les arguments utilisés dans
ces deux questions sont très particuliers aux groupes cycliques, et c’est là tout
l’intérêt de connaître précisément la structure des groupes des unités de Z/pγ Z.
Ces deux questions peuvent constituer à elles seules des développements.
© Le développement se concentre sur le cas p > 2. Le cas p = 2 se traite suivant
la même démarche avec quelques spécificités dues au fait que (Z/2γ Z)× n’est plus
cyclique pour γ > 1. On obtiendrait le même résultat pour la dernière question,
avec s > 2τ +2 si τ > 0 et k > 2, et s > 5 si p = k = 2.
© Ce problème est la version modulaire du problème de Waring, qui consiste à
déterminer si tout nombre entier suffisamment grand peut être écrit sous la forme
n = xk1 + · · · + xks , x1 , . . . , xs ∈ Z,
pour un certain s. Ce problème de la fin du XIXe siècle a été l’occasion pour Hardy
et Littlewood d’introduire la méthode du cercle, permettant d’aborder ce problème
avec des outils analytiques et des résultats sur les comportements de sommes
131
25. Problème de Waring modulo q
d’exponentielles. Ils montrent en particulier que pour tout k > 2, un tel s existe.
Peu de choses sont connues concernant le plus petit s possible, on sait par exemple
que tout entier suffisamment grand est somme de 4 carrés, 9 cubes ou encore 19
puissances quatrièmes et que ces valeurs sont optimales. Le résultat prouvé ici,
combinant les questions c) et e), est qu’il existe un s suffisamment grand tel que
ce problème ait une solution modulo pγ . Ce fait est une étape importante dans
la solution du problème de Waring (voir [Vau97] une introduction complète à la
méthode du cercle et les relations avec le problème global).
© L’arithmétique modulaire et les réductions d’équations modulo q sont un
outil puissant en arithmétique. Depuis que Gauss a développé formellement
et fonctionnellement cette arithmétique modulaire, elle n’a cessé de porter ses
fruits. Par exemple, le principe de Hasse est un principe local-global qui énonce
l’équivalence entre l’existence de solutions d’une équation diophantienne de degré 2
sur Z, et l’existence de telles solutions modulo pk , pour tout p premier et k > 1,
ainsi que dans R. Mais ce principe est en défaut à partir du degré 3. Dans certains
cas, soit l’approximation modulo pk suffit (voir Développement 13), soit des
arguments ad hoc permettent quand même de conclure à des solutions globales.
© La réponse à la question b) revient à dire que, dans ce cas, si un élément est
une puissance k-ième modulo pγ alors il est aussi une puissance k-ième modulo
tout puissance plus élevée de p. C’est une conclusion typique du lemme de Hensel
cité précédemment, dont nous donnons une version plus fine ici, utilisant la valeur
absolue p-adique et les nombres p-adiques :
Soit P ∈ Z[X]. S’il existe x ∈ Zp tel que
Questions.
1. Montrer que tout sous-groupe d’un groupe cyclique est cyclique. Rappeler quels
sont ses sous-groupes d’un ordre donné.
2. Montrer que φ(pt ) = pt−1 (p − 1).
3. Montrer que l’ordre de xk dans le groupe cyclique d’ordre n engendré par x
est n/(k, n).
4. Soit t > γ. Supposons que (Z/pt Z)× soit engendré par un élément x. Montrer
t−γ
alors que (Z/pγ Z)× = hxp i.
132
Algèbre linéaire
L’algèbre linéaire naît avec l’étude des systèmes linéaires, de leurs transformations
et de leurs ensembles de solutions. Cette théorie trouve de nombreuses applications
en mathématiques fondamentales comme appliquées : description des isométries
de l’espace (Développement 43), approximation des moindres carrés, résolution
d’équations différentielles couplées, détermination de trajectoires physiques avec
contraintes, recherche d’équilibres de Nash en stratégies mixtes, etc.
Le cadre de la dimension finie donne à l’algèbre linéaire de nombreux outils
pratiques et puissants : représentation matricielle, trace, déterminant, récurrences
sur la dimension, théorème spectral, etc. Le problème originel de l’algèbre linéaire
demeure la résolution de systèmes de la forme Ax = b, ce qui confère une grande
importance aux aspects algorithmiques du calcul matriciel, largement illustrés
dans cet ouvrage à travers différentes méthodes itératives (Dév. 74, 75, 76, 77).
Une idée maîtresse de l’algèbre linéaire est la réduction des endomorphismes,
qui consiste à décomposer l’espace en somme directe de sous-espaces stables sur
lesquels l’endomorphisme agit plus simplement. Idéalement, ces actions seraient
des homothéties (c’est le cas diagonalisable). Dans le cas général, on ne peut pas
garantir l’existence d’une si bonne réduction, mais des résultats existent dans
de nombreux cas particuliers. Une vision plus spectrale ou géométrique est ainsi
donnée par la détermination d’invariants par changements de base, indépendants
de la forme particulière d’une matrice ou d’un système linéaire, tels que les valeurs
propres, polynômes minimal et caractéristique, relations algébriques, rang, noyau,
décomposition de Jordan (Dév. 80), forme normale de Smith (Dév. 37), etc. Cette
idée demeure en dimension infinie, où la théorie spectrale pose la question de la
décomposition spectrale adaptée à un opérateur.
De nombreuses propriétés particulières permettent d’assurer des résultats de
réduction : nilpotence, semi-simplicité, symétrie, orthogonalité, etc. Certaines des
classes d’endomorphismes associées sont étudiées dans ce livre (Dév. 34, 35, 37).
Certains développements traitent d’un sujet accessible au niveau de l’agrégation
mais moins habituel : celui des groupes et algèbres de Lie (Dév. 39). Il s’agit
d’un pont entre groupes et algèbre linéaire : en effet, tout groupe de Lie (défini
comme un groupe ayant une structure de variété différentielle — c’est le cas de
tout sous-groupe fermé de GLn ) est localement isomorphe à son algèbre de Lie
(qui est son espace tangent en l’élément neutre) par l’application exponentielle
(Dév. 55). Cette correspondance permet de ramener des problèmes de théorie des
groupes au cadre beaucoup plus agréable des espaces vectoriels.
Algèbre linéaire
Soit n > 1. Soit K un corps topologique non discret (par exemple R ou C).
a) Soient x et y des vecteurs non nuls de K n ' Mn,1 (K).
(i) Déterminer les valeurs propres de M = xt y en fonction de tr(M ).
(ii) Calculer le déterminant det(In + xt y).
b) Soit M ∈ Mn (K). Soient x, y ∈ K n ' Mn,1 (K).
(i) Montrer que, pour M inversible, on a
det(M + xt y) = det(M ) + t y · t
com(M )x . (1)
(ii) Montrer que la formule (1) demeure pour toute matrice M ∈ Mn (K).
Correction.
a) (i) Puisque la matrice M est de rang 1, le théorème du rang garantit que
son noyau est de dimension n − 1, en particulier M admet la valeur propre 0 avec
multiplicité géométrique n − 1. Il reste une valeur propre λ ∈ K à déterminer.
Puisque la trace de M est la somme des valeurs propres dans une clôture algébrique,
elle est égale à λ. En écrivant explicitement les coordonnées, il vient
n
X
λ = tr(M ) = xi yi = hx, yi = t yx,
i=1
M + xt y = M (In + M −1 xt y).
135
26. Perturbation par des matrices de rang un
det(M )M −1 = t com(M ).
Commentaires.
© Une matrice de rang un a par définition ses colonnes toutes colinéaires à un
même vecteur x ∈ Mn,1 (K), de sorte qu’elle s’écrit sous la forme xt y pour un
certain y ∈ Mn,1 (K). Cela décrit toutes les matrices de rang 1 avec x et y non nuls.
Le développement propose donc de comprendre les déformations du déterminant
par les matrices de rang 1 sans plus de restriction.
© Le déterminant est une fonction multiplicative au comportement additif peu
maîtrisé. Il est donc intéressant d’avoir des résultats sur le comportement du
déterminant lorsqu’il y a une déformation additive, et c’est ce qui est proposé dans
ce développement dans le cas des matrices de rang 1. Il est important de rapprocher
cette idée de celle de différentielle d’une fonction, et on pourra mentionner la
différentielle du déterminant en rapport avec ces résultats.
© Le développement peut être présenté en choisissant le corps K = R ou C si
cela rend l’exposé et le cadre plus confortable, mais ces hypothèses ne sont pas
nécessaires. La seule nécessité est que GLn (K) soit dense dans Mn (K). Il suffit
par exemple d’avoir un corps topologique K non discret. Il existe alors une suite
(tn )n de K × tendant vers zéro, de sorte que l’argument classique fonctionne :
(A + tk In )k∈N est une suite de matrices inversibles à partir d’un certain rang qui
converge vers A. De plus, K est dense dans K par construction de la complétion
et continuité des opérations. Voir les questions ci-après.
© Il faut faire attention à l’argumentaire de la dernière question : il ne suffit pas
de conclure que P est nul puisque c’est un polynôme qui s’annule sur un ensemble
infini. Cet argument ne tient que pour les polynômes à une variable : par exemple
le polynôme P (X, Y ) = XY ∈ C[X, Y ] n’est manifestement pas le polynôme nul,
pourtant il s’annule sur deux les droites D1 : x = 0 et D2 : y = 0. Il est nécessaire
d’avoir des conditions plus fortes : ici, la densité suffit pour étendre la nullité
prouvée à la question b)(ii) à tout l’ensemble, et pour cela il est nécessaire de
passer par une complétion de K de sorte à garantir la densité de l’ensemble des
matrices inversibles.
136
Algèbre linéaire
Questions.
1. Justifier que la dernière valeur propre de M , dans la question a), est dans K.
Indication : penser à son rapport avec la trace de la matrice.
2. Est-ce que 0 peut avoir une multiplicité algébrique égale à n ?
3. Justifier que le spectre de In + M est le spectre de M translaté de 1.
4. Déduire de la question b)(ii) la différentielle du déterminant.
5. Montrer que le déterminant est polynomial en les coefficients de la matrice.
6. Rappeler pourquoi, si K est non-discret et dense dans K, alors GLn (K) est
dense dans Mn (K).
7. Montrer qu’une matrice M de Mn,1 (K) est de rang 1 si, et seulement si, il
existe deux vecteurs non nuls de Mn,1 (K) tels que M = xt y. Dans une telle
écriture, x et y sont-ils uniques ?
137
27. Quaternions et isomorphismes
i2 = j 2 = k 2 = ijk = −1.
138
Algèbre linéaire
d) Le théorème de Frobenius.
Soit K 6= R un corps gauche tel que K/R soit algébrique. Soit x ∈ K \ R.
(i) Montrer que R[x] est isomorphe à C.
Soit i une racine carrée de −1 dans R[x], et ϕ l’endomorphisme de K défini
par y 7→ −iyi.
(ii) Montrer que ϕ est diagonalisable sur R et que Sp(ϕ) ⊂ {±1}.
(iii) Soient E−1 et E1 les espaces propres de ϕ. Montrer que E1 est isomorphe
à C et en déduire que si E−1 = {0} alors K est isomorphe à C.
(iv) Supposons que E−1 6= {0}, et prenons y ∈ E−1 \{0}. Montrer que z 7→ zy
est un isomorphisme de E1 sur E−1 , et en déduire que K ' H.
On a ainsi montré le théorème de Frobenius :
Les seuls corps gauches K contenant R comme sous-corps et tels
que K/R est algébrique sont R, C et H.
Leçons concernées : 101, 102, 106, 125, 155, 160, 161, 191
Cet exercice donne naturellement lieu à deux types de développements (voir premier
commentaire). Le premier présente les résultats des questions b) ou c) et inclut
ou admet la question a) (présente uniquement par souci de complétude). Ce
développement n’utilise que des notions élémentaires sur les isométries. Il trouve
donc sa place dans les leçons 106, 160, 161 et 191. Dans le vocabulaire des actions
de groupes, il utilise ici les actions de G sur H par conjugaison et par multiplication.
Ainsi, quitte à reformuler, ce développement illustre naturellement la leçon 101.
L’utilisation des réflexions comme générateurs de SO3 (R) ainsi que les arguments
de dualité et de connexité permettent d’intégrer les résultats des questions b) et c)
dans les leçons 108, 154 et 204. Enfin, le groupe G étant une extension du groupe
des nombres complexes de module 1, ce développement peut aussi être le bienvenu
dans la leçon 102. La question d) présente quant à elle un résultat un peu plus
avancé et peut donc constituer un développement à elle seule. Elle fait cette fois
intervenir l’étude d’extensions de corps et la diagonalisation, et peut donc illustrer
les leçons 125 et 151. Dans tous les cas, il ne faut pas oublier d’incorporer au plan
les résultats introductifs sur les quaternions décrits en préambule.
Correction.
a) Par construction, tout réel commute avec tout quaternion. Réciproquement,
soit q = a + bi + cj + dk ∈ H un quaternion commutant avec tous les autres. La
relation qi = iq fournit
ai − b − ck + dj = ai − b + ck − dj,
139
27. Quaternions et isomorphismes
b) (i) Tout d’abord, H est un groupe pour l’addition (isomorphe à (R4 , +)).
Soient λ, µ ∈ C et q, q 0 ∈ H. Il reste à montrer
λ · (q + q 0 ) = λ · q + λ · q 0 ,
(λ + µ) · q = λ · q + µ · q,
1 · q = q,
λ · (µ · q) = (λµ) · q.
On a de plus
Tq (Tq (x)) = qqx = N (q)x = x.
Ainsi, Tq est C-linéaire et inversible d’inverse Tq .
(iii) Soient q, q 0 ∈ G et x ∈ H. Alors
Tq (1) = q = λ + jµ,
Tq (j) = qj = (a + ib)j + j(c + id)j = j(a − ib) − (c − id).
λλ + µµ = a2 + b2 + c2 + d2 = N (q) = 1.
140
Algèbre linéaire
La matrice M est alors la matrice de Tλ+jµ , ce qui assure que ϕ est surjectif.
On obtient finalement que ϕ est un isomorphisme de G dans SU 2 (C).
c) (i) Examinons les différentes propriétés recherchées.
• Linéarité. Soient x, y ∈ H et λ ∈ R. Par distributivité de la multiplication ×
par rapport à l’addition +, on a
Comme P est stable par Sq et Sq0 , on obtient que sq ◦sq0 = sqq0 . L’application ϕ
est donc un morphisme de groupes de G dans O(P ).
141
27. Quaternions et isomorphismes
On obtient donc que sp est une réflexion d’axe Rp. Ainsi, l’image de ϕ contient
toutes les réflexions. Comme ces réflexions engendrent SO(P ), on en déduit
l’inclusion SO(P ) ⊂ Im(ϕ).
Pour établir l’inclusion réciproque, on observe que det ◦ ϕ est une application
continue de G dans {±1}. G étant connexe (car homéomorphe à S3 ) et {±1}
discret, det ◦ ϕ est constante. Ainsi, pour tout q ∈ G, on a
Ainsi, ϕ est bien un automorphisme de K. C’est de plus une involution car pour
tout y ∈ K, on a ϕ(ϕ(y)) = i2 yi2 = y. Le polynôme X 2 − 1, scindé à racines
simples sur R, annule donc ϕ, ce qui implique que ϕ est diagonalisable sur R et
que ses seules valeurs propres possibles sont 1 et −1.
142
Algèbre linéaire
i(y + y 0 ) = iy + iy 0 = yi + y 0 i = (y + y 0 )i,
iyy 0 = yiy 0 = yy 0 i.
Pour montrer que K ' H, il suffit (grâce à la question b)(i) de montrer que y est
R-colinéaire à une racine de −1 dans K.
L’argument de d)(i) permet de montrer que R[y] est isomorphe à C. Ainsi,
l’extension R[y]/R est de degré [C : R] = 2, d’où R[y] = R + Ry. On peut donc
écrire une expression y 2 = a + by avec a, b ∈ R. De plus, y ∈ E−1 donc y 2 ∈ E1 .
Finalement,
Commentaires.
© Il est recommandé de ne pas présenter tous les résultats de cet exercice en un
seul développement. Parmi les regroupements possibles, on peut envisager un
développement F basé sur les questions a) et b), et des développements FF
basés sur les ensembles de questions {a), c)}, {a), b), c)} et {a), d)}.
143
27. Quaternions et isomorphismes
i2 = j 2 = k 2 = ijk = −1
sur le pont de Brougham à Dublin lors d’une promenade avec son épouse. Ce pont
porte maintenant une plaque à son hommage.
© Le résultat de Frobenius date de 1877 et porte le coup fatal à la recherche menée
par Hamilton d’une structure de l’espace à 3 dimensions permettant d’effectuer
des calculs géométriques de manière similaire aux calculs complexes. En effet,
il est nécessaire de considérer la dimension 4 et l’espace des quaternions pour
obtenir une structure convenable. Le théorème de Hurwitz généralise le résultat
de Frobenius en considérant des structures plus faibles (en particulier vérifiant
une version faible de l’associativité). Il stipule alors que les seules R-algèbres de ce
type sont R, C, H, et l’algèbre des octonions O, de dimension 8 sur R. Chacune de
ces algèbres permet de munir les espaces Rn associés d’une structure particulière.
En revanche, cette structure s’affaiblit à mesure que la dimension croît : C n’est
pas ordonné, H n’est pas commutatif, O n’est pas associatif.
© La question d)(ii) peut être simplifiée en remarquant que dans ce cas l’endo-
morphisme ϕ correspond à Si défini en question c)(i). L’idée sous-jacente à la
démonstration de la question d) consiste à séparer le cas commutatif (i ∈ Z(K),
i.e. ϕ = Id) du cas non commutatif (ϕ 6= Id, donc E−1 6= {0}). Grâce à l’action par
translation à gauche z 7→ yz, on peut alors montrer que les sous-espaces propres
de ϕ ont la même structure algébrique, ce qui permet de conclure en utilisant la
diagonalisabilité de ϕ.
© Une application classique des quaternions est fournie par le théorème de La-
grange, qui énonce que tout entier positif peut s’écrire comme somme de quatre
carrés. Sa démonstration repose sur la propriété de multiplicativité de la norme N
(voir questions).
© D’après la question c), on peut représenter une rotation de SO3 (R) par un
quaternion de norme 1. Cette vision est intéressante d’un point de vue informatique
(ou plutôt infographique). En effet, au lieu de stocker 9 réels correspondants aux
coefficients d’une matrice 3 × 3, stocker un quaternion ne nécessite que de stocker
quatre réels. Cette représentation est aussi plus stable numériquement : des erreurs
sur les coefficients d’un quaternion de norme 1 ne changent pas sa nature de
quaternion et il suffit de renormaliser pour obtenir un quaternion de norme 1,
tandis qu’il est plus difficile de récupérer une matrice orthogonale à partir d’une
matrice orthogonale perturbée. Du point de vue des opérations possibles sur
les rotations, il est plus facile de calculer la composition de deux rotations en
faisant le produit de deux quaternions qu’en faisant le produit de deux matrices
orthogonales. En revanche, pour appliquer une rotation à un vecteur, il est moins
coûteux d’utiliser la représentation matricielle.
144
Algèbre linéaire
Questions.
1. Justifier que G est homéomorphe à S3 , et en déduire que l’isomorphisme de la
question c) induit un homéomorphisme entre S3 /{±1} et SO3 (R).
2. Expliquer pourquoi on a considéré l’action de C par multiplication à droite
dans la question b). Que se serait-il passé si on avait considéré la multiplication à
gauche à la place ?
3. Pour q = a + bi + cj + dk ∈ H avec a, b, c, d ∈ R, écrire les matrices de Sq , sq
et Tq dans la base (1, i, j, k).
4. Justifier que l’inversibilité de Tq (resp. Sq ) à droite dans la question b)(ii)
(resp. c)(i) suffit pour montrer que Tq (resp. Sq ) est inversible.
5. Montrer que les réflexions engendrent SO3 (R).
6. Montrer que si α ∈ C \ R, alors R[α] = C.
7. Montrer que si y ∈ C \ R vérifie y 2 ∈ R, alors y 2 < 0.
8. Montrer que la norme N est multiplicative. En déduire que l’ensemble des
sommes de quatre carrés d’entiers est stable par produit.
9. Montrer que si q1 , q2 ∈ H, alors q1 = q1 et q1 q2 = q2 · q1 .
145
27. Quaternions et isomorphismes
α α
qr = cos + sin (ux i + uy j + uz k) ∈ H.
2 2
146
Algèbre linéaire
147
28. Lemmes de Schwartz-Zippel et de Kakeya
Correction.
a) (i) Soit P ∈ K[X]\{0} de degré d. Comme P 6= 0, il a au plus d racines dans K,
donc en particulier dans S. Ainsi, en tirant uniformément (et indépendamment)
des éléments de S, la probabilité de choisir une racine de P est au plus égale au
1
produit d × |S| . Ceci montre que H1 est vraie.
(ii) On a deg(Xnm Pm (X1 , . . . , Xn−1 )) 6 d, donc Pm est de degré au plus d − m.
Comme Pm est un polynôme en au plus n − 1 variables, on peut appliquer
l’hypothèse de récurrence à Pm . On a alors
d−m
P Pm (s1 , . . . , sn−1 ) = 0 6 .
|S|
148
Algèbre linéaire
d
|{x ∈ Fnq , P (x) = 0}| 6 |Fnq | × P P (s1 , . . . , sn ) = 0 6 q n × = q n−1 d.
q
et
ψ : Pn−1 (J1, k + n − 1K) −→ En,k
{i1 , . . . , in−1 } 7−→ (ip − ip−1 − 1)p∈J1,nK
où les entiers i1 , . . . , in−1 sont choisis en ordre croissant et, par convention, i0 = 0
et in = k + n.
Si d1 + · · · + dn = k, alors ϕ(d1 , . . . , dn ) est bien un sous-ensemble de J1, k + n − 1K
de taille n. Réciproquement, soit {i1 , . . . , in−1 } ∈ Pn−1 (J1, k + n − 1K) où on a
choisi i1 < · · · < in−1 . Alors
n−1
X
i1 − 1 + (ij − ij−1 − 1) + (k + n − 1 − in−1 ) = k + n − 1 − (n − 1) = k.
j=2
Cette somme peut se simplifier à l’aide de la formule de Pascal, via une récurrence
149
28. Lemmes de Schwartz-Zippel et de Kakeya
immédiate :
! ! ! !
n−1 n n+1 n+d−1
f (d, n) = + + + ··· +
n−1 n−1 n−1 n−1
! ! ! !
n n n+1 n+d−1
= + + + ··· +
n n−1 n−1 n−1
! ! !
n+1 n+1 n+d−1
= + + ··· +
n n−1 n−1
..
.
!
n+d
= .
n
g : Fq [X1 , . . . , Xn ] −→ FE
q
P 7−→ (x 7−→ P (x)).
d
X i
X
0 = P (x + tv) = Pj (x + tv) = Pj (x + tv).
j=0 j=0
150
Algèbre linéaire
(v) Si |E| < f (q − 1, n), la question b)(iii) fournit un polynôme non nul de degré
au plus q − 1 qui s’annule sur E, ce qui est contradictoire avec la question b)(iv).
Ainsi, le cardinal d’un ensemble de Kakeya est au moins
!
n+q−1
f (q − 1, n) = .
n
Commentaires.
© Dans ce développement, il est important de bien faire la différence entre
polynôme de K[X1 , . . . , Xn ] nul en tant que polynôme, ou nul en tant que fonction
polynomiale définie sur Kn . Évidemment, si P est nul, la fonction polynomiale
associée est identiquement nulle. La réciproque n’est pas toujours vraie, comme le
montre l’exemple du polynôme X q − X dans Fq [X]. Dans la question b)(iv), on
utilise le lemme de Schwartz-Zippel pour obtenir l’implication réciproque dans un
cas particulier.
© Bien que technique, l’application ϕ définie en question b)(ii) peut se représenter
graphiquement. Il s’agit de noircir n − 1 cases sur une ligne de k + n − 1 cases (di
est obtenu en comptant le nombre de cases entre la (i − 1)-ème et la i-ème case
noircie, voir Figure 1.5).
1 2 0 3
1 2 3 4 5 6 7 8 9
151
28. Lemmes de Schwartz-Zippel et de Kakeya
6. Une généralisation de la notion de dimension d’un espace vectoriel à des espaces métriques,
qui déborde du programme de l’agrégation.
152
Algèbre linéaire
est fixé et q → +∞, ce qui est donc optimal en termes d’ordre de grandeur : la
taille minimale d’un ensemble de Kakeya dans Fnq doit être asymptotiquement
proportionnelle à q n = |Fnq |. Ainsi, un ensemble de Kakeya est nécessairement
grand, ce qui conduit à une situation bien différente du cas de R2 .
Questions.
1. Dans la question a)(ii), justifier que m est bien défini.
2. Dans la même question, démontrer la majoration de la probabilité conditionnelle
sans recourir à l’interprétation des évènements considérés.
3. Que devient la formule des probabilités totales par rapport à un système
complet (B, B̄) quand la probabilité de B est nulle ?
4. Donner un argument combinatoire permettant de retrouver la formule suivante,
démontrée dans la question b)(ii) :
d
! !
n+d X n+k−1
= .
n k=0
n−1
5. Soit K un corps. Montrer que tout P ∈ K[X] \ {0} admet au plus deg(P )
racines. Est-ce toujours vrai sur A[X] où A est un anneau ?
6. Soit P ∈ K[X1 , . . . , Xn ] un polynôme homogène de degré d. Soit x, v ∈ Kn .
Montrer que le coefficient de T d du polynôme P (x + T v) ∈ K[T ] est égal à P (v).
7. Montrer qu’un entier n est premier si et seulement si (1 + x)n = 1 + xn pour
tout élément x ∈ Z/nZ. En déduire un algorithme probabiliste pour tester si n
est premier. À l’aide du lemme de Schwartz-Zippel, déterminer la probabilité
d’obtenir un faux positif et celle d’obtenir un faux négatif.
8. Soit P ∈ K[X1 , . . . , Xn ] de degré d. Si K est un corps infini, montrer que P est
homogène de degré d si et seulement si P (tx1 , . . . , txn ) = td P (x1 , . . . , xn ) pour
tous t, x1 , . . . , xn ∈ K. Est-ce toujours vrai sur un corps fini ?
9. Soit P ∈ K[X1 , . . . , Xn ] où K est un corps de caractéristique nulle. Montrer
que P est homogène de degré p si et seulement si
n
X dP
pP = Xi ,
i=1
dXi
dP
où dX i
est le polynôme dérivé de P vu comme polynôme en Xi . Ceci reste-t-il
valide en caractéristique non nulle ?
10. Montrer que si QR est homogène avec Q, R ∈ K[X1 , . . . , Xn ], alors Q et R
sont homogènes. En déduire que X12 + · · · + Xn2 est irréductible sur R (resp. C) si
et seulement si n > 2 (resp. n > 3).
11. Montrer que les polynômes homogènes irréductibles de C[X, Y ] sont exacte-
ment ceux de degré 1.
153
28. Lemmes de Schwartz-Zippel et de Kakeya
12. Soit I un idéal de K[X1 , . . . , Xn ]. Montrer que I est engendré par des po-
lynômes homogènes si et seulement si I est engendré par un nombre fini de
polynômes homogènes.
Indication : on pourra montrer que, dans ce cas, pour tout polynôme P , on a
P ∈ I si et seulement si toute composante homogène Pi de P appartient à I.
154
Algèbre linéaire
a) Algorithme de Le Verrier.
Soient λ1 , . . . , λn ∈ C les valeurs propres de A comptées avec multiplicité.
Pour k ∈ N, on note Sk = ni=1 λki , avec par convention S0 = n.
P
155
29. Calculs de polynômes caractéristiques
Correction.
a) (i) La matrice A est trigonalisable sur C, il existe donc une matrice inver-
sible P et une matrice triangulaire T dont la diagonale est λ1 , . . . , λn telles que
A = P T P −1 . Soit k ∈ N. On a Ak = P T k P −1 , et T k est une matrice triangulaire
dont les coefficients diagonaux sont λk1 , . . . , λkn . La trace étant un invariant de
similitude, on a tr(Ak ) = tr(T k ) = Sk .
(ii) On a χA = ni=1 (X − λi ). Alors, en calculant dans K(X), on a
Q
n n
1
Y Y
n
P =X − λi = (1 − λi X).
i=1
X i=1
1 P+∞ k,
En utilisant le développement en série formelle 1−X = k=0 X on peut alors
écrire (dans K(X))
n n
P0 X −λi 1 X −λi X
= =
P i=1
1 − λi X X i=1 1 − λi X
n n +∞
!
1 X 1 1 X
X
= 1− = − λki X k
X i=1 1 − λi X X i=1 k=1
n
1 +∞
XX 1 +∞
X
=− λki X k = − Sk X k ,
X k=1 i=1 X k=1
ce qui assure que
+∞
−XP 0 = P
X
Sk X k .
k=1
Pn
(iii) Comme P = i=0 an−i X i, on a par la question précédente
n +∞
ian−i X i = −XP 0 = P
X X
− Sk X k
i=0 k=1
n
! +∞ !
X X
= an−i X i Sk X k
i=0 k=1
X min(k−1,n)
+∞ X
= an−i Sk−i X k
k=1 i=0
+∞ min(i−1,n)
X X
= an−j Si−j X i
i=1 j=0
156
Algèbre linéaire
157
29. Calculs de polynômes caractéristiques
(ii) Posons
n X
X n
N= bj−1 M j−k X k−2 .
k=2 j=k
On a
n X
X n n X
X n
N (XIn−1 − M ) = bj−1 M j−k X k−1 − bj−1 M j−k+1 X k−2
k=2 j=k k=2 j=k
n
X n−1
X n
X n
X
= bn−1 In−1 X n−1 − bj−1 M j−1 + bj−1 M j−k − bj−1 M j−k X k−1
j=2 k=2 j=k j=k+1
n
X n−1
X
= bn−1 In−1 X n−1 − bj−1 M j−1 + bk−1 In−1 X k−1
j=2 k=2
n
X Xn
=− bj−1 M j−1 + bk−1 In−1 X k−1
j=2 k=2
Xn Xn
=− bj−1 M j−1 + bk−1 In−1 X k−1
j=1 k=1
= −χM (M ) + χM In−1 .
Par le théorème de Cayley-Hamilton, on a donc N (XIn−1 − M ) = χM In−1 .
Comme χM n’est pas le polynôme nul, χ1M N est donc bien l’inverse de XIn−1 − M
dans Mn (K(X)), d’où N = χM (XIn−1 − M )−1 = t com(XIn−1 − M ).
(iii) En combinant les résultats des deux questions précédentes, on obtient
n X
X n
χA = (X − an,n )χM + bj−1 LM j−k CX k−2 . (2)
k=2 j=k
158
Algèbre linéaire
Commentaires.
© Le problème du calcul du polynôme caractéristique d’une matrice sur un an-
neau donné est fondamental. En effet, il permet d’obtenir l’inverse, un polynôme
annulateur (par le théorème de Cayley-Hamilton), le polynôme minimal (en
prenant le pgcd avec sa dérivée), des informations sur les valeurs propres (locali-
sation/approximation), en plus de fournir la trace et le déterminant grâce aux
coefficients an−1 et a0 . L’algorithme de Le Verrier fonctionne sur tout anneau où
n! n’est pas un diviseur de zéro, puisqu’il faut pouvoir inverser 1, . . . , n. Dans le
cas d’un anneau commutatif arbitraire, la variante du pivot de Gauss dite « avec
élimination des divisions » a une complexité de O(n5 ). On peut en revanche s’en
sortir avec une complexité en O(n4 ), grâce à l’algorithme de Kaltofen-Wiedemann.
Avec un peu plus d’hypothèses, on peut obtenir une complexité de O(n3 ) sur un
corps (algorithme de Hessenberg) ou sur un anneau intégralement clos où il existe
un algorithme de division (algorithme de Frobenius). Enfin, il existe aussi un
algorithme probabiliste en O(n3 ) fonctionnant sur un corps (celui de Wiedemann).
© La partie coûteuse de l’algorithme de Le Verrier est le calcul des traces des
puissances de la matrice √initiale. Grâce à une méthode astucieuse (précalculer
b
les puissances de B = A nc , et remplacer le calcul de tr(Ai ) par tr(B q Ar ) où
√ √
i = qb nc + r est la division euclidienne de i par b nc), on peut diminuer la
complexité en O(n7/2 ) au lieu de O(n4 ). Cet algorithme est connu sous le nom
d’algorithme de Preparata et Sarwate.
© À l’ère actuelle, il est aussi intéressant d’obtenir des algorithmes se comportant
bien vis-à-vis de la parallélisation. En effet, si les matrices sont grandes, on pourrait
être tenté de confier des sous-matrices à des unités de calcul distinctes, et de recom-
biner des résultats ensuite. Dans le cadre du calcul de polynôme caractéristique,
de telles variantes existent. Par exemple, l’algorithme de Samuelson-Berkowitz se
parallélise très bien : il suffit de déléguer le calcul des n matrices P à des unités
différentes. Ensuite, on effectue le produit de ces matrices, ce qui se parallélise
aussi très bien : pour multiplier n matrices P1 , . . . , Pn , on assigne à n2 unités le
calcul des produits P1 P2 , P3 P4 , . . ., puis on réitère en réutilisant n4 unités de calcul,
etc. On arrive alors à calculer le produit total en ln2 (n) multiplications au plus par
unité de calcul. De même, bien que l’algorithme de Le Verrier ne se parallélise pas
très bien, ce n’est pas le cas de sa variante décrite au point précédent. L’algorithme
159
29. Calculs de polynômes caractéristiques
de Preparata et Sarwate nécessite au plus O(ln2 (n)) opérations par unité de calcul
lorsqu’on a un nombre polynomial en n d’unités. Avec l’algorithme de Csanky,
c’est un des meilleurs algorithmes parallèles connus pour ce problème.
© La complexité de la multiplication de deux matrices carrées n × n est une
question épineuse. Elle est souvent notée de manière théorique O(nβ ), avec β le
« meilleur » exposant possible. On sait naturellement que β 6 3 car l’algorithme
naïf a une complexité cubique. Grâce à l’approche diviser pour régner, l’algorithme
de Strassen permet de montrer β 6 ln2 (7) ≈ 2.807. L’algorithme de Coppersmith-
Winograd améliore cette constante en 2.376, et une analyse plus fine de sa
complexité par Stothers fournit même β 6 2.3737. On ne sait en revanche pas si
cette constante est optimale. Bien qu’asymptotiquement meilleur, cet algorithme
n’est que peu utilisé en pratique. En effet, la constante cachée dans le O(n2.37 ) est
si grande que l’algorithme de Strassen reste meilleur pour toute taille de matrice
utilisable.
© Pour le calcul simple du déterminant, effectuer un pivot de Gauss est un
algorithme de complexité O(n3 ) lorsqu’on se place sur un corps. Cependant, dans
le cas d’un anneau plus général, la version du pivot avec élimination des divisions
ne fonctionne qu’en O(n5 ). Dans un anneau intègre où la division est explicitement
calculable, l’algorithme de Jordan-Bareiss fonctionne en O(n3 ). Ainsi, parfois il
pourrait être plus intéressant de calculer le polynôme caractéristique en entier
en O(n4 ) avec l’algorithme de Le Verrier (valide dès que 1, . . . , n ont un inverse,
même si l’inversion n’est pas forcément calculable sur les autres éléments de
l’anneau considéré) pour extraire le déterminant.
© Lorsqu’on travaille avec des matrices à coefficients entiers, il est tentant d’ef-
fectuer les calculs dans Q pour pouvoir diviser librement. Du point de vue de
l’implémentation, cela implique de stocker des rationnels, souvent représentés
en mémoire comme des couples d’entiers premiers entre eux. Maintenir cette
condition de primalité oblige alors à prendre en compte un coût additionnel lors
des calculs. C’est pourquoi on préfère parfois un algorithme de moins bonne com-
plexité, mais restant dans les entiers. Se pose alors le problème de la complexité de
multiplier des grands entiers entre eux. En effet, on compte souvent la complexité
en « nombre d’opérations élémentaires », en incluant dans cette définition les
sommes et produits d’entiers « machine », c’est-à-dire inférieurs à 264 . Lorsque les
entiers deviennent plus grands, il faut alors prendre en compte à nouveaux des
« coûts cachés » (par exemple, le meilleur algorithme connu actuellement pour
multiplier deux entiers à n chiffres a une complexité de O(n ln(n))). Pour plus d’in-
formations sur la multiplication d’entiers, voir Développement 106. Une manière
d’éviter ce problème est de travailler modulo des nombres premiers p1 , . . . , pk .
L’anneau Z/pZ étant un corps, on peut effectuer toutes les opérations modulo p
relativement facilement (quitte à précalculer tous les inverses modulo p), puisque
tous les entiers mis en jeu resteront inférieurs à p. La question est alors : comment
utiliser les résultats modulo p1 , . . . , pk pour obtenir un résultat dans Z ?
Dans le cas du déterminant, imaginons une matrice A à coefficients entiers dont on
connaît le déterminant modulo p1 , . . . , pk . D’après le théorème des restes chinois,
on connaît donc la classe det(A) modulo le produit N = p1 · · · pk . Si on sait de
160
Algèbre linéaire
plus que − N2 < det(A) < N2 , alors on peut déduire det(A) de det(A), puisqu’il n’y
a qu’un seul entier compris entre − N2 et N2 qui soit congru à det(A) modulo N .
Cette technique repose donc sur l’établissement d’une borne a priori sur det(A),
ce qu’on peut par exemple obtenir grâce à l’inégalité de Hadamard.
Pour calculer le déterminant d’une matrice, on commence par calculer une borne
a priori N via cette inégalité, puis on calcule le déterminant modulo p1 , . . . , pk ,
jusqu’à ce que le produit p1 · · · pk dépasse N . On reconstruit alors la classe π du
déterminant modulo p1 · · · pk par le théorème chinois (et l’algorithme d’Euclide
étendu). Le déterminant recherché est alors l’entier relatif de plus petite valeur
absolue congru à π modulo p1 , . . . , pk .
Cette méthode possède l’inconvénient de répéter le calcul pour chaque nombre
premier. Par contre, comme le produit 2 × 3 × · · · pk (où pk est le k-ème nombre
premier) croît vite, on n’a en général pas besoin de considérer beaucoup de nombres
premiers. De plus, comme on l’a vu, cette méthode ne nécessite pas de calculer
avec des grands entiers en mémoire. Elle est aussi adaptée au calcul parallèle
puisqu’on peut confier le calcul dans chaque Z/pi Z à une unité de calcul séparée.
© La matrice P définie en question b)(iii) est une matrice de Toeplitz, c’est-à-
dire qu’elle est triangulaire inférieure, et si deux coefficients sont sur la même
diagonale, alors ils sont égaux. Pour ce type de matrices, des algorithmes de
multiplication plus efficaces existent, ce qui permet d’accélérer l’algorithme de
Samuelson-Berkowitz.
© Une conséquence de la question a) est que dans tout anneau où les entiers sont
inversibles, les sommes de Newton (Sk )k∈N forment un système fondamental de
polynômes symétriques.
Questions.
Si on ne suppose plus que D est inversible, mais que CD = DC, montrer que le
déterminant précédent est égal à det(AD − BC).
161
29. Calculs de polynômes caractéristiques
tr(Bk−1 A)
Bk = Bk−1 A − In .
k
tr(Bk−1 A)
On note aussi dk = − k . Montrer que
k k−1
!
k
X
k−i 1 X
Bk = A + di A et dk = − Sk + di Sk−i .
i=1
k i=1
162
Algèbre linéaire
Correction.
a) Raisonnons par double implication.
• Supposons que rg(A) > k. En utilisant une réduction de Gauss, la matrice A
peut s’écrire sous la forme P diag(α1 , . . . , αr , 0, . . . , 0)Q avec r = rg(A) > k,
P, Q ∈ GLn (K) et α1 , . . . , αr des éléments de K ∗ tels que α1 , . . . , αk soient
deux à deux distincts.
En posant B = P Q = P In Q ∈ GLn (K), la matrice
est alors non inversible pour les k valeurs distinctes − α1i pour i ∈ J1, kK.
• Réciproquement, raisonnons par contraposée et supposons que rg(A) < k.
Soit alors B ∈ GLn (K) et x ∈ K. Montrons que xA + B est inversible sauf
pour au plus k − 1 valeurs de x.
163
30. Endomorphismes conservant le déterminant
ce qui est en contradiction avec le fait que B est inversible. Ainsi, u est injectif.
Puisque Mn (K) est de dimension finie, on en déduit que u est un isomorphisme.
c) (i) Soit r = rg(u(A)). Par la question a) il existe une matrice B 0 inversible
telle que xu(A) + B 0 ne soit pas inversible pour r scalaires de K deux à deux
distincts. Puisque u est un isomorphisme, il existe B telle que u(B) = B 0 et B est
inversible puisque u préserve le déterminant. On a alors
det(xu(A) + B 0 ) = det(xu(A) + u(B)) = det(u(xA + B)) = det(xA + B) = 0.
164
Algèbre linéaire
Commentaires.
© Les résultats présentés ici peuvent donner lieu à plusieurs développements.
Par exemple, les questions a) à c) fournissent un développement F, qui peut
être agrémenté du résultat de la question d) en fonction du temps. La preuve
alternative dans le cas d’un corps infini proposée en question ci-après peut aussi
constituer un développement F, en remplacement de la question c).
© L’idée générale de ce développement consiste à caractériser l’ensemble des
matrices de rang k à l’aide de critères compatibles avec la notion d’endomorphisme
préservant le déterminant. C’est le but de la question a), qui traduit une condition
sur le rang en l’existence d’un certain nombre de matrices non-inversibles.
© Ce développement repose essentiellement sur le caractère polynomial du déter-
minant et la réduction de Gauss : toute matrice est équivalente à une matrice
diagonale, et les coefficients diagonaux non nuls peuvent être choisis comme on le
souhaite. Il est important de comprendre que prendre ce type de représentants
privilégiés de la matrice est possible car l’équivalence préserve le rang. Plus préci-
sément, la relation d’équivalence de matrices définit le rang : deux matrices ont
même rang si et seulement si elles sont équivalentes.
© On peut obtenir des caractérisations plus fines des endomorphismes préservant
le déterminant. Par exemple, un résultat de Frobenius montre que lorsque K = C,
il s’agit de ϕM,N : A 7→ M AN ou ψM,N : A 7→ M tAN où M et N sont des
matrices inversibles fixées vérifiant det(M N ) = 1. Ce résultat est d’ailleurs valide
même si on ne suppose plus que u est linéaire, mais seulement surjectif et vérifie
det(A + λB) = det(u(A) + λu(B)) pour toutes matrices A, B ∈ Mn (C) et λ ∈ C.
© On peut ainsi caractériser différents types d’endomorphismes u ∈ Mn (C) sous
cette forme :
• u préserve les matrices inversibles si et seulement si u = ϕM,N ou u = ψM,N
avec M, N inversibles.
• u préserve le rang si et seulement si u = ϕM,N ou u = ψM,N avec M, N
inversibles.
165
30. Endomorphismes conservant le déterminant
Questions.
1. Montrer que, pour tous A, B ∈ Mn (K), on a rg(A + B) 6 rg(A) + rg(B).
2. Vérifier que si u ∈ GL(Mn (K)) conserve le déterminant, alors u−1 aussi.
3. Justifier que si N est nilpotente d’indice r + 1, alors In − N est inversible
d’inverse In + N + · · · + N r .
4. Un endomorphisme de Mn (K) conservant le rang conserve-t-il toujours le
déterminant ?
5. Dans le cas où K est un corps infini, donner une preuve alternative du résultat
du développement.
Indication : si M est de rang r, écrire M = P Jn,r Q et introduire N = P (In − Jr )Q.
Conclure en considérant deux écritures différentes de det(xM + N ) et en utilisant
le fait que K est infini.
6. Soit u un endomorphisme de Mn (K) tel que u(GLn (K)) ⊂ GLn (K). Pour
quels corps K les preuves précédentes se généralisent-elles ?
166
Algèbre linéaire
Correction.
a) Soit M une matrice de rang 1. Comme M est non nulle, elle contient une
colonne Cj non nulle. Ainsi, comme M est de rang 1, les autres colonnes sont
proportionnelles à Cj , c’est-à-dire que pour tout i ∈ J1, nK il existe λi ∈ K tel que
Ci = λ i Cj .
167
31. Endomorphismes conservant le rang
C1 L1 + C2 L2 ∈ F ⊂ R1 .
Ainsi, l’un des deux cas précédents est valide et F a bien la forme recherchée.
d) Soit M ∈ Mn (K) telle que u(M ) = 0. Alors, puisque u est un endomorphisme
qui conserve le rang,
168
Algèbre linéaire
Supposons maintenant que ces deux formes puissent survenir. Autrement dit, il
existe une famille libre (C1 , C2 ) de C telle qu’il existe C 0 ∈ C ∗ et L0 ∈ L∗ vérifiant
u(C1 L) = C 0 L et u(C2 L) = CL0 .
Puisque C 0 L0 ∈ C 0 L ∩ CL0 , il existe alors L1 , L2 ∈ L tels que u(C1 L1 ) = C 0 L0 et
u(C2 L2 ) = C 0 L0 . Comme u est un isomorphisme, on en déduit que C2 L2 −C1 L1 = 0.
D’après la question b), comme (C1 , C2 ) est libre, (L1 , L2 ) est liée, c’est-à-dire
(par symétrie) L2 = αL1 pour un certain α ∈ K. Alors
0 = C2 L2 − C1 L1 = (αC2 − C1 )L1 .
u(CL) = C 0 LBC
169
31. Endomorphismes conservant le rang
Commentaires.
© Notons que la conservation des matrices de rang k ∈ J1, nK fixé est aussi
suffisante pour qu’un endomorphisme de Mn (K) conserve le rang. Le cas k = n
sur C est détaillé ci-après, et peut faire l’objet d’un développement FF.
© Le Développement 30 montre que la préservation du déterminant implique la
préservation du rang lorsque K est assez grand. Ainsi, l’analyse précédente montre
que tout endomorphisme de Mn (K) préservant le déterminant est nécessairement
de la forme M 7→ AM B ou M 7→ A tM B. Réciproquement, ces endomorphismes
préservent le déterminant que si det(AB) = 1. On obtient donc une caractérisation
de ces endomorphismes.
Questions.
1. Montrer que si CL = C 0 L0 avec C, C 0 ∈ C ∗ et L, L0 ∈ L∗ , alors (C, C 0 ) est liée
et (L, L0 ) est liée.
2. Calculer CL ∩ C 0 L pour C, C 0 ∈ C.
3. Justifier que CL ∩ CL = Vect (CL).
4. Montrer que toute matrice s’écrit comme somme de matrices de rang 1. Quel
est le nombre minimal de termes dans la somme ?
5. Nous allons prouver le résultat mentionné en commentaires. Soit u un endomor-
phisme de Mn (C) tel que l’image par u d’une matrice de rang n est une matrice
de rang n.
170
Algèbre linéaire
(i) Si M ∈
/ GLn (C), montrer qu’il existe P ∈ GLn (C) telle que
∀λ ∈ C, P − λM ∈ GLn (C).
171
32. Théorème de Chebotarev
···
1 1 1
1 u · · · up−1
1 u2 · · · u2(p−1)
A= ∈ Mp (C).
.. .. .. ..
. . . .
2
1 up−1 ··· u (p−1)
Supposons que l’un des mineurs de A est nul, notons ik et jk les indices des
lignes et des colonnes apparaissant dans ledit mineur, pour k ∈ J1, rK et un
certain r ∈ J1, p − 1K. L’hypothèse d’annulation du mineur s’écrit donc
ui1 j1 · · · ui1 jr
ui2 j1 · · · ui2 jr
.. .. .. = 0. (1)
. . .
uir j1 · · · uir jr
a) Expliciter l’hypothèse (1) sous la forme d’un P ∈ C[X] annulant les uik .
r
Y
b) Notons µ0 , . . . , µr ∈ C les coefficients de (X − ui` ), où µr = 1.
`=1
(i) Montrer qu’il existe une matrice M ∈ / GLp (C) non triviale dont chaque
coefficient est l’un des µk ou zero.
(ii) Montrer que M = Q(u) pour un certain Q ∈ Z[X].
(iii) Montrer que Q(1) est divisible par p.
c) En déduire une contradiction et conclure au théorème de Chebotarev :
Ce développement est très élémentaire mais technique. L’une des propriétés fonda-
mentales du déterminant est son caractère polynomial, et la preuve utilise pleine-
ment les relations entre coefficients et racines ainsi que l’arithmétique dans Z[X],
en faisant une illustration de la leçon sur les racines de polynômes (144). La
primalité de p dans l’énoncé est primordiale et des raisonnements utilisant la
factorisation par des irréductibles sont présents, autant pour les polynômes que
pour les entiers, rendant possible l’utilisation de ce développement pour la leçon
sur la primalité (121), notamment si elle intègre une extension vers les polynômes
irréductibles. Enfin, le développement est particulièrement bienvenu dans les leçons
sur les racines de l’unité (102) ainsi que sur le déterminant (152).
172
Algèbre linéaire
Correction.
a) L’annulation du mineur (1) signifie qu’il existe une relation linéaire non triviale
entre les colonnes de la matrice sous-jacente, autrement dit qu’il existe des scalaires
λ1 , . . . , λr ∈ C non tous nuls tels que, pour tout 1 6 ` 6 r,
r
X r
X jk
i` jk
λk u = λk ui` = 0.
k=1 k=1
r
X
Ainsi, pour tout 1 6 ` 6 r, les ui` sont des racines du polynôme P = λk X jk ,
k=1
en particulier on en déduit que
r
Y
X − ui` P. (2)
l=1
et α0 , . . . , αs ∈ C, tels que
r r s
! !
X X X
jk k k
λk X = µk X αk X . (3)
k=1 k=0 k=0
Puisque le polynôme P n’est pas nul, les αk ne sont pas tous nuls et constituent
donc une solution non triviale au système linéaire ci-avant. Ainsi, la matrice
associée au système (4) n’est pas inversible, comme souhaité. Nous pouvons
reformuler ce résultat en
173
32. Théorème de Chebotarev
Alors, pour tout k ∈ J0, rK, on en déduit que µk s’écrit sous la forme
à la place (k, `) du mineur (5) est µtk −` , on en tire d’après (7) la relation
!
r
Q(1) = .
tk − ` 06k,`6s
174
Algèbre linéaire
est de degré s, puisque φk est de degré k pour tout k ∈ J0, sK. De plus, il admet les
éléments t1 , . . . , ts comme racines, donc se factorise en sk=1 (X − tk )B(t1 , . . . , ts ).
Q
pour une certaine constante C. Cette constante est le produit des coefficients
dominants des polynômes φk , et est en particulier non nulle. De plus, en rappelant
la définition de ces polynômes en (9), la constante C est un produit de coefficients
binomiaux aux arguments inférieurs à r + s < p : elle est donc en particulier
première à p.
Ainsi, le produit obtenu en (10) n’est pas divisible par p. En effet, d’une part
le degré de P est r + s = jr < p par l’équation (3), donc aucun des r+s t ne
contient p dans son numérateur (r + s)! et ne peut donc être divisible par p. De
plus, les tk sont distincts, inférieurs à p − 1 et positifs, pour tout k ∈ J0, sK, de
sorte que les |ta − tb | sont tous inférieurs à p − 1 et non nuls, et en particulier
ne sont également pas divisibles par p. Cela contredit le résultat de la question
précédente : on conclut qu’aucun mineur de la matrice initiale A n’est nul.
175
32. Théorème de Chebotarev
Commentaires.
© Ce résultat étonnant est dû à Chebotarev en 1926. Malgré son aspect anodin,
il a suscité plus de commentaires et de travaux qu’il ne pourrait y paraître, et
pas moins d’une dizaine de preuves utilisant d’autres méthodes ont été proposées,
notamment celle présentée ici qui est due à Resetnyak en 1955. Tao a montré que
ce théorème est équivalent à un principe d’incertitude pour les fonctions complexes
définies sur les corps finis Fq . Les preuves élégantes de Frenkel ou Tao pourraient
également constituer de bons développements, adaptés à d’autres leçons.
© Le développement est élémentaire en de nombreux aspects, ne faisant appel qu’à
des manipulations de déterminants et des relations de divisibilités de polynômes
écrites explicitement. Toutefois, la marche des arguments est technique et le
développement peut être long à présenter au tableau dans son intégralité, justifiant
le niveau de difficulté. Ainsi, une présentation « en mots » de la question b)(ii) est
possible pour des candidats pouvant aisément donner des explications si nécessaire.
Enfin, toutes les expressions mentionnées ici ne sont pas nécessaires lors d’une
présentation orale : il en est ainsi pour le mineur (5) qui se lit sur le système (4),
ou encore pour le polynôme A(X, t1 , . . . , tn ), qui apparaît déjà dans l’expression
juste au-dessus.
© Nous esquissons ici la preuve de Frenkel. Elle se déroule en trois étapes.
• On a Z[u]/(1 − u) ' Fp . En effet, considérons les deux morphismes
ψ : Z[X] −→ Z[X]/(1 − X, p) ∼
= Fp
X 7−→ 1.
176
Algèbre linéaire
|I| = |J| (rappelons qu’un mineur est le déterminant d’une matrice carrée).
Raisonnons par l’absurde et supposons que ce soit le cas. Quitte à multiplier
par une puissance suffisamment élevée de u (à savoir un dénominateur
commun), on peut supposer les ai dans Z[u]. On obtient ainsi un polynôme P
annulateur des ui dans Z[u][X], donc divisible par i∈I (X − ui ). En prenant
Q
Questions.
1. Que se passe-t-il dans le cas r = p ?
2. Montrer que A ∈ GLp (Z) si, et seulement si, det(A) = ±1.
3. Détailler la récurrence permettant d’obtenir la relation (8).
4. Montrer que Φp est irréductible dans Z[X].
5. Faire le détail de la récurrence concernant A(t0 , . . . , ts ).
6. Rappeler pourquoi le déterminant est polynomial en ses arguments.
Expliquer pourquoi p | ab si, et seulement si, p | b et a ∈ J1, p − 1K.
7.
8. Montrer que le déterminant de Vandermonde est donné par la formule
1 x1 x21 · · · xn−1
1
1 x2 x22 · · · xn−1
2 Y
.. .. .. . . .. = (xj − xi ).
. . . . . 16i<j6n
1 xn x2n · · · xn−1
n
177
33. Images par l’exponentielle
exp(C[A]) = C[A]× ,
Correction.
a) (i) On raisonne par double inclusion.
⊂ On a C[A]× ⊂ C[A]. De plus, pour tout M ∈ C[A]× , il existe N ∈ C[A]
telle que M N = In par définition des inversibles de C[A], donc M est inversible,
autrement dit M ∈ GLn (C). D’où
178
Algèbre linéaire
puisque C[A] est stable par produit et somme finie. De plus, l’ensemble C[A] est
un sous-espace vectoriel de Mn (C) qui est de dimension finie, donc C[A] est fermé.
n
X Nk
Ainsi, lim ∈ C[A]. Autrement dit, exp(N ) ∈ C[A].
n→+∞
k=0
k!
b) (i) Il suffit de montrer que C[A]× est connexe par arcs. Soient M1 et M2
deux matrices distinctes de C[A]× . Pour tout z ∈ C, on pose
La fonction polynomiale P n’est pas nulle (car P (0) = det(M2 ) 6= 0), donc elle ne
s’annule qu’un nombre fini de fois ; notons Z l’ensemble de ses zéros. Alors C \ Z
est connexe par arcs car l’ensemble Z est fini. Il existe donc un chemin γ entre 0
et 1 à support dans C \ Z. Ainsi, le chemin continu
[0, 1] −→ C[A]×
t 7−→ γ(t)M1 + (1 − γ(t))M2
relie M1 et M2 dans C[A]× . L’ensemble C[A]× est donc connexe par arcs et par
conséquent connexe.
(ii) On va appliquer le théorème d’inversion locale à l’application différentiable
179
33. Images par l’exponentielle
dans C[A] (qui est en fait une partie de GLn (C), donc de C[A]× ) tels que exp
réalise un C 1 -difféomorphisme entre U et V.
Soit X ∈ exp(C[A]). Il existe donc M ∈ C[A] telle que X = exp(M ). On introduit
l’ensemble VM = {V exp(M ) : V ∈ V}. On a exp(M ) ∈ VM puisque exp(M )
s’écrit sous la forme In · exp(M ) et In ∈ V . On veut prouver que VM est un ouvert
contenu dans exp(C[A]). L’ensemble VM est bien ouvert car V l’est et car exp(M )
est inversible. De plus, par ce qui précède, pour tout V ∈ V, il existe un élément
U ∈ U tel que V = exp(U ). D’où
N = M exp(P (A)),
de sorte que
M = N exp(−P (A)).
Ainsi, si l’on avait N ∈ exp(C[A]), on aurait aussi M ∈ exp(C[A]), ce qui est
exclu car M ∈ E. Cela entraîne que N ∈/ exp(C[A]). De plus,
exp(C[A]) = C[A]× ,
180
Algèbre linéaire
A = exp(P (A)).
A = A = exp(P (A)),
Commentaires.
© Il faut faire attention aux ensembles que l’on utilise pour appliquer le théorème
d’inversion locale. Ce théorème s’applique à une fonction allant d’un ouvert d’un
espace de Banach vers un espace de Banach. Ici, on utilise le fait que C[A] est un
ouvert de l’espace de Banach C[A].
© Quand on utilise le théorème d’inversion locale, il faut bien comprendre que la
différentielle D0 exp de l’application exp en 0 est l’identité de l’espace des fonctions
de Mn (C) dans Mn (C), et non la matrice identité In de Mn (C).
181
33. Images par l’exponentielle
Par contre, l’égalité exp(R[A]) = R[A]× est fausse : en effet, on a par exemple
la matrice −In ∈ / exp(Mn (R)) puisque Sp(exp(Mn (R))) ⊂ ]0, +∞[, alors
que la matrice −In est dans R[A]× et Sp(−In ) = {−1}. Cette différence se
retrouve dans la preuve au niveau de l’utilisation d’une particularité topolo-
gique de C : retirer un nombre fini de points de C conserve la connexité, ce
qui n’est pas vrai dans R. Plus précisément, on peut relier deux déterminants
dans C∗ , mais pas dans R∗ qui n’est pas connexe.
• On peut voir que exp(Mn (R)) 6= GLn (R), en utilisant le fait que
Cependant, exp : Dn (C) → GLn (C) est injective, où Dn (C) désigne l’en-
semble des matrices diagonalisables de Mn (C).
• L’image de la restriction de l’exponentielle à An (R), l’ensemble des matrices
antisymétriques de Mn (R), est SOn (R), le groupe spécial orthogonal de
dimension n (aussi appelé groupe des rotations à n dimensions).
• L’image de la restriction de l’exponentielle à Sn (R), l’ensemble des matrices
symétriques de Mn (R), est Sn++ (R), l’ensemble des matrices réelles symé-
triques définies positives. Cette restriction est même un homéomorphisme,
voir Développement 34.
182
Algèbre linéaire
183
33. Images par l’exponentielle
Questions.
1. Rappeler pourquoi, si A, B ∈ Mn (C) commutent, alors
184
Algèbre linéaire
est un homéomorphisme.
Correction.
a) Prouvons l’existence puis l’unicité séparément.
• Existence
Puisque A ∈ Hn++ , le théorème spectral assure qu’il existe U ∈ Un telle que
A = U ∗ DU , où D = diag(d1 , . . . , dn ) est une matrice
√ diagonale √ avec des
∗
entrées d1 , . . . , dn > 0. Introduisons H = U diag( d1 , . . . , dn )U ∈ Hn++ .
On a alors bien H 2 = A, prouvant l’existence d’une racine carrée de A.
• Unicité
√
Il existe un polynôme P ∈ R[X] tel que P (di ) = di pour tout i ∈ J1, nK
(par exemple le polynôme d’interpolation de Lagrange correspondant à ces
185
34. Décomposition polaire
0 = H 02 − H 2 = (H 0 − H)(H 0 + H).
A∗ A = (U H)∗ (U H) = H ∗ (U ∗ U )H = H ∗ H = H 2 .
186
Algèbre linéaire
Commentaires.
© On peut poursuivre le développement en montrant que exp : Hn → Hn++ est un
homéomorphisme. Cela fait que la décomposition polaire matricielle est tout à fait
analogue à la forme polaire bien connue pour les nombres complexes, justifiant la
terminologie :
Toute matrice A ∈ GLn (C) s’écrit de manière unique sous la forme
A = U exp(H) avec U ∈ Un et H ∈ Hn . De plus, l’application
ψ : Hn −→ Hn++
H 7−→ exp(H)
est un homéomorphisme.
Prouvons ce fait, qui peut faire partie intégrante du développement en prolongeant
la preuve présentée ci-avant. Tout d’abord, notons que l’exponentielle est bien à
valeurs dans Hn++ .
• Surjectivité
Soit H ∈ Hn++ . Par le théorème spectral, il existe une matrice U ∈ Un et une
matrice diagonale D = diag(d1 , . . . , dn ) où d1 , . . . , dn > 0 telles qu’on puisse
écrire H = U DU ∗ . Introduisons la matrice M = U D0 U ∗ ∈ Hn où
ln d1
D0 =
.. .
.
ln dn
187
34. Décomposition polaire
• Continuité de ψ −1
On raisonne comme dans la question c), en montrant la continuité séquentielle
de la réciproque ψ −1 . Soit (Ak )k∈N une suite de matrices hermitiennes définies
positives qui converge vers A ∈ Hn++ . Notons A = exp(H) et Ak = exp(Hk )
pour tout k > 0, avec H, Hk ∈ Hn , ce qui est possible par surjectivité de
l’exponentielle. On veut prouver que (Hk )k∈N converge vers H.
Par continuité de la norme k · k subordonnée à la norme k · k2 sur Cn on a,
lorsque k tend vers +∞,
Puisque les valeurs propres de Hk sont les logarithmes des valeurs propres
de Ak , on en tire que, pour tout k > 0,
kHk k = ln max kAk k , kA−1
k k . (1)
k∈N
Un × Hn −→ GLn (C)
(U, H) 7−→ U exp(H).
Cela est à mettre en parallèle avec la forme polaire des nombres complexes, qui
correspond au cas n = 1 de ce résultat : tout nombre complexe non nul s’écrit
sous la forme u exp(iθ), avec u > 0 un nombre complexe de S 1 ' U1 et θ ∈ R.
Cette décomposition (u, exp(iθ)) est de plus unique.
© On peut amplement moduler ce développement : omettre la démonstration
classique de l’existence de la racine carrée est tout à fait possible, tout comme
s’arrêter à la décomposition A = U H sans parler d’exponentielle, ce qui per-
met de gagner du temps. L’homéomorphisme donné par l’exponentielle dans le
commentaire ci-avant a été établi dans un souci d’exhaustivité et pourrait être
présenté dans un développement à part entière pour illustrer les propriétés de
l’exponentielle matricielle, des matrices hermitiennes et de la réduction d’endo-
morphismes. Présenter le développement en se limitant aux questions a) et b)
est raisonnablement de niveau F. Il est nécessaire d’avoir un recul suffisant pour
pouvoir passer sous silence des arguments si l’on souhaite traiter également la
question c) ou la partie sur l’exponentielle présentée en commentaires, qui serait
alors d’un niveau FF compte tenu de sa longueur et des arguments permettant
de justifier (1).
188
Algèbre linéaire
Questions.
1. Dans le cas des matrices non inversibles, existe-t-il encore une racine carrée ?
et une décomposition polaire ?
2. Rappeler pourquoi le groupe Un est compact. Est-ce le cas pour Hn ?
3. Montrer qu’une suite d’un espace vectoriel normé qui est à valeurs dans un
compact et qui admet au plus une valeur d’adhérence est une suite convergente.
4. Montrer que si H = P AP −1 avec P ∈ GLn (C) et A ∈ Hn (C), l’image par
l’exponentielle est donnée par exp(H) = P exp(A)P −1 .
5. Montrer que exp est à valeurs dans GLn (C).
6. Si H, H 0 ∈ Hn++ , montrer que H + H 0 ∈ Hn++ .
7. Montrer que la norme matricielle subordonnée à k·k2 d’une matrice hermitienne
est son rayon spectral, i.e. le module maximal de ses valeurs propres.
8. Justifier l’égalité (1).
Indication : écrire les valeurs propres de Hk en fonction de celles de Hk , tout en
prenant garde aux valeurs négatives.
9. (a) Soit H ∈ On une matrice orthogonale. Montrer que H est orthogonalement
semblable à une matrice diagonale par blocs
Ip
−Iq
R(θ1 )
..
.
R(θr )
où p + q 6 n, θ1 , . . . , θr ∈ R et, pour θ ∈ R, R(θ) est la matrice de rotation
!
cos θ − sin θ
R(θ) = .
sin θ cos θ
(b) Si m ∈ N∗ , montrer que toute matrice H ∈ SOn admet une racine m-ième
dans GLn (C). Que dire dans le cas de H ∈ GLn (C) ? et de GLn (R) ?
10. Montrer que deux matrices hermitiennes qui commutent sont simultanément
diagonalisables dans une base orthonormée.
11. Expliquer pourquoi la limite d’une suite de matrices hermitiennes définies
positives est une matrice hermitienne positive. Est-elle définie positive ?
12. Rappeler pourquoi la continuité d’une application linéaire est équivalente à
la continuité séquentielle dans un espace métrique. Connaissez-vous un contre-
exemple dans le cas général ?
13. Montrer que exp(Hn ) ⊆ Hn++ .
14. Montrer que Hn++ est un cône ouvert convexe.
189
35. Réduction des endomorphismes nilpotents
Correction.
a) Puisque m est l’indice de nilpotence de u, on en déduit que um−1 n’est pas
l’endomorphisme nul, donc il existe un vecteur x ∈ E tel que um−1 (x) 6= 0.
Montrons que le système (x, u(x), . . . , um−1 (x)) est libre. Considérons une relation
de dépendance linéaire
m−1
X
λi ui (x) = 0,
i=0
190
Algèbre linéaire
et ceci implique que λ0 = 0 car hf, um−1 (x)i n’est pas nul par définition de f . Ce
procédé permet de déduire itérativement que λ0 , . . . , λm−1 sont tous nuls par les
mêmes arguments qu’à la question précédente, donc que y = 0. Ainsi la somme
de F et G est directe, et en particulier on en déduit que E = F ⊕ G.
c) On raisonne par récurrence sur la dimension n > 1, le résultat étant immédiat
en dimension 1. Supposons le résultat vrai en dimension inférieure à n − 1 pour
un certain n > 1, et prouvons-le en dimension n. Soient E un K-espace vectoriel
de dimension n et u un endomorphisme nilpotent de E. Par la question a), il
existe un sous-espace cyclique F stable par u. Par la question b), il existe un
supplémentaire G de F dans E stable par u. Choisissons pour F la base donnée par
un système de la forme (x, u(x), . . . , um−1 (x)) pour un certain x ∈ E et un m > 1.
En complétant cette base par des éléments du supplémentaire G de sorte à obtenir
une base de E, la matrice de u prend la forme par blocs
!
Nm 0
0 N0
191
35. Réduction des endomorphismes nilpotents
Commentaires.
© Le résultat prouvé ici est un résultat de réduction des endomorphismes nil-
potents. On ne peut espérer de diagonalisation dans le cas nilpotent, puisque
seul l’endomorphisme nul est à la fois diagonalisable et nilpotent. On obtient
une très bonne propriété de réduction en matrices diagonales par blocs de forme
simple : ce sont des blocs cycliques. Il s’agit de la décomposition de Jordan des
endomorphismes nilpotents, voir par exemple le Développement 80 pour une
preuve de la décomposition de Jordan dans le cas général (n’utilisant toutefois
que très peu d’outils d’algèbre linéaire).
© Les endomorphismes nilpotents sont fondamentaux en théorie de la réduction,
et peuvent être perçus comme les composantes non-diagonalisables des endo-
morphismes. En effet, la décomposition de Dunford (voir Développement 36)
assure que tout endomorphisme se décompose de manière unique comme somme
d’un endomorphisme semi-simple (autrement dit, diagonalisable dans un corps
algébriquement clos) et d’un endomorphisme nilpotents qui commutent, autre-
ment dit qui admettent une décomposition de l’espace en sous-espaces stables
par chacun d’eux. En voici par exemple une formulation ne faisant pas appel à la
semi-simplicité :
Soit A ∈ Mn (K) telle que χA est scindé. Il existe une unique matrice
diagonalisable D et une unique matrice nilpotente N telles que
• A=D+N;
• D et N commutent ;
• D et N sont des polynômes en A.
© La preuve présentée ici est « en profondeur » : on choisit un vecteur, on fait
agir l’endomorphisme u sur lui jusqu’à épuiser les vecteurs linéairement indépen-
dants ainsi obtenus, donnant un espace cyclique. L’existence d’un sous-espace
supplémentaire stable permet d’itérer le procédé, menant à une décomposition en
orbites sous l’action de u. On pourrait également faire une preuve « en largeur »,
en sélectionnant d’abord un système libre maximal de vecteurs x qui vérifient
192
Algèbre linéaire
um−1 (x) 6= 0, puis en adjoignant un système libre maximal de vecteurs y tels que
um−2 (y) 6= 0, etc. Une telle preuve évite le recours à la dualité.
© La discussion précédente permet de déterminer les tailles m1 > · · · > ms des
blocs de la décomposition en espaces cycliques. En effet, l’entier s est la dimension
de Ker(u), puisqu’il correspond au nombre de sous-espaces cycliques dans la
décomposition, et donc au nombre de vecteurs linéairement indépendants de la
forme umi −1 (x) 6= 0 avec umi (x) = 0, qui forment une base de Ker(u). On suit
alors la construction effectuée dans le commentaire précédent : la dimension m1
est l’indice de nilpotence de u par la question a). Le nombre de blocs cycliques
de taille au moins 2 est le nombre de vecteurs linéairement indépendants de la
forme umi −2 (x) qui complètent la base du noyau construite précédemment, il y
en a donc dim(u2 ) − dim(u). Itérativement on déduit la description suivante :
Questions.
1. Montrer que le seul endomorphisme diagonalisable et nilpotent est l’endomor-
phisme nul.
2. Soit u un endomorphisme nilpotent d’un espace vectoriel de dimension finie n.
Montrer que son indice de nilpotence est inférieur ou égal à n.
3. Rappeler la définition de l’orthogonal pour la dualité G et montrer que si G
est stable par u, alors G est stable par t u.
4. Justifier que pour tout x ∈ E\{0}, il existe une forme linéaire f ∈ E ∗ telle que
l’on ait f (x) 6= 0.
5. Montrer que les conditions suivantes sont équivalentes pour u ∈ L(E) :
• u est nilpotent ;
• u n’admet que zéro comme valeur propre et χu est scindé ;
• le polynôme minimal de u est de la forme X k pour un k > 1 ;
• le polynôme caractéristique de u est X dim(E) .
6. Montrer qu’un endomorphisme est nilpotent si, et seulement si, les tr(Ak ) sont
toutes nulles pour k > 1.
193
36. Décomposition de Dunford
(i) Montrer par récurrence que les trois propriétés suivantes sont vérifiées
pour tout entier k :
• Ak ∈ R[A] ;
• P 0 (Ak ) ∈ GLn (R) ;
k
• Il existe Bk ∈ R[A] tel que P (Ak ) = P (A)2 Bk .
(ii) En déduire que la suite (Ak )k est bien définie, stationnaire, et converge
vers une matrice D diagonalisable sur C.
(iii) Montrer que A − D est nilpotente et conclure à l’existence de la décom-
position de Dunford.
e) Montrer l’unicité de la décomposition de Dunford.
194
Algèbre linéaire
Correction.
a) Soient M ∈ Mn (R) et χM (X) = ni=0 ai X i son polynôme caractéristique.
P
a0 = χM (0) = det(M ) 6= 0.
k k
! !
k
X k k−i i k k−1
X k
(X + Y ) = X Y = X + kY X +Y 2
X k−i Y i−2 .
i=0
i i=2
i
195
36. Décomposition de Dunford
• Supposons que le résultat est établi au rang k > 0. Par hypothèse de récurrence,
la matrice Ak est un polynôme en A, donc c’est aussi le cas pour P (Ak ) ainsi
que pour P 0 (Ak )−1 d’après la question a), et donc pour Ak+1 .
Construisons maintenant la matrice Bk+1 . On pose
En posant Bk+1 = Bk2 P 0 (Ak )−2 Pe (Ak , M ) ∈ R[Ak ] ⊂ R[A], on obtient bien la
k+1
propriété recherchée P (Ak+1 ) = P (A)2 Bk+1 .
Il reste à montrer que P 0 (Ak+1 ) est inversible. En dérivant la relation
P 0 (X + Y ) = P 0 (X) + Y Q(X,
e Y)
196
Algèbre linéaire
k
question précédente, on a alors P (Ak ) = P (A)2 Bk = 0, d’où Ak+1 = Ak . La
suite (Ak )k∈N est donc stationnaire et, en laissant k tendre vers +∞, sa limite D
vérifie donc P (D) = 0.
Le polynôme P annule donc D et est scindé sur C et à racines simples. Ainsi, la
matrice D est diagonalisable sur C.
(iii) On a par télescopage, puisque D = Ak0 +1 ,
k0 k0
P (Ak )P 0 (Ak )−1 .
X X
A − D = A0 − Ak0 +1 = (Ak − Ak+1 ) = −
k=0 k=0
Chaque matrice P (Ak ) est nilpotente et commute avec P 0 (Ak )−1 (ces deux matrices
étant des polynômes en A). Ainsi, A − D est une somme de matrices nilpotentes
qui commutent entre elles, donc A − D est nilpotente. De plus, D et A − D
commutent car D est un polynôme en A (donc A − D aussi). La décomposition
A = D + (A − D) est donc bien une décomposition de Dunford.
e) Supposons que A s’écrive comme la somme D0 + N 0 avec N 0 nilpotente, D0
diagonalisable sur C et D0 N 0 = N 0 D0 .
Alors N 0 commute avec N 0 et D0 , donc avec D0 + N 0 = A. Comme N est un
polynôme en A, la matrice N 0 commute aussi avec N , et N 0 − N est nilpotente.
De même, D0 commute avec D donc D et D0 sont codiagonalisables sur C. En
particulier, D − D0 est aussi diagonalisable sur C.
L’égalité D − D0 = N 0 − N assure alors que D − D0 est diagonalisable et nilpotente,
donc nulle. On obtient donc D = D0 et N = N 0 .
Commentaires.
© Les questions a) à c) présentent des résultats classiques de l’agrégation. Il est
donc raisonnable d’en admettre certains, pour se concentrer sur la question d) qui
constitue le cœur de ce développement. En fonction de la durée du développement,
on peut aussi choisir de ne pas présenter la question e).
© Le résultat de la question b) peut être démontré en utilisant le critère de
cotrigonalisabilité. En effet, comme U et N commutent, elles sont cotrigonalisables.
Comme Sp(N ) = {0}, on a alors :
197
36. Décomposition de Dunford
198
Algèbre linéaire
M = f (M ) = f (D + N ) = f (D) + f (N )
f (M )f (N ) = f (M N ) = f (N M ) = f (N )f (M ).
M = P · XIp · P −1 = XP P −1 = XIp ,
199
36. Décomposition de Dunford
Questions.
1. Montrer que P est un polynôme à racines simples si et seulement si P et P 0
sont premiers entre eux.
2. Justifier que si N ∈ Mn (K) est nilpotente alors N n = 0.
3. Soit A ∈ Mn (R). Montrer que A est inversible si et seulement si elle admet un
inverse à gauche (resp. à droite).
4. Soient A, B ∈ Mn (R) telles que AB ∈ GLn (R). Montrer que A, B ∈ GLn (R).
5. Montrer que la somme de deux matrices nilpotentes qui commutent est nilpo-
tente.
6. Donner la décomposition de Dunford de ( 10 11 ) et ( 10 12 ).
7. Soient A et B deux matrices trigonalisables (resp. diagonalisables) qui com-
mutent. Montrer que A et B sont cotrigonalisables, i.e. il existe P inversible telle
que P −1 AP et P −1 BP sont triangulaires supérieures (resp. diagonales).
8. Montrer la version multiplicative de la décomposition de Dunford :
200
Algèbre linéaire
c) Prouver que les éléments f1 , . . . , fr sont uniques modulo les unités : toute
autre forme normale de Smith est donnée par des éléments fi0 = ui fi , pour
tout i ∈ J1, rK, où les ui sont des éléments inversibles de A.
Correction.
a) Soit M ∈ Mm,n (A). Si la matrice M est nulle, le résultat est immédiat.
Supposons désormais la matrice M non nulle. Considérons l’ensemble X de toutes
les matrices équivalentes à M . Soit f1 un coefficient non nul de stathme minimal
parmi toutes les matrices de X, autrement dit pour toute matrice U équivalente
à M et tout coefficient u dans U , on δ(f1 ) 6 δ(u). Celui-ci existe car δ est à
valeurs entières positives.
201
37. Forme normale de Smith
202
Algèbre linéaire
où f20 | · · · |fr0 . Posons fj = f1 fj0 pour tout j ∈ J2, rK, de sorte que f1 |f2 | · · · |fr .
Considérons les matrices
! !
1 0 1 0
P = et Q= .
0 P0 0 Q0
On a alors
P DQ = diag(f1 , . . . , fr , 0, . . . , 0) .
où f1 |f2 | · · · |fr , comme souhaité. Par transitivité, la matrice M est équivalente à
la matrice ci-avant, prouvant la propriété pour les matrices de Mm,n (A). Cela
termine la preuve.
203
37. Forme normale de Smith
c) Pour k 6 min(m, n), notons Ik (M ) l’idéal engendré par les mineurs de taille k
de M . Vérifions que Ik (M ) ne dépend que de la classe d’équivalence de M ,
autrement dit que pour toutes matrices inversibles P et Q, on a Ik (M ) = Ik (P M Q).
Pour une matrice quelconque P ∈ Mn (A), la multilinéarité du déterminant
implique que les mineurs de taille k de P M sont des combinaisons linéaires de
mineurs de taille k de M . En particulier, Ik (P M ) ⊆ Ik (M ). Cette propriété
demeure symétriquement pour les multiplications à droite. En notant N = P M Q,
on a alors
Ik (N ) = Ik (P (M Q)) ⊂ Ik (M Q) ⊂ Ik (M ).
Puisqu’on a aussi M = P −1 N Q−1 , le même argument prouve que Ik (M ) ⊂ Ik (N ),
donnant l’égalité voulue. Si on considère S la forme normale de Smith de M , on a
alors Ik (M ) = Ik (S), et on voit que
(
hf1 · · · fk i si 1 6 k 6 r,
Ik (S) = (1)
0 si r < k 6 min(m, n).
Le remplacement en cascade donne que, pour tout j ∈ J1, rK, il existe une unité u0j
telle que fj0 = u0j fj .
Commentaires.
© L’objectif de la réduction des endomorphismes est de simplifier au mieux la
forme des matrices avec lesquelles on travaille. Pour les matrices sur un corps,
l’algorithme du pivot de Gauss garantit que toute matrice est équivalente à une
matrice diagonale ne contenant que des 0 et des 1, cas le plus simple de la forme
normale de Smith mentionnée ici. Lorsque l’on considère des matrices à coefficients
dans un anneau, le problème est beaucoup plus difficile et très peu de résultats
généraux sont connus. Dans le cas particulier d’un anneau euclidien, la situation
est toutefois idéale : toute matrice est équivalente à une matrice diagonale, et de
manière unique lorsque l’on impose que les coefficients diagonaux sont croissants
pour la divisibilité.
© Si le cadre des anneaux euclidiens est rebutant, il est évident que ce développe-
ment peut être présenté dans le cas particulier A = Z sans aucune modification,
hormis que δ est alors la valeur absolue.
© Le résultat démontré sur la forme normale de Smith est parfois appelé théorème
des facteurs invariants.
204
Algèbre linéaire
© La preuve peut sembler longue, mais il ne faut pas oublier que beaucoup
d’espace est occupé par l’écriture de matrices assez simples, dont seuls quelques
coefficients importent. Il est important de savoir tirer avantage de ce fait au
tableau pour gagner du temps en n’écrivant que les éléments utiles. De plus,
il est tout à fait envisageable de ne présenter que la preuve de l’existence (en
détaillant les arguments sur les divisions euclidiennes et possiblement en donnant
un exemple d’application à une matrice spécifique si temps le permet ; cela permet
de se concentrer sur les propriétés et utilisations de la division euclidienne) ou
que celle de l’unicité (en détaillant le fait que les mineurs de taille k de P M
sont des combinaisons linéaires de mineurs de taille k de M et l’identité (1) ;
donnant plus d’emphase à l’utilisation des déterminants). La preuve de l’existence
seule, présentée aux questions a) et b), pourrait constituer un développement de
niveau F.
© Le fait que les mineurs de taille k de P M sont combinaisons linéaires des
mineurs de taille k de M est élémentaire mais technique : nous avons choisi de ne
pas en faire figurer le détail dans le développement, mais il est nécessaire d’en
connaître la justification en cas de question du jury. Si le détail n’est pas énoncé
ou expliqué au tableau lors du développement, il est important de faire figurer
ce lemme dans le plan, ce qui est notamment pertinent pour les leçons sur les
matrices et les déterminants. Notons I = {i1 , . . . , ik } des indices correspondant
aux lignes et J = {j1 , . . . , jk } des indices correspondant aux colonnes. Notons MIJ
la matrice extraite de M de taille k × k correspondant à ces indices. Autrement
dit, MIJ = (mir js )r,s∈J1,kK . Notons Cq la q-ième colonne de M et CI,q la q-ième
ne comprenant que les lignes d’indices dans I, de sorte que
M = (C1 | · · · |Cn ),
MI,J = (CI,j1 | · · · |CI,js ).
205
37. Forme normale de Smith
© La forme normale de Smith est un résultat puissant sur les modules. On peut en
particulier en déduire le théorème de structure des modules finiment engendrés sur
un idéal principal, qui contient notamment le théorème de structure des groupes
abéliens finis (qui ne sont que des Z-modules). Nous l’énonçons :
Soit V un module finiment engendré sur un anneau euclidien A. Il
existe t > 0 et des éléments f1 , . . . , fr ∈ A vérifiant f1 | · · · |fr tels que
Questions.
1. Justifier la description de l’idéal Ik (S) donnée en (1).
2. Quelle est la complexité de l’algorithme présenté dans la preuve ?
3. Appliquer l’algorithme donné dans la preuve à la matrice
7 3
3 7 .
4 4
4. Déduire du résultat prouvé que les matrices inversibles de Mn (A) sont les
produits de matrices d’opérations élémentaires sur les lignes et les colonnes.
5. Que dire de la forme normale de Smith lorsque A est un corps ?
6. Supposons que l’anneau A n’est plus nécessairement euclidien mais seulement
principal. La forme normale de Smith, si elle existe, est-elle unique ?
7. Expliquer pourquoi appliquer l’algorithme d’Euclide entre les coefficients de la
matrice M , ainsi que mentionné en commentaires pour rendre la preuve algorith-
mique, permet d’obtenir une matrice équivalente à M .
8. Démontrer le résultat de structure sur les A-modules finiment engendrés men-
tionné en commentaires.
Indication : montrer que A est isomorphe à un module An /M Am où M est une
matrice, et utiliser la forme normale de Smith pour M .
206
Algèbre linéaire
Soit A une sous-algèbre de Mn (C) que l’on suppose réduite, c’est-à-dire qu’elle
ne possède pas d’élément nilpotent non trivial. L’objectif de ce développement
est de montrer que tous les éléments de A sont codiagonalisables.
a) Montrer que la sous-algèbre A + CIn est également réduite, et expliquer
pourquoi on peut alors supposer que In ∈ A sans perdre en généralité.
On suppose désormais que In ∈ A.
b) Soit A ∈ A. Construire un polynôme scindé à racines simples annulant A,
et en déduire que A est diagonalisable.
c) (i) Montrer que tout élément A ∈ A est combinaison linéaire de projec-
teurs de A.
(ii) Soient A, B ∈ A, avec B un projecteur. Calculer (BAB − BA)2
et (BAB − AB)2 . En déduire que AB = BA, puis que A est une algèbre
commutative.
d) Conclure.
Correction.
a) Soit M = A + λIn ∈ A + CIn , avec A ∈ A et λ ∈ C∗ . On suppose que M est
nilpotente. Il s’agit de montrer qu’alors M = 0.
Si λ = 0, alors M = A ∈ A est nulle car A est réduite. On suppose dorénavant
que λ 6= 0.
Remarquons déjà que A est inversible : en effet, M étant nilpotente, son unique
valeur propre est 0, donc A = M − λIn admet −λ 6= 0 comme unique valeur
propre.
Ensuite, A et M commutent étant donné que AM = A2 + λA = M A, donc AM
est également nilpotente. De plus, AM = A2 + λA ∈ A car A est une sous-algèbre,
si bien que AM = 0, la sous-algèbre A étant réduite. On en conclut que M = 0
par inversibilité de A. Ainsi, la sous-algèbre A + CIn est réduite.
Comme A ⊂ A + CIn , si l’on montre que tous les éléments de A + CIn sont
codiagonalisables, ce sera aussi le cas pour tous les éléments de A. À partir de
maintenant, on pourra ainsi supposer que In ∈ A, de sorte que les polynômes en
207
38. Sous-algèbres réduites de Mn (C)
r
X
In = pi .
i=1
Il s’ensuit que
r
X r
X
A= Api = λi pi ,
i=1 i=1
208
Algèbre linéaire
Commentaires.
© La démonstration du critère de codiagonalisabilité ci-avant doit être connue.
Décrivons-la.
Procédons par récurrence sur la dimension n ∈ N∗ . Pour n = 1, le résultat
est immédiat. Supposons que n > 2 et que la propriété est vraie en dimension
strictement inférieure à n. On distingue deux cas :
Cas 1 : les fi sont tous des homothéties. Le résultat est alors direct.
Cas 2 : il existe i0 ∈ I tel que fi0 n’est pas une homothétie. Soient λ1 , . . . , λr ∈ C
ses valeurs propres distinctes. Comme fi0 est diagonalisable, on a
r
M
E= Eλk (fi0 ).
k=1
Fixons k ∈ J1, rK. Le sous-espace propre Eλk (fi0 ) est stable par fi0 et par
tous les fi , i 6= i0 , car ils commutent tous avec fi0 . Pour chaque i ∈ I, notons
alors gk,i l’endomorphisme induit par fi sur Eλk (fi0 ). Les endomorphismes
gk,i sont diagonalisables et commutent deux à deux ; de plus, dim Eλk (fi0 ) < n
(car fi0 n’est pas une homothétie). Par hypothèse de récurrence, les gk,i sont
donc codiagonalisables, autrement dit il existe une base Bk de Eλk (fi0 ) dans
laquelle les matrices des gk,i sont toutes diagonales. La base B de E obtenue
en concaténant les bases Bk des Eλk (fi0 ) est alors une base de diagonalisation
simultanée des endomorphismes fi , ce qui achève la preuve.
209
38. Sous-algèbres réduites de Mn (C)
Questions.
1. Soient A, M ∈ Mn (C) telles que M est nilpotente et AM = M A. Justifier
que AM est également nilpotente.
2. Justifier les égalités écrites à la question c)(i) :
r
X r
X
A= Api = λi pi ,
i=1 i=1
210
Algèbre linéaire
211
39. Théorème d’Engel
212
Algèbre linéaire
Correction.
a) (i) Soit x ∈ End(V ) nilpotent. Considérons les deux endomorphismes de
translation à droite et à gauche, respectivement définis par
213
39. Théorème d’Engel
Commentaires.
© Une algèbre de Lie est simplement un espace vectoriel muni d’un crochet de
Lie. Un crochet de Lie [x, y] sur L est une application bilinéaire alternée de L qui
satisfait l’identité de Jacobi
∀x, y, z ∈ L, [x, [y, z]] + [y, [z, x]] + [z, [x, y]] = 0.
Les notions usuelles sur les algèbres, tels les idéaux ou le centre, s’étendent alors
aux algèbres de Lie en remplaçant le produit par ce crochet de Lie.
214
Algèbre linéaire
215
39. Théorème d’Engel
Questions.
1. Si L est nilpotente, montrer que tous ses éléments sont ad-nilpotents.
2. Comment justifier l’existence de l’algèbre propre maximale considérée à la
question a)(iii) ?
3. Justifier que, pour une sous-algèbre propre maximale K de L, on a NL (K) = L.
4. Si deux éléments nilpotents x et y d’une algèbre commutent, montrer que toute
combinaison linéaire est nilpotente.
5. Quelles sont les algèbres de Lie de dimension 2 ?
6. Montrer que la représentation adjointe
ad : L −→ GL(L)
x 7−→ ad(x) = [x, ·]
216
Formes quadratiques et géométrie
M1
M2
θ θ α
M0
O
M3
M4
a) Montrer qu’il existe θ ∈ ]0, 2π[ tel que zk = eikθ pour tout k ∈ N.
On considère à présent la trajectoire « complétée » de la boule dans le plan,
prolongée pour des temps négatifs en utilisant la loi de Snell-Descartes. Les
points de rebond de la boule sur le bord du billard sont encore notés Mk pour
tout k ∈ Z et ont pour affixes les zk = eikθ . On pose alors
n o
I := {zk : k ∈ Z} = eikθ : k ∈ Z .
b) Montrer que I est l’ensemble des racines m-ièmes de l’unité pour un certain
entier m ∈ N∗ ou est dense dans U.
c) Montrer qu’il existe un unique cercle C de centre O et de rayon ρ < 1,
appelé cercle caustique, tel que chaque segment [Mk Mk+1 ] de la trajectoire
de la boule soit tangent à C.
219
40. Billard circulaire
Correction.
−−−→ −−−−→
a) Soit α ∈ − π2 , π2 une mesure de l’angle orienté (M0 O, M0 M1 ) (voir la Fi-
gure 1.6). Pour tout k ∈ N, le triangle OMk Mk+1 est isocèle en O, on en tire que
−−−→ −−−−−−→ −−−−−−→ −−−−→
l’angle (Mk O, Mk Mk+1 ) et l’angle (Mk+1 Mk , Mk+1 O) ont même mesure, et la
−−−−→ −−−−−−−→
loi de Snell-Descartes assure que ce dernier est aussi égal à (Mk+1 O, Mk+1 Mk+2 ),
si bien que l’on a :
−−−→ −−−−−−→ −−−−→ −−−−−−−→
(Mk O, Mk Mk+1 ) = (Mk+1 O, Mk+1 Mk+2 ).
−−−→ −−−−−−→
Pour tout k ∈ N, l’angle orienté (Mk O, Mk Mk+1 ) est donc de mesure α, donc
−−−→ −−−−→
l’angle (OMk , OMk+1 ) a pour mesure θ := π + 2α ∈ ]0, 2π[. On en déduit la
relation zk+1 = eiθ zk pour tout k ∈ N. Finalement, comme z0 = 1, une récurrence
immédiate donne
∀k ∈ N, zk = eikθ .
b) Introduisons le morphisme de groupes continu et surjectif
Γ : (R, +) −→ (U, ×)
x 7−→ eix .
Si x ∈ R on a x ∈ Γ−1 (I) si et seulement si eix = eikθ pour un certain k ∈ Z,
c’est-à-dire si et seulement si x ∈ θZ + 2πZ. La surjectivité de Γ donne par ailleurs
l’égalité I = Γ(Γ−1 (I)), si bien que
I = Γ(θZ + 2πZ). (1)
L’ensemble θZ + 2πZ est un sous-groupe additif de R, donc est de la forme aZ
avec a > 0 ou bien dense dans R. On va voir que le premier cas se produit lorsque
θ
l’angle θ vérifie 2π ∈ Q∗ , et le deuxième lorsque 2π
θ
∈
/ Q.
• Supposons pour commencer que θ
2π ∈ Q∗ . Il existe alors n ∈ Z∗ et m ∈ N∗
θ n
premiers entre eux tels que 2π = m. On a donc :
θ n 2π
θZ + 2πZ = 2π Z + Z = 2π Z+Z = (nZ + mZ). (2)
2π m m
Or n et m sont premiers entre eux, donc le théorème de Bézout permet
d’affirmer que 1 ∈ nZ + mZ, si bien que Z = nZ + mZ. L’équation (2) s’écrit
alors θZ + 2πZ = 2πm Z. Par suite :
2π
n 2kπ o
I = Γ(θZ + 2πZ) = Γ Z = ei m : k ∈ Z
m
d’après la relation (1), donc I est l’ensemble des racines m-ièmes de l’unité
et la trajectoire de la boule a l’allure de celle représentée sur la Figure 1.6,
c’est-à-dire celle d’un polygone régulier à m côtés.
220
Formes quadratiques et géométrie
θ
• À présent, étudions le cas où 2π ∈
/ Q. Si l’on a θZ + 2πZ = aZ pour un
certain a > 0, alors il existe n ∈ Z∗ tel que θ = an (puisque θ ∈ θZ + 2πZ)
et il existe m ∈ Z∗ tel que 2π = am (puisque 2π ∈ θZ + 2πZ), et donc on
θ n
aurait 2π = m ∈ Q, ce qui est exclu. La partie θZ + 2πZ est donc dense
dans R, et il en résulte que I = Γ(θZ + 2πZ) est dense dans U en vertu de la
surjectivité et de la continuité de Γ. La trajectoire de la boule a alors une
apparence proche de celle représentée sur la Figure 1.7.
M−3 M1 M5
M9
M13
M10
M6
M2
M0
M−2 O
M4
M8
M12
M11
M7 M M
3 −1
c) Supposons qu’il existe ρ > 0 tel que chaque corde [Mk Mk+1 ] soit tangente au
cercle de centre O et de rayon ρ. Alors, pour tout k ∈ Z, le rayon ρ est égal à la
distance de O au segment [Mk Mk+1 ].
M1
ρ
α M0
O
M2
221
40. Billard circulaire
Commentaires.
© Compte tenu de l’interprétation pratique du problème, une question naturelle
est celle de la forme de l’ensemble
des affixes des points de rebond de la boule sur le bord du billard, qui ne contient
pas les points zk pour k ∈ Z∗− qui correspondent à des « temps négatifs ». Le
problème ne se pose alors plus en termes de sous-groupes additifs de R, mais les
résultats démontrés dans ce développement sont encore valables grâce au même
raisonnement que plus haut et à la proposition ci-après, que nous démontrons
dans le commentaire suivant :
Si A est une partie stable par somme de R contenant un élément
strictement positif et un élément strictement négatif, alors A est de la
forme aZ pour un certain a > 0 ou est dense dans R.
222
Formes quadratiques et géométrie
et donc
∀n > n0 , ∀p > n0 , sn + mp > m.
En faisant tendre p vers +∞ dans la relation ci-avant, on obtient
∀n > n0 , sn + m > m,
Questions.
1. Quelle est la trajectoire de la boule lorsque α = 0 ?
2. Détailler la preuve du fait que θ = π + 2α.
3. Γ|[0,2π[ est-il un homéomorphisme ?
4. Quelle est la longueur du segment [M0 M1 ] ?
5. Pourquoi la surjectivité de Γ permet-elle d’écrire Γ(Γ−1 (I)) = I ?
6. Expliquer pourquoi la surjectivité et la continuité de Γ permettent d’affirmer
que si A est une partie dense de R, alors Γ(A) est dense dans U.
223
40. Billard circulaire
7. Peut-on avoir I = U ?
8. Tout point du cercle caustique est-il tangent à un segment de la trajectoire de
la boule ?
θ
9. Dans le cas où 2π ∈
/ Q, montrer que l’ensemble des points adhérents à la
trajectoire de la boule est la couronne C = {z ∈ C : ρ 6 |z| 6 1}.
10. On suppose désormais que le billard est de forme carrée et on l’identifie au
pavé fermé [0, 1]2 . La boule est tirée depuis le point (0, 0) dans le même sens et la
même direction qu’un certain vecteur (a, b) ∈ R∗+ × R+ . On suppose que le rebond
de la boule obéit toujours aux lois de Snell-Descartes dès que le point d’impact
de la boule sur le bord du billard est différent des quatre sommets du carré (voir
Figure 1.10), et que la boule rebrousse chemin le long de sa trajectoire lorsqu’elle
touche l’un de ces sommets.
1
b
a
0 1
(a) Montrer qu’il existe une trajectoire périodique qui ne soit pas parallèle aux
côtés du carré.
(b) Montrer que si ab ∈ Q, alors la boule rejoint un coin du carré au bout d’un
certain temps.
Indication : on pourra faire un lien entre la trajectoire de la boule et la droite
d’équation y = ab x.
(c) Que devient le résultat de la question précédente si l’on tire la boule du point
(0, y) avec y ∈ [0, 1] ?
(d) Montrer que toutes les trajectoires périodiques comportent un nombre pair
de rebonds par période.
(e) Montrer que si ab ∈ Q, alors la boule rejoint un coin du carré au bout d’un
certain temps.
Indication : on pourra faire un lien entre la trajectoire de la boule et la droite
d’équation y = ab x.
(f) Montrer que si ab ∈
/ Q, alors l’ensemble des points de rebond de la boule est
une partie dense du bord du billard.
11. On suppose enfin que le billard a la forme d’un triangle dont les trois angles
sont aigus et que le rebond de la boule obéit aux même lois que précédemment.
Montrer qu’il existe une trajectoire périodique.
224
Formes quadratiques et géométrie
× Brique 4
× Brique 3
× Brique 2
~z
× Brique 1
~x x1 x2 x3 x4
0 < `/2 = x1 6 · · · 6 xn ,
225
41. Le plongeoir le plus long
∀k ∈ J2, nK , yk = xk − xk−1 .
(i) Montrer que les avancées successives d’un plongeoir stable vérifient
n−1
n−1 y2 + n−2 n−3
n−1 y3 + n−1 y4 + . . .
1
+ n−1 yn 6 `
2
n−2
y3 + n−3 1 `
n−2 y4 + . . . + n−2 yn 6
n−2 2
.. (1)
.
1 `
n−(n−1) yn 6 2
Correction.
a) (i) Pour tout i ∈ J1, nK, on note Bi ∈ R3 le centre de gravité de la brique i :
comme la brique est homogène, Bi est l’isobarycentre de ses huit points extrémaux
(c’est-à-dire de ses « coins »). Toutes les briques sont identiques, donc pour tout
indice k ∈ J1, nK, le centre de gravité B en−k+1 de l’ensemble constitué par les k
briques supérieures n − k + 1, . . . , n est l’isobarycentre des centres de gravité de
chacune de ces briques. On en déduit
n
en−k+1 = 1
X
∀k ∈ J1, nK , B Bi ,
k i=n−k+1
226
Formes quadratiques et géométrie
` `
× ×
× ×
x1 x2 x1 x2
`
x1 + 2 x1 + 2`
227
41. Le plongeoir le plus long
×
x1 x2 x3 x
e3 x4
x
e4
`
x
e 3 6 x2 +
2
En raisonnant par récurrence on obtient que, pour tout n > 2, le plongeoir est
stable si et seulement si l’on a :
`
x
e2 6 x1 + 2
..
.
`
(2)
x
en−1 6 xn−2 + 2
`
x 6 xn−1 +
en 2
9. Cette propriété n’est pas si évidente qu’il n’y paraît. On serait tenté de dire que si le centre
de gravité d’un sous-système n’est pas en amont de la brique qui le soutient il suffit de le décaler
pour augmenter la longueur du plongeoir, mais cette opération changerait aussi l’emplacement
des centres de gravité des sous-systèmes de K briques supérieures avec K > k, au risque de faire
s’effondrer l’ensemble !
228
Formes quadratiques et géométrie
` n−2 n−3 1
ε := − y3 − y4 − · · · − yn > 0
2 n−1 n−1 n−1
en gardant constantes les autres avancées tout en conservant un plongeoir stable,
ce qui revient à translater légèrement le sous-système constitué des n − 1 briques
supérieures vers la droite. Le plongeoir obtenu serait alors un plongeoir stable
à n briques dont la longueur serait égale à `n + ε > `n , ce qui est absurde. La
première contrainte de (1) est donc bien une égalité.
(ii) Raisonnons par l’absurde et supposons que l’une des avancées yi soit nulle.
Il existe alors un plongeoir optimal avec une première avancée nulle. En effet, dans
le cas où y2 = 0, il s’agit du plongeoir que nous sommes en train de considérer.
Sinon, notons i0 le plus petit i ∈ J3, nK tel que yi = 0. Le plongeoir obtenu
en retirant la brique i0 et en la plaçant entre la brique 1 et la brique 2 avec
une avancée nulle par rapport à la brique 1, c’est-à-dire le plongeoir associé aux
avancées
(y20 , . . . , yn0 ) := (0, y2 , . . . , yi0 −1 , yi0 +1 , . . . , yn ),
est un plongeoir stable optimal (puisque de longueur `n ) ayant une première
avancée nulle. On voit donc que dans tous les cas, il existe un plongeoir optimal
vérifiant y2 = 0.
Mais alors la deuxième ligne de (1) montre que pour un tel plongeoir, la première
contrainte de (1) n’est pas saturée. Ceci, comme on l’a vu dans la question b)(i),
amène une contradiction. On en déduit que toutes les avancées yi sont strictement
positives.
(iii) Le raisonnement heuristique est le suivant : si l’une des contraintes exprimées
dans le système (1) n’est pas saturée, on peut augmenter une avancée et diminuer
plus légèrement l’avancée précédente de façon à augmenter la longueur totale du
plongeoir tout en satisfaisant le système (1), ce qui aboutit à une contradiction.
229
41. Le plongeoir le plus long
Cette manœuvre est rendue possible par le fait que chaque avancée est plus
faiblement pondérée dans (1) que celle qui la précède.
Formalisons ce raisonnement. On note δ := mini∈J1,nK yi > 0. Si la dernière
ligne du système (1) n’est pas une égalité, en posant ε = min( 2` − yn , δ) > 0 et
yn0 = yn + ε ainsi que yn−1 0 = yn − 2ε , on vérifie 10 que les avancées successives
0 0
y1 , . . . , yn−2 , yn−1 , yn sont positives, vérifient (1) et sont associées à un plongeoir
de longueur `n + 2ε > `n . C’est impossible puisque le plongeoir est supposé optimal ;
la dernière ligne de (1) est donc nécessairement une égalité.
À présent, si l’avant-dernière ligne de (1) n’est pas une égalité, on obtient une
contradiction similaire en posant ε = min 2` − 21 yn − yn−1 , δ > 0 et en définissant
0
yn−1 = yn−1 + ε et yn−2 0 = yn−1 − 23 ε (ce qui donne un plongeoir stable de longueur
égale à `n + 3ε ). En raisonnant ainsi pour chaque ligne, on voit que toutes les
contraintes exprimées dans (1) sont des égalités.
On a donc montré que les avancées successives du plongeoir optimal vérifient
n−1
n−1 y2 + n−2 n−3
n−1 y3 + n−1 y4 + . . .
1
+ n−1 yn = `
2
n−2
y3 + n−3 1 `
n−2 y4 + . . . + n−2 yn =
n−2 2
.. (3)
.
1 `
n−(n−1) yn = 2
d’où enfin :
`
∀i ∈ J2, nK , yi = .
2(n − i + 1)
10. En effet, un simple calcul montre d’une part que les termes de gauche des n − 2 premières
lignes de (1) sont les mêmes que lorsque les avancées successives sont y1 , . . . , yn , et d’autre part
que la dernière ligne de (1) est devenue une égalité.
230
Formes quadratiques et géométrie
k k
X X `
∀k ∈ J1, nK , xk = yi = y1 +
i=1 i=2
2(n − i + 1)
n−1
X `
= y1 +
i=n−k+1
2i
n−1
` X 1
.
= 1+
2 i=n−k+1
i
Ces relations caractérisent un unique plongeoir, qui est donc le plongeoir optimal
recherché. La longueur de ce plongeoir est égale à
n−1
!
` ` X1
`∗n = xn + = 2+ (4)
2 2 i=1
i
`
`∗n ∼ ln n lorsque n → +∞.
2
Commentaires.
231
41. Le plongeoir le plus long
ait λi = 0 ou gi (x∗ ) = 0.
ainsi que
∀i ∈ J2, nK , gn−1+i (y2 , . . . , yn ) = yi .
2n−1
X
Le fait que la suite d’avancées (y2 , . . . , yn ) soit un point critique de f + λ i gi
i=2
se réécrit de la façon suivante :
k
X
∀k ∈ J2, nK , 1− (n − k + 1)λi + λn−1+k = 0.
i=2
Comme les contraintes yk > 0 ne sont pas saturées d’après la question b)(ii), les
coefficients λn−1+k sont nuls, si bien que l’on a
k
X 1
∀k ∈ J2, nK , λi = ,
i=2
n−k+1
d’où l’on déduit que tous les λi sont strictement positifs et donc que les contraintes
associées (c’est-à-dire les inégalités constituant le système (1)) sont saturées.
Remarque : les coefficients λi sont appelés multiplicateurs de Lagrange associés
au problème d’optimisation sous contrainte. Les conditions dites de relâchement
min(λi , gi (x∗ )) = 0 expriment le fait que le multiplicateur de Lagrange est nul
lorsque la contrainte gi (x) > 0 n’est pas saturée. On pourra se référer au chapitre 10
de [All12] pour plus d’informations sur l’optimisation sous contraintes, et aux
questions suivant le Développement 57 pour une interprétation des multiplicateurs
de Lagrange associés à une contrainte saturée.
232
Formes quadratiques et géométrie
Questions.
1. Comment définit-on un point extrémal d’une partie convexe de R3 ?
2. Comment définit-on le centre de gravité d’un solide quelconque de R3 ? Justifier
l’affirmation selon laquelle Bi est l’isobarycentre des points extrémaux de la brique
numéro i pour tout i ∈ J1, nK.
3. Détailler le passage du système (2) au système (1).
4. Détailler la récurrence qui clôt la réponse à la question a)(i).
5. Justifier que l’ensemble H introduit dans la question c) est une partie fermée
et bornée de Rn .
6. Montrer que la conclusion de l’exercice est toujours valable dans le cas où
les xi ne sont plus supposés croissants (c’est-à-dire où l’on autorise le placement
de briques jouant le rôle de contrepoids, tout en conservant la règle selon laquelle
on place une unique brique par couche).
7. Donner une approximation du nombre de briques de 20 centimètres de long
nécessaires pour construire un plongeoir de longueur au moins égale à 2 mètres.
On change à présent la règle relative à l’empilement des briques en autorisant le
positionnement de plusieurs briques en équilibre à la même altitude comme sur la
Figure 1.13.
233
41. Le plongeoir le plus long
9. On considère la structure
représentée
sur la Figure 1.14. La brique supérieure
1 ` x2 +x3
exerce une fraction ` x4 + 2 − 2 de son poids sur la brique de droite de la
deuxième couche et le reste sur la brique de gauche. Donner une condition sur les
centres x1 , x2 , x3 et x4 pour que la structure soit stable.
× ×
×
x2 x1 x4 x3 x
10. Montrer que le triangle inversé représenté dans la Figure 1.15 n’est pas stable.
234
Formes quadratiques et géométrie
Correction.
a) Pour tout i ∈ J1, mK, notons yi le vecteur (xi , 1) ∈ Rn+1 . Les yi forment une
collection de m > n + 2 vecteurs de Rn+1 , donc une famille liée. Il existe donc des
scalaires λ1 , . . . , λm ∈ R non tous nuls tels que
m
X
λi yi = 0,
i=1
Notons I (resp. J) l’ensemble des i ∈ J1, mK tels que λi > 0 (resp. λi < 0). La
seconde relation dans (1) permet alors de définir
X X
λ := λi = − λj > 0. (2)
i∈I j∈J
235
42. Théorèmes de Helly et de Carathéodory
est dans l’enveloppe convexe de {xi : i ∈ I} ainsi que dans celle de {xj : j ∈ J},
qui sont donc en particulier d’intersection non vide.
b) Prouvons le théorème de Helly par récurrence sur m > 1. Pour m = n + 1, le
résultat est inclus dans l’hypothèse. Soit m > n + 1 et supposons la propriété vraie
au rang m − 1. Soient K1 , . . . , Km des compacts convexes de Rn . Supposons que
chaque intersection de n + 1 compacts parmi eux est non vide. Par l’hypothèse de
récurrence, chaque intersection de m − 1 compacts parmi eux est non vide. En
particulier, pour tout i ∈ J1, nK, il existe un élément xi ∈ Rn tel que
m
\
xi ∈ Kj .
j=1
j6=i
Par la question a), qui s’applique car m > n + 2, il existe une partition de J1, mK
en deux ensembles disjoints I et J tels que l’enveloppe convexe de {xi : i ∈ I}
ainsi que celle de {xj : j ∈ J} s’intersectent en au moins un point. Soit y
un tel point. On veut montrer que y appartient à tous les K` pour l ∈ J1, mK.
Supposons l ∈ I. Alors, pour tout j ∈ J, on a xj ∈ K` . Puisque K` est un ensemble
convexe, l’enveloppe convexe de {xj : j ∈ J} est entièrement incluse dans K` . En
particulier, y ∈ K` comme souhaité. Dans le cas où ` ∈ J, le raisonnement est
analogue. Ainsi, y est dans tous les K` pour l ∈ J1, mK, ce qui achève la récurrence.
c) Soit x dans l’enveloppe convexe de S. Il existe donc s > 1 et des coefficients
λ1 , . . . , λs tels que, pour tout i ∈ J1, sK,
s
X s
X
λi > 0, λi = 1, et x = λ i xi .
i=1 i=1
Supposons que s > n + 1, sinon la propriété est déjà vérifiée. Nous allons prouver
qu’il existe un ensemble S 0 strictement inclus dans {x1 , . . . , xs } tel que x est dans
l’enveloppe convexe de S 0 , ce qui permettra de terminer la preuve par récurrence
descendante. Considérons les vecteurs x2 − x1 , . . . , xs − x1 , qui forment une famille
liée puisqu’ils sont au nombre de s − 1 > n + 1 et sont dans Rn . Ainsi, il existe
des coefficients non tous nuls µ2 , . . . , µs ∈ R tels que
s
X
µi (xi − x1 ) = 0. (3)
i=2
236
Formes quadratiques et géométrie
On peut alors choisir un λ0 > 0 tel que les λ0i = λi − λ0 µi sont positifs et au moins
l’un d’eux est nul. Par exemple,
λj
λ0 = min .
j∈J1,sK µj
µj >0
On obtient alors, pour tout i ∈ J1, sK, de nouveaux coefficients λ0i vérifiant
s s s
λ0i > 0, λ0i = λ0i xi .
X X X
λi = 1 et x =
i=1 i=1 i=1
Commentaires.
© Le résultat de la question a) est dû à Radon. Il admet une généralisation due à
Tverberg pour l’intersection de plus de deux ensembles, que nous énonçons ici :
Soit r > 2. Considérons une famille de (r − 1)(n − 1) + 1 points de Rn .
Il existe alors une partition de cette famille de points en r parties dont
les enveloppes convexes s’intersectent.
Ce résultat a de nombreuses applications informatiques. Le problème de savoir si
une telle partition peut être déterminée algorithmiquement en un temps polynomial
est encore ouvert.
© Le théorème de Helly peut être utilisé pour montrer le théorème de Jung :
Tout ensemble de diamètre 1 de Rn est inclus dans une boule de rayon
s
n
rn = .
2(n + 1)
237
42. Théorèmes de Helly et de Carathéodory
Questions.
1. Préciser la récurrence descendante permettant de conclure au théorème de
Carathéodory dans la question c).
2. Donner une preuve élémentaire du théorème de Helly dans le cas de trois
segments de R, ainsi qu’une illustration graphique de la situation.
3. Soit X une famille de segments parallèles du plan. Supposons que tout sous-
ensemble de trois segments de X admet une transversale, i.e. une droite intersectant
les trois segments. Montrer que tous les segments de X admettent une transversale
commune (Théorème de Rey, Pastór et Santaló).
4. Donner des contre-exemples au théorème de Helly si on remplace l’hypothèse
« compact » par « fermé » ou par « borné ».
5. Montrer que l’enveloppe convexe d’un compact d’un R-espace vectoriel de
dimension finie est compacte. Est-ce que cela demeure en dimension infinie ?
Indication : en dimension infinie, considérer l’enveloppe convexe de la famille des
éléments en /n pour n > 1, où en ∈ RN est la suite définie par en (k) = 1 si k = n
et 0 sinon.
6. Représenter graphiquement la situation de la question a) dans R2 .
7. Illustrer le résultat et la preuve de la question b) dans le cas n = 2 et m = 4.
8. Rappeler pourquoi l’enveloppe convexe d’un ensemble S est l’ensemble des
combinaisons convexes des points de S.
9. Montrer que le théorème de Carathéodory permet de prouver le théorème de
Radon démontré à la question a).
238
Formes quadratiques et géométrie
Correction.
a) (i) Traitons séparément le cas des réflexions et celui des translations.
• Soit t une translation du plan. Définissons un repère orthonormal direct en
prenant l’axe des ordonnées parallèle à la direction de t, de sorte qu’il existe
un δ ∈ R tel que t est la translation t(0,δ) par le vecteur (0, δ). Notons r la
réflexion par rapport à l’axe des abscisses, et r0 la réflexion t(0,δ/2) rt−1
(0,δ/2) .
2
On a pour tout (x, y) ∈ R , par définition des translations et des réflexions,
Ainsi, t(0,δ) = r0 r. Nous avons donc prouvé que toute translation du plan
s’écrit comme produit de deux réflexions.
• Soit ρ une rotation. Définissons un repère orthonormal direct en prenant
l’origine comme étant le centre de la rotation de sorte qu’il existe un θ ∈ R
239
43. Théorème des trois réflexions
= A.
Ainsi, la droite ∆ est fixe par l’action de ρθ rD ρ−1 θ , qui est une isométrie
du plan. Il ne peut donc s’agir que de l’identité ou d’une réflexion d’axe ∆.
De plus, elle ne peut pas être l’identité sinon, en conjuguant par ρ−1 θ , on
aurait que rD serait l’identité contrairement à sa définition. On a donc bien
l’égalité r∆ = ρθ rD ρ−1
θ comme voulu.
Prenons l’axe des abscisses comme étant la droite D. Puisque rD est la
réflexion par rapport à l’axe des abscisses, le calcul de la question précédente
dans le cas des rotations donne que r∆ rD = ρ2θ , la rotation de centre le point
d’intersection des deux droites et d’angle le double de l’angle orienté entre les
deux droites.
• Supposons que les deux droites sont parallèles. Définissons l’origine comme
un point sur la droite D. Considérons ∆ comme la droite translatée de D par
240
Formes quadratiques et géométrie
241
43. Théorème des trois réflexions
Commentaires.
© Ce développement consiste en un argument très géométrique, raisonnant cas
par cas pour montrer que toute isométrie du plan est engendrée par au plus trois
réflexions. Cela en fait un système de générateurs privilégiés pour le groupe des
isométries du plan.
© Il est bon d’avoir en tête les différentes isométries du plan, qui sont
• l’identité,
• les translations,
• les rotations,
• les réflexions,
• les réflexions glissées.
© La conjugaison est un outil central dans ce développement, et il est important
d’en comprendre les effets. Il s’agit bien d’une opération de changement de base
comme en algèbre linéaire : nous invitons fortement le lecteur à vérifier les égalités
mentionnées dans la correction (voir questions) en utilisant plusieurs formalismes :
les coordonnées cartésiennes comme dans la question a), complexes, ou les matrices
des isométries vectorielles sous-jacentes.
© Malheureusement de nombreuses leçons restreignent le cadre géométrique à la
géométrie euclidienne, mais le groupe des isométries est un moyen fondamental de
comprendre une géométrie. Par exemple, les isométries du plan hyperbolique sont
les homographies, ce qui peut trouver sa place dans une ouverture des leçons 160
ou 161 aux géométries non-euclidiennes, et qui sera certainement un exemple
bienvenu dans la leçon d’application des nombres complexes à la géométrie.
Questions.
1. Justifier que, si r est une réflexion, alors t(0,δ) rt−1 −1
(0,δ) (resp. ρθ rρθ ) est également
une réflexion. Quel est son axe par rapport à celui de r ?
2. Faire les calculs de la question a)(i) en utilisant le formalisme des nombres
complexes.
3. Montrer que le sous-groupe des isométries positives, i.e. produit d’un nombre
pair de réflexions, est un sous-groupe d’indice 2 du groupe des isométries de R2 .
4. Montrer qu’une isométrie de R2 est entièrement déterminée par l’image de trois
points non alignés.
5. Est-ce que la décomposition d’une translation ou d’une rotation en produit de
réflexions est unique ?
6. À quoi correspond géométriquement le produit de trois réflexions ?
7. Montrer que le sous-groupe des isométries directes est un sous-groupe distingué
des isométries du plan.
242
Formes quadratiques et géométrie
Correction.
a) (i) Supposons que Γ est un sous-groupe d’isométries de R2 discontinu et sans
point fixe.
Considérons un point x de R2 et notons Γx son orbite sous l’action de Γ. Pour
toutes isométries γ, γ 0 ∈ Γ, on note γx l’image de x par γ et γγ 0 la composée γ ◦ γ 0 .
Montrons que les orbites sous l’action de Γ sont localement séparées. Par définition
de la discontinuité, il existe δ > 0 tel que Γx ne possède aucun autre point que x
dans la boule ouverte B(x, δ). Autrement dit, tous les points de l’orbite Γx distincts
de x sont à une distance de x supérieure à δ. De plus, Γ n’a pas de point fixe,
donc pour tout γ ∈ Γ\{Id}, le point γx est distinct de x et donc est situé à une
distance de x supérieure à δ. Soient y ∈ B(x, δ/3) et z est un point de l’orbite de y,
que l’on peut donc écrire sous la forme z = γy pour un certain γ ∈ Γ, l’inégalité
243
44. Théorème de Killing-Hopf
Ainsi, la boule B(x, δ/3) ne contient aucun point de l’orbite Γy hormis y. Puisque y
est quelconque, cela prouve bien que les orbites sont localement séparées.
(ii) Supposons que tout point x ∈ R2 admette un voisinage ouvert Vx dans
lequel chaque point appartient à une orbite différente.
Montrons que Γ est discontinu. Raisonnons par l’absurde et supposons que ce ne
soit pas le cas. Il existe donc un point d’accumulation de l’orbite d’un x ∈ R2
sous l’action de Γ. Il existe alors une suite non stationnaire (γn x)n∈N de points de
l’orbite de x qui converge vers une limite que l’on note y. Puisque le voisinage Vy
de y est un ouvert et puisque (γn x)n∈N converge vers y, les γn x sont dans Vy à
partir d’un certain rang. Par hypothèse, puisqu’ils sont dans l’orbite de x, ils sont
donc tous égaux à partir de ce rang. Ainsi la suite (γn x)n∈N stationne, ce qui
contredit l’hypothèse. Aucune orbite de Γ n’admet donc de point d’accumulation,
autrement dit Γ est discontinu.
Montrons désormais que Γ est sans point fixe. Supposons que ce ne soit pas le
cas, et donc qu’il existe γ ∈ Γ différent de Id et admettant un point fixe x ∈ R2 .
Notons que γ ne peut pas fixer trois points non-alignés, sinon ce serait l’identité.
Pour tout ε > 0, il existe donc un point y ∈ B(x, ε) qui n’est pas fixé par γ. Alors
on a
kγy − xk = kγy − γxk = kx − yk < ε
puisque x est un point fixe et que γ est une isométrie. Ainsi, y et γy sont deux
points distincts d’une orbite de Γ dans la boule B(x, ε). Puisque ε > 0 est
quelconque, cela est contraire à l’hypothèse. Ainsi, Γ est bien sans point fixe.
b) (i) Soit x ∈ R2 . L’orbite de x sous l’action de Γ est discrète par l’hypothèse
de discontinuité de Γ. Soit γ0 ∈ Γ \ {Id} arbitraire. L’intersection de l’orbite Γx
avec la boule compacte épointée B(x, kx − γ0 xk) \ {x} est donc finie. Elle est de
plus non vide car elle contient γ0 x. La fonction dx : y 7→ kx − yk admet donc un
minimum sur cette intersection. Notons γ1 x un élément de Γx où ce minimum est
atteint :
dx (γ1 x) = kx − γ1 xk = min kx − γxk.
γ ∈ Γ \ {Id}
γx ∈ B(x,kx−γ0 xk)
Ainsi, pour tout γ ∈ Γ, on a dx (γx) > dx (γ1 x). Autrement dit, la fonction dx
atteint un minimum (en γ1 x) sur l’orbite de Γ \ {Id}. Ce minimum est de plus
non nul car γ1 6= Id est une translation non triviale.
244
Formes quadratiques et géométrie
(ii) Montrons que le sous-groupe hγ1 i de Γ engendré par γ1 contient toutes les
translations de Γ parallèles à γ1 , i.e. de vecteur parallèle à u := γ1 (0). Notons que
ce vecteur n’est pas nul car γ1 est une translation non triviale. Raisonnons par
l’absurde et supposons qu’il existe λ ∈ R tel que la translation γ de vecteur λu
soit dans Γ mais pas dans hγ1 i. Comme hγ1 i est l’ensemble des translations de
vecteur ku avec k ∈ Z, cela revient à supposer que λ ∈ R \ Z.
−bλc
L’isométrie γγ1 est alors un élément de Γ. Il s’agit de la translation de vecteur
égal à λu − bλcu = (λ − bλc)u, or
k (λ − bλc) uk = |λ − bλc| · kuk < kuk
puisque λ ∈ R \ Z et puisque kuk =
6 0 (voir Figure 1.16).
−bλcu
x γ1 x
• •
−bλc γx
γγ1 x
u
Ainsi, Γ contient une translation dont le vecteur non nul a une longueur strictement
inférieure à celle de u, ce qui contredit la définition de u. Finalement, hγ1 i contient
bien toutes les translations de Γ de vecteur parallèle à u.
(iii) Supposons que hγ1 i = 6 Γ ; la question précédente garantit que Γ \ hγ1 i
est formé de translations de vecteurs non parallèles à u. Soit γ2 ∈ Γ \ hγ1 i une
translation de vecteur v = 6 0 de longueur minimale ; une telle translation existe
par le même argument de compacité qu’à la question b)(i). Comme v ∈ / Vect (u),
la famille (u, v) est libre et forme donc une base de R . 2
/ Z2 . On va montrer que w
qui est non nul puisque (λ, µ) ∈ e est « trop court » pour
être compatible avec la définition de u et v (voir la Figure 1.17).
245
44. Théorème de Killing-Hopf
−λu
e w = λu + µv
•
−µ
ev
• w
e
0 u
Si µ − µ
e = 0, alors
kwk
e = (λ − λ)u
e e · kuk 6 1 kuk < kuk,
= λ−λ
2
ce qui est absurde puisque u est de longueur minimale parmi les vecteurs non
nuls des translations de Γ. Ainsi, on a µ − µ
e 6= 0 et donc w
e∈/ Vect (u). L’inégalité
triangulaire donne à présent
kwk
e = λ−λ
e u + (µ − µ
e) v
6 λ−λ
e u + k(µ − µ
e) vk (1)
= λ−λ
e · kuk + |µ − µ
e| · kvk
1
6 (kuk + kvk)
2
6 kvk.
246
Formes quadratiques et géométrie
Commentaires.
© Ce développement repose sur la connaissance et les propriétés des isométries
euclidiennes : ce sont les translations, les rotations, les réflexions et les réflexions
glissées. La réduction de la connaissance d’un groupe à celle de ses générateurs
est la clé de la classification des différents groupes d’isométries possibles, prouvée
à la question b) et dans le commentaire suivant.
© Avec les mêmes méthodes qu’à la question b), il est possible de traiter le
cas où Γ ne contient pas que des translations : il existe alors aussi un système
générateur de Γ contenant un ou deux éléments. Nous prouvons ce fait en détail
dans ce commentaire. Il est tout à fait possible pour les candidats à l’aise de
présenter cette preuve comme partie intégrante du développement quitte à passer
rapidement sur un certain nombre d’arguments classiques dans les questions a)
ou b). Le développement ainsi obtenu est de niveau FF.
Supposons donc que Γ un sous-groupe d’isométries de R2 discontinu et sans point
fixe ne contenant pas que des translations, et montrons qu’il existe un système
générateur de Γ de cardinal égal à 2.
On note tout d’abord que le sous-groupe Γ+ de Γ constitué des isométries directes
de Γ est d’indice 2 dans Γ. En effet, il ne peut pas être d’indice 1 car on a supposé
qu’il existe une isométrie indirecte dans Γ, autrement dit que Γ 6= Γ+ . De plus,
le morphisme ε : Γ → {−1, 1} qui à une isométrie de Γ associe son déterminant
(c’est-à-dire 1 si elle préserve l’orientation, −1 sinon) est surjectif dans un ensemble
de cardinal 2 et Γ+ = Ker(ε). Le premier théorème d’isomorphisme donne alors
247
44. Théorème de Killing-Hopf
• Soit 0 < Re(u) < 1, auquel cas t2Re(u) γ −1 ou t−2Re(u) γ est une réflexion
glissée dont la partie réelle de la composante de translation est dans ]0, 1[, ce
qui contredit l’hypothèse de minimalité du vecteur de translation de γ.
• Soit Re(u) = 1, auquel cas t−2Re(u) γ est de composante de translation nulle
et est donc une réflexion, contredisant le fait que Γ est sans point fixe.
• Soit Re(u) = 0, qui est donc le seul cas possible.
Ainsi, Γ+ /hγ 2 i est un groupe d’isométries composé de translations suivant l’axe
imaginaire. Par le même argument que dans la question b)(ii), il est donc engendré
par un unique élément t. On obtient alors Γ = ht, γi.
© Une idée importante et récurrente dans ce développement est l’argument de mi-
nimisation permettant de trouver des générateurs des groupes considérés. Il s’agit
d’une variante de l’argument classique permettant de prouver que les sous-groupes
discrets de R sont monogènes, i.e. de la forme aZ pour un certain a ∈ R. La
question b)(iii) en est un analogue en dimension 2, qui établit que les sous-groupes
discrets de R2 sont engendrés par au plus deux éléments, c’est-à-dire que ce sont
des réseaux (éventuellement à une seule dimension). Les candidats à l’aise sur ces
notions et sur les preuves sous-jacentes pourront bien évidemment supposer ces
deux résultats ou ne présenter que l’idée de la preuve sur un dessin.
© Il est possible de montrer que les surfaces euclidiennes (i.e. de courbure nulle)
connexes et complètes (i.e. où tout segment peut être prolongé en une droite
contenue dans la surface) sont les quotients du plan R2 par un sous-groupe
d’isométries Γ discontinu et sans point fixe. Ce développement détermine donc
les différentes familles de telles surfaces en étudiant les sous-groupes d’isométries
de R2 discontinus et sans point fixe. Ainsi, un problème de géométrie se réduit
à une étude précise des différentes actions de groupes possibles sur la surface-
modèle R2 . Il s’agit du point de vue moderne, apporté par Klein, sur la géométrie :
une notion de géométrie se définit par les mouvements possibles dans l’espace
considéré, autrement dit la géométrie est exactement réduite aux propriétés du
groupe d’isométries sous-jacent. Les résultats de la question b) et du premier
commentaire peuvent alors être reformulés comme une classification des surfaces
connexes et complètes de R2 , qui sont de la forme S = R2 /Γ, en fonction des
différentes possibilités pour les générateurs de Γ :
• soit Γ est trivial, et S est le plan euclidien ;
• soit Γ est engendré par une translation, et S est un cylindre ;
• soit Γ est engendré par une réflexion glissée, et S est un cylindre tordu (que
l’on peut aussi voir comme un ruban de Möbius infiniment large) ;
• soit Γ est engendré par deux translations, et S est un tore ;
• soit Γ est engendré par une réflexion glissée et une translation, et S est une
bouteille de Klein.
La classification en 5 classes des sous-groupes d’isométries en fonction de leurs
générateurs constitue le théorème de Killing-Hopf.
© Il est important de faire précisément la distinction entre un élément P d’un
quotient R2 /Γ (i.e. l’ensemble des classes d’éléments de R2 modulo l’action de Γ)
248
Formes quadratiques et géométrie
Ces cinq groupes correspondent à cinq réseaux, appelés les réseaux de Bravais
et donnant la structure du pavage. Un pavage du plan peut présenter moins de
symétries que celles données par le groupe de pavage, qui correspond aux symétries
du réseau de Bravais associé : Fedorov et Pólya ont ainsi prouvé qu’il n’y a que 17
pavages possibles du plan euclidien.
249
44. Théorème de Killing-Hopf
Questions.
1. Rappeler pourquoi un ensemble discret et compact est fini.
2. Montrer que si Γ agit de manière discontinue sur R2 , alors tout sous-groupe de
Γ agit également de manière discontinue.
3. Prouver qu’une isométrie de R2 fixant trois points non alignés est l’identité.
4. Montrer qu’un sous-groupe d’isométries de R2 discontinu et sans point fixe est
constitué uniquement de translations et de réflexions glissées.
5. Soient γ1 une translation de vecteur v 6= 0, et γ ∈
/ hγ1 i une translation de
m
vecteur parallèle à v. Notons m ∈ Z\{1} tel que γ1 γx minimise la distance à x.
Montrer que d(x, γ1m γx) < d(x, γ1 x).
6. Soit γ la réflexion glissée d’axe réel et de translation de vecteur (1, 0). En
notant tu la translation de vecteur u ∈ R2 ' C, montrer que γtu γ −1 = tū .
7. Pour tout u ∈ R2 , montrer que tu tū = t2Re(u) .
8. Montrer que si γ et γ 0 sont deux réflexions glissées Γ d’axes non parallèles,
alors leur composée est alors une rotation non triviale
9. Le produit d’un nombre pair de réflexions peut-il également être exprimé
comme le produit d’un nombre impair de réflexions ?
10. Montrer analytiquement et géométriquement que le carré d’une réflexion
glissée est une translation de vecteur double.
11. Tout sous-groupe discret d’isométries de R2 est-il engendré par au plus deux
éléments ?
12. Détailler l’adaptation de l’argument de la question b)(ii) pour montrer que,
dans le cas présenté en commentaire, on a Γ = ht, γi
250
Formes quadratiques et géométrie
Leçons concernées : 101, 104, 106, 108, 160, 161, 190, 191
251
45. Isométries directes des solides de Platon
Correction.
a) (i) Considérons le morphisme ε : G → {−1, 1} qui associe à une isométrie son
déterminant, autrement dit 1 si l’isométrie est directe et −1 sinon. Son noyau est
le sous-groupe G+ des isométries directes de G. Puisque {−1, 1} est de cardinal 2,
l’indice [G : G+ ] est égal à 1 ou 2.
(ii) Puisque G est un groupe fini, G+ est également fini. Notons m ∈ N∗ son
ordre. Comme les éléments de G+ sont des isométries directes, ce sont des rotations
car aucune translation de vecteur non nul ne peut appartenir à G+ . Un élément
de G+ est de plus d’ordre divisant m : il s’agit donc de la rotation d’angle 2kπ/m
pour un k ∈ J1, mK. Puisqu’il n’y a que m telles rotations, ce sont exactement
les éléments de G+ , qui est donc le groupe cyclique d’ordre m engendré par la
rotation r d’angle 2π/m.
(iii) Si G est réduit à des isométries directes, si bien que G est cyclique d’après
la question précédente.
Supposons désormais qu’il existe une isométrie indirecte h ∈ G\G+ . Il s’agit donc
d’une réflexion (par rapport à une droite vectorielle). De plus, les isométries rk
et rk h, où r est la rotation mentionnée précédemment et où 0 6 k < |G+ |, sont
des éléments de G tous distincts et sont au nombre de 2|G+ | = |G| : ce sont donc
exactement les éléments de G, qui est alors le groupe diédral d’ordre n.
Ainsi, soit G est composé d’isométries directes, auquel cas il est cyclique, soit il
contient des isométries indirectes, auquel cas il est diédral.
b) (i) Le groupe G ne contient aucune translation de vecteur non nul ni de
réflexion glissée donc les isométries constituant G sont des rotations et possèdent
donc chacune un axe. Chacun de ces axes coupe la sphère unité en deux points,
appelés pôles de la rotation (voir Figure 1). L’ensemble Ω est donc exactement
l’ensemble des pôles des rotations de G.
Figure 1.18 – Axe d’une rotation r et ses deux pôles sur la sphère unité.
252
Formes quadratiques et géométrie
On a donc
k
X
2(n − 1) = (n − |Ωi |)
i=1
d’où, en divisant par n, l’identité fondamentale
k
2 X 1
2− = 1− . (1)
n i=1 si
(ii) Puisque chaque élément de Ω est fixé par une rotation non triviale de G
(par définition de Ω) et par l’identité, on en déduit que les stabilisateurs des u ∈ Ω
sont de cardinal supérieur à 2, c’est-à-dire que les si sont supérieurs à 2. On en
tire en particulier que 1 − s−1
i > 1/2 pour tout i ∈ J1, kK. L’identité (1) implique
alors
k
2 X 1 k
2>2− = 1− > ,
n i=1 si 2
ce qui implique que k ∈ {1, 2, 3}.
Il est par ailleurs immédiat de voir que l’équation (1) n’a pas de solution dans le
cas où k = 1. On en déduit que k ∈ {2, 3}.
c) (i) Supposons que k = 2. Alors l’identité (1) donne
2 1 1 2
2− =2− − 62− ,
n s1 s2 s1
de sorte que s1 > n. Comme par ailleurs s1 6 s2 6 n, on a nécessairement
s1 = s2 = n et donc |Ω1 | = |Ω2 | = 1. Cela prouve que Ω (qui est Ω1 ∪ Ω2 ) est
constitué de deux vecteurs unitaires. Ces vecteurs sont nécessairement opposés,
car Ω est stable par l’application x 7→ −x (rappelons que ce sont les intersections
des axes de rotation avec la sphère unité) ; on les note donc x1 = u et x2 = −u.
Par ailleurs, comme les stabilisateurs de u et −u sont de cardinal n, tous les
éléments de G stabilisent u et −u, donc tous sont des rotations d’axe Vect(u).
Le groupe d’isométries de R2 formé par les restrictions des isométries de G au
plan Vect(u)⊥ est alors un groupe fini d’isométries directes du plan, qui est donc
cyclique d’après la question a)(ii).
Ainsi, G est le groupe des rotations de R3 d’un polygone régulier dans le plan
orthogonal à Vect(u).
253
45. Isométries directes des solides de Platon
254
Formes quadratiques et géométrie
x1
g 2 (u)
u
g(u)
Commentaires.
© Les arguments mobilisés dans ce développement reposent sur des relations de
comptage telles que la formule obtenue à la question c). Lors de la présentation
au tableau, une fois la stratégie de la preuve expliquée, il est tout à fait possible
d’escamoter quelques détails de calcul de sorte à ajuster le temps disponible
ou à insister sur les points que l’on estime cruciaux. Toutefois, il est important
que certains des passages techniques soient présentés dans le détail de sorte à
convaincre les examinateurs, et il est bien sûr important de savoir compléter
l’argument au besoin. Plus de précisions sont fournies dans [Arm88], d’où a été
tiré ce développement.
Nous proposons par exemple de présenter les questions a) et b) pour un dévelop-
pement très élémentaire, de niveau F. Les questions b) ainsi que c)(i), concluant
à l’existence d’un nombre fini de types de groupes finis d’isométries et donnant
leur description dans le cas des groupes de rotations, est une belle illustration
de la combinatoire mise au service de la théorie des groupes et constitue égale-
ment un développement de niveau F. Le traitement plus géométrique des solides
platoniciens, donné par la question c), peut être présenté en se réduisant aux
groupes diédraux (cas s2 = 2) et à l’un des solides platoniciens (cas s2 = 3, le plus
simple étant alors le tétraèdre, correspondant à s1 = 4). Le développement obtenu
est alors de niveau FF. Pour illustrer des arguments plutôt géométriques, il est
possible d’admettre l’identité fondamentale (1) en donnant l’idée principale de sa
preuve, puis se concentrer sur la description des solides platoniciens détaillée à la
question c).
255
45. Isométries directes des solides de Platon
© Les deux autres cas pour s1 dans la question c)(iv) se traitent de la même
manière, en exploitant la relation (3). On obtient les trois situations suivantes
(voir commentaires ci-après pour leur description géométrique) :
Traitons les deux cas restants, que le candidat pourra tout à fait substituer lors
de sa présentation à celui du tétraèdre détaillé dans la correction.
• Supposons que s1 = 4, s2 = 3 et s3 = 2. On obtient par l’équation (1) que
n = 24. L’orbite Ω1 est alors composée de n/s1 = 6 éléments. Notons g un
générateur de Gx1 ; il est d’ordre 4. Soit u un élément de Ω1 distinct de ±x1 .
L’orbite Ω1 contient donc x1 , u, g(u), g 2 (u) et g 3 (u). Puisque cette orbite est de
cardinal 6, il reste un seul élément à déterminer ; on le note y. L’élément g(y)
est alors distinct de x1 (qui est fixe) et des g k (u) (sinon y serait parmi eux).
Nécessairement y est fixe par g, il s’agit donc de l’autre pôle de g, à savoir −x1 .
L’orbite Ω1 sous l’action de G est donc formée des éléments x1 , −x1 , u, g(u), g 2 (u)
et g 3 (u). Puisque g est une isométrie fixant x1 , les vecteurs unitaires distincts
u, g(u), g 2 (u) et g 3 (u) sont équidistants de x1 et forment un carré. On obtient de
la même manière, en notant que nécessairement g 2 (u) = −u, que les éléments
x1 , g(u), −x1 , g 3 (u) forment un carré dans le plan orthogonal à Vect (u), en consi-
dérant un générateur de Gu . Ainsi, les points de Ω1 sont les sommets d’un octaèdre
régulier.
x1
g 3 (u)
g 2 (u)
g(u)
−x1
256
Formes quadratiques et géométrie
On aurait pu raisonner de même avec les autres orbites : l’orbite Ω2 , peut être
interprétée comme les centres des faces de l’octaèdre (ou, de manière équivalente,
des sommets d’un cube) ; l’orbite Ω3 peut être interprétée comme les centres des
arêtes de l’octaèdre (ou du cube). On retrouve ici que l’octaèdre et le cube sont
des solides duaux.
• Supposons que s1 = 5, s2 = 3 et s3 = 2. On obtient par l’équation (1) que
n = 60. L’orbite Ω1 est alors composée de n/s1 = 12 éléments. Notons g un
générateur de Gx1 . Soient u, v des éléments de Ω1 qui ne sont ni fixes ni dans
la même orbite sous l’action de Gx1 . Ainsi, Ω1 est formé de l’élément x1 ainsi
que u, g(u), g 2 (u), g 3 (u), g 4 (u) et v, g(v), g 2 (v), g 3 (v), g 4 (v). Puisque Ω1 est de
cardinal 12, il reste un seul élément à déterminer. Comme précédemment, celui-ci
est nécessairement fixe par g, il s’agit donc de −x1 . Quitte à permuter x1 et −x1 ,
on peut supposer que u et v vérifient 0 < |x1 − u| < |x1 − v| < 2. En effet, si ce
n’était pas le cas, tous ces points seraient sur un plan orthogonal à l’axe Vect (x1 ),
et Gx1 serait alors d’ordre 10, contrairement à l’hypothèse.
Puisque g est une isométrie, les éléments u, g(u), g 2 (u), g 3 (u), g 4 (u) forment un
pentagone régulier, et il en va de même pour les éléments v, g(v), g 2 (v), g 3 (v), g 4 (v).
En usant du même argument sur d’autres axes, on constate comme précédemment
que les points de Ω1 sont les sommets d’un icosaèdre régulier.
x1
g(u)
−x1
257
45. Isométries directes des solides de Platon
258
Formes quadratiques et géométrie
Questions.
1. Montrer que l’ensemble des pôles Ω est fini.
2. Justifier l’égalité |Gxi | = n/|Ωi | pour tout i ∈ J1, kK.
3. Rappeler pourquoi tous les éléments d’une même orbite sous l’action d’un
groupe ont des stabilisateurs de même cardinal.
4. Justifier que les si sont entiers.
5. Montrer qu’une rotation non triviale fixe exactement deux vecteurs unitaires.
6. Montrer que l’orthogonal d’un sous-espace vectoriel stable par une isométrie
l’est aussi.
7. Justifier que les stabilisateurs considérés à la question c)(iii)-(v) sont cycliques.
8. Justifier dans les différents cas de la question c) que si g est une rotation non
triviale d’ordre m et d’axe Vect (x1 ), et si u est unitaire et distinct de ±x1 , alors
les g k (u), pour k ∈ J1, m − 1K, sont deux à deux distincts.
9. Dans le cas de l’octaèdre décrit en commentaire, justifier que g 2 (u) = −u.
Indication : les isométries préservent les relations d’adjacence dans l’octaèdre.
10. Dans le cas de l’icosaèdre, montrer que les éléments u, g(u), g 2 (u), g 3 (u), g 4 (u)
et v, g(v), g 2 (v), g 3 (v), g 4 (v) sont deux à deux distincts.
11. Montrer que les groupes de symétrie de ces solides sont le groupe alterné A4
dans le cas du tétraèdre, S4 dans les cas du cube et de l’octaèdre, et A5 dans les
cas de l’icosaèdre et du dodécaèdre.
12. Détailler l’argument de la question c)(i) permettant de se ramener à un plan.
Indication : remarquer que les rotations de G commutent et conclure qu’elles sont
cotrigonalisables. Utiliser alors le fait que ce sont des isométries pour conclure
que le plan orthogonal à une droite propre commune est stable.
13. Montrer qu’une isométrie laissant globalement invariant un polyèdre permute
ses sommets.
14. Montrer que la restriction d’une isométrie directe à un sous-espace stable est
une isométrie directe. Que dire dans le cas d’isométries indirectes ?
15. Montrer que les résultats énoncés sont encore valables si l’on considère des
isométries affines et non plus vectorielles.
Indication : on pourra commencer par considérer le centroïde de G défini par,
pour un x ∈ Rk ,
1 X
c= g(x),
n g∈G
259
46. Théorème d’Hermite
Soit n > 1. Soit une matrice symétrique réelle définie-positive S ∈ Sn++ (R).
Pour un vecteur x de Rn identifié à une matrice colonne de Mn,1 (R), on note
S[x] = t xSx ∈ R+ l’image de x par la forme quadratique associée à S.
a) Justifier que le minimum µ(S) de S sur Zn \{0} existe.
b) Justifier qu’un point x ∈ Zn pour lequel ce minimum est atteint est primitif,
c’est-à-dire que le pgcd de ses entrées vaut 1.
c) On dit que S et T sont congruentes s’il existe une matrice U ∈ GLn (Z)
telle que S = t U T U . Si S et T sont congruentes, montrer que µ(S) = µ(T ).
d) Conclure au théorème d’Hermite :
Correction.
a) Puisque S est symétrique réelle, elle est diagonalisable par le théorème spectral.
Il existe donc une matrice orthogonale P ∈ On (R) telle que
P −1 SP = diag(λ1 , . . . , λn ),
où λ1 6 · · · 6 λn sont les valeurs propres de S. Puisque S est définie-positive, ces
valeurs propres sont strictement positives. On a alors, pour tout x ∈ Rn ,
S[x] > λ1 t xx. (1)
En fixant un x0 ∈ Zn non nul, l’ensemble X = {x ∈ Zn \{0} : S[x] 6 S[x0 ]} est
non vide (car il contient x0 ) et borné (car inclus dans la boule de centre zéro et
de rayon (S[x0 ]/λ1 )1/2 par l’inégalité (1)). Puisque Zn est discret, X est donc fini,
et il existe donc un point x1 ∈ Zn \{0} tel que S[x1 ] est minimal sur X.
On a ainsi que S[x1 ] 6 S[x] pour tout x ∈ X. De plus, par définition de X, pour
tout élément Zn \{0} hors de X, on a S[x] > S[x0 ] > S[x1 ]. On en déduit que
S[x1 ] 6 S[x] pour tout x ∈ Z\{0}. Ainsi, le minimum µ(S) de S sur Zn \{0} existe
bien.
b) S’il existait un diviseur commun non trivial q > 2 des entrées de x, on pourrait
factoriser x sous la forme qy où y est entier. On aurait alors S[y] < q 2 S[y] = S[x]
et y non nul, contrairement à la minimalité de S[x]. Ainsi, x est nécessairement
un vecteur primitif de Zn .
260
Formes quadratiques et géométrie
c) Par définition des matrices congruentes, il existe une matrice U ∈ GLn (Z) telle
que S = t U T U . Soit x ∈ Zn tel que µ(S) = S[x], qui existe par la question a).
On a
S 0 [x] = W [z],
261
46. Théorème d’Hermite
• Ainsi, puisque W est une matrice symétrique réelle définie-positive qui est
de taille n − 1, on peut lui appliquer l’hypothèse de récurrence : il existe une
constante cn−1 > 0 tel que pour tout z ∈ Zn−1 ,
W [z] 6 cn−1 det(W )1/(n−1) . (3)
Il existe donc un z ∈ Zn−1 tel que W [z] = µ(W ) soit minimal. Soit alors un
élément x1 ∈ Z tel que
1 1
− 6 x1 + s−1 · t yz 6 , (4)
2 2
ce qui est possible puisque l’intervalle [−1/2, 1/2] est de longueur un. Ainsi,
par l’identité (2) et les majorations (3) et (4), on obtient
µ(S) 6 S[x] = (x1 + s−1 · t yz)2 µ(S) + W [z]
1
6 µ(S) + µ(W )
4
1
6 µ(S) + cn−1 det(W )1/(n−1) .
4
En utilisant le fait que det(W ) = det(S)/s = det(S)/µ(S), on en déduit
n−1
4
n
µ(S) 6 cn−1 det(S)1/n ,
3
ce qui prouve la propriété de récurrence au rang n.
Cela conclut la récurrence et la preuve.
Commentaires.
© Le problème de minimiser une forme quadratique donnée est très présent en
mathématiques. En physique ou en analyse harmonique, les formes quadratiques
surviennent naturellement comme des normes de type L2 , autrement dit des fonc-
tionnelles d’énergie. Le théorème d’Hermite permet, au moins pour les problèmes
théoriques, de donner une borne en fonction du déterminant de la forme quadra-
tique dans le cas de la dimension finie. C’est en pratique un résultat souhaitable,
puisque l’optimisation est un problème difficile en général et souvent instable
numériquement, alors que le calcul d’un déterminant ne souffre pas du même
problème d’instabilité et est calculable algorithmiquement.
© La preuve implique que cn = (4/3)(n−1)/2 convient pour tout n. La valeur
optimale de cn demeure toutefois inconnue. On a p prouvé que c1 = 1 lors de
l’initialisation de la récurrence. Prouvons que c2 = 4/3. Considérons la forme
quadratique x2 + xy + y 2 et S la matrice symétrique associée. On a alors la
minoration S[x, y] > 1 = S[1, 0] pour tous x et y non simultanément nuls, de sorte
que µ(S) = 1. Puisque det(S) = 3/4, on obtient le résultat.
Le théorème de Minkowski pour les réseaux (voir Développement 89) permet de
déduire une meilleure borne que la précédente sur cn , à savoir
2/n
4 n
cn 6 Γ +1 . (5)
π 2
262
Formes quadratiques et géométrie
Questions.
1. Vérifier la relation (2) en utilisant la décomposition de S.
2. Écrire explicitement un x1 ∈ Z satisfaisant l’encadrement (4).
3. Parmi les matrices à coefficients entiers de GLn (R), caractériser celles qui sont
dans GLn (Z).
4. Compléter l’argumentation de la question d) : montrer que si x est un vecteur
primitif, il peut être complété en une matrice de GLn (Z).
5. Montrer que la majoration obtenue en (5) est meilleure asymptotiquement que
la majoration donnée par la preuve cn 6 (4/3)(n−1)/2 .
6. Soit S ∈ Sn+ (R). Montrer que S admet une unique racine carrée, autrement dit
qu’il existe une unique T ∈ Sn+ (R) telle que S = R2 .
7. Soit A ∈ Sn++ (R). Déduire de l’exercice précédent que la forme quadratique
donnée par x 7→ t xAx + t bx + c admet son minimum en
1
x = − A−1 b.
2
8. Soit q une forme quadratique sur un espace vectoriel E. Montrer que pour tout
x, y ∈ E, on a l’identité du parallélogramme
263
47. Formes quadratiques semi-réduites
Soit n > 2. Pour une matrice symétrique S ∈ Sn (R), on note S = (sij )i,j∈J1,nK
ses coefficients et en particulier s1 , . . . , sn ses coefficients diagonaux. Pour tout
vecteur x ∈ Rn , on pose S[x] = t xSx l’image de x par la forme quadratique
associée à S. On définit les propriétés
(I) s1 > 0 ;
(II) pour tout k ∈ J1, nK et pour tout vecteur entier w = (wi )i∈J1,nK ∈ Zn
tels que pgcd(wk , . . . , wn ) = 1, on a S[w] > sk .
a) Soit S ∈ Sn (R) qui vérifie (II).
(i) Montrer que s1 6 · · · 6 sn .
(ii) Montrer que pour tous k, ` ∈ J1, nK, avec k < `, on a
−sk 6 2sk` 6 sk .
(iii) Montrer qu’un vecteur x ∈ Zn \{0} minimisant S sur Zn \{0} est tel
que pgcd(w1 , . . . , wn ) = 1. Un tel vecteur est qualifié de primitif.
b) Soit S ∈ Sn (R) vérifiant (II).
(i) Montrer que S est de la forme par blocs
!
0 0
S=
0 S0
où, pour un certain k ∈ J1, nK, la matrice S 0 ∈ Sk (R) vérifie (II) et que
sa première entrée est non nulle.
(ii) Prouver le résultat suivant pour S ∈ Sn (R) :
• Si S vérifie (II) alors elle est positive.
• Si S vérifie (I) et (II) alors elle est définie-positive.
264
Formes quadratiques et géométrie
Correction.
a) (i) Pour k ∈ J1, nK, un vecteur w = (wi )i∈J1,nK ∈ Zn est dit k-admissible si le
pgcd de (wk , . . . , wn ) vaut 1. Pour tout k ∈ J1, n − 1K, le vecteur ek+1 ∈ Zn de la
base canonique, donné par des entrées nulles sauf la (k + 1)-ième qui vaut 1, est
k-admissible. Il vient alors, par la condition (II) que pour tout k ∈ J1, k − 1K
s1 6 s2 6 · · · 6 sn .
(ii) Soient k, ` ∈ J1, nK avec k < `. Soit u = (ui )i∈J1,nK ∈ Zn un vecteur entier
tel que uk = 1, u` = 1 et les autres entrées sont nulles. Alors u est `-admissible et
on obtient alors par la condition (II) que
−sk 6 2sk` 6 sk .
où S1 ∈ Mn−1 (R). Montrons que S1 vérifie la propriété (II). Pour k ∈ J1, n − 1K,
si w0 = (w10 , . . . , wn−1
0 ) est un vecteur k-admissible de Zn−1 alors le vecteur
w = (w1 , . . . , wn ) := (0, w10 , . . . , wn−1
0 ) ∈ Zn défini en ajoutant une entrée nulle
0
à w est un vecteur (k + 1)-admissible de Zn . En effet, à cause du changement
d’indices on a
La forme par blocs ci-avant prouve alors que S1 [w0 ] = S[w]. Puisque S vérifie la
propriété (II), on en déduit que S[w] > sk+1 , et donc S1 [w0 ] > sk+1 pour tout
265
47. Formes quadratiques semi-réduites
Par l’hypothèse (II) pour S, on a S[w] > wk , de sorte qu’on obtient S1 [w0 ] > wk .
Cela établit la propriété (II) pour la matrice S1 . Par hypothèse de récurrence, S1
est donc symétrique définie-positive.
Introduisons désormais la notation x = (y, z) ∈ Mn,1 (R) avec y ∈ Mn−1,1 (R)
ainsi que z ∈ R. Alors la décomposition ci-avant permet d’écrire
266
Formes quadratiques et géométrie
Prouvons que sn − t qS1−1 q > 0. Notons qu’on a sn > s1 > 0 par la question a)(i).
Supposons l’inverse, i.e. que sn 6 t qS1−1 q. Alors pour tout ε > 0 et x = (y, z) non
nul, on a h i
S[x] 6 S1 y + S1−1 qz + εz 2 .
La forme quadratique du membre de droite est une forme quadratique sur Rn , posi-
tive et de déterminant det(S1 )ε. Par l’inégalité d’Hermite (voir Développement 46),
il existe donc une constante cn > 0 telle que
h i
S1 y + S1−1 qz + εz 2 6 cn det(S1 )1/n ε1/n .
Commentaires.
© Une matrice vérifiant les propriétés (I) et (II) est dite semi-réduite.
© On peut prouver que dans toute classe de congruence de matrice positive il existe
une matrice semi-réduite, donnant un résultat de réduction a priori plus faible que
celui donné par le théorème spectral. Toutefois, il trouve toute sa puissance dans
les applications arithmétiques, car les matrices de passage peuvent être supposées
unimodulaires, c’est-à-dire dans GLn (Z). Cela motive l’étude autonome de ces
objets, ce qui est réalisé en partie dans ce développement. On peut aussi consulter
le théorème de Minkowski (voir Développement 89).
Questions.
1. Montrer que si S vérifie (II), alors la matrice S 0 vérifie (I) et (II).
h i
2. Montrer que la forme quadratique S1 y + S1−1 qz + εz 2 de la question b)(ii)
admet un vecteur minimisant sa valeur sur Zn \{0}.
3. Établir l’égalité (2).
h i
4. Montrer que la forme quadratique S1 y + S1−1 qz + εz 2 est de déterminant
égal à det(S1 )ε.
Indication : on pourra s’inspirer de (1).
267
48. Théorème de Minkowski pour les formes quadratiques
Il existe une constante cn > 0 telle que pour toute matrice positive
semi-réduite S ∈ Sn (R), on a
s1 · · · sn
16 6 cn .
|S|
268
Formes quadratiques et géométrie
−1 −1
où ` = sn − t ySn−1 y 6 sn car Sn−1 est positive.
(iii) Raisonnons par récurrence sur la dimension n > 1. Le cas n = 1 est
immédiat : si S = (s) ∈ S1 (R) avec s > 0, alors |S| = s 6 s. Supposons la
propriété vraie au rang n − 1 pour un n > 2 et prouvons la propriété de récurrence
au rang n. Soit une matrice S ∈ Sn (R).
En utilisant la décomposition (2) prouvée à la question précédente, la matrice Sn−1
est définie positive, de sorte que l’hypothèse de récurrence garantit que toutes
les matrices extraites de Sn−1 en prenant les r premières lignes et colonnes,
1 6 r 6 n − 1, sont définies positives. De plus, |S| = |Sn−1 |` par l’égalité (2). Par
l’hypothèse de récurrence, il vient alors
|S| 6 s1 · · · sn−1 ` 6 s1 · · · sn .
ou
s2 sn
,..., < γ.
s1 sn−1
• Supposons que le second cas est réalisé. On a alors, en multipliant les fractions
de manière télescopique, que sr /s1 < γ r−1 pour tout r ∈ J2, nK. On en tire alors
s1 · · · sn n(n−1)
n <γ 2 .
s1
269
48. Théorème de Minkowski pour les formes quadratiques
Or on peut écrire
s1 · · · sn s1 · · · sn sn1
= · .
|S| sn1 |S|
L’inégalité d’Hermite (rappelée en commentaire, voir également le Développe-
ment 46) assure qu’il existe une constante Cn > 0 telle que s1 6 Cn |S|1/n .
Cela permet alors de conclure car on obtient, en combinant les deux inégalités
précédentes,
s1 · · · sn n(n−1)
< Cn γ 2 .
|S|
• Supposons que le premier cas est réalisé pour un certain k ∈ J2, nK. On note la
forme quadratique associée S[x] = t xSx pour toute matrice S ∈ Sn (R) et tout
vecteur x ∈ Rn . On écrit la matrice S sous la forme
!
Sk−1 Q
S= tQ (4)
R
−1
Notons T = R − t QSk−1 Q. On reconnaît dans l’écriture (4) une décomposition
−1
diagonale par blocs : en notant y 0 = y + Sk−1 Qz, on constate en effet que (5) se
réécrit alors sous la forme S[x] = diag(Sk−1 , T )[y 0 , z]. On en déduit la relation
entre les déterminants |T | = |S|/|Sk−1 |.
−1
Notons que T est définie-positive. En effet, en prenant y = −Sk−1 Qz dans (5) on
obtient que, pour tout z ∈ R n−k+1 ,
T [z] > 0.
−1
Notons w = y + Sk−1 Qz ∈ Rk−1 où y ∈ Rk−1 est un vecteur entier tel que les
composantes wi , pour i ∈ J1, k − 1K, de w soient dans [−1/2, 1/2]. Par le choix
de z fait précédemment, x = (y, z) est un vecteur entier dont les composantes
d’indices k, . . . , n sont premières entre elles. Ainsi, par la propriété (II), on a
sk 6 S[x].
270
Formes quadratiques et géométrie
Or Sk−1 = (sij )i,j∈J1,k−1K est semi-réduite, on peut alors utiliser 11 les deux
propriétés suivantes :
• on a les inégalités s1 6 · · · 6 sk−1 ;
• pour tous r, ` ∈ J1, k − 1K avec ` < r, on a 2|sr` | 6 s` .
Notons que la matrice S est symétrique de sorte que sr` = s`r pour tous les
indices r, ` ∈ J1, k − 1K. La seconde propriété ci-avant donne 2|sr` | 6 smin(r,`) pour
tout r = 6 `, et par la première propriété cette quantité est toujours inférieure
à sk−1 . En utilisant de plus la borne des coefficients |wi | 6 1/2 pour i ∈ J1, k − 1K,
k−1
X 1 k−1
X
Sk−1 [w] = sij wi wj 6 |sij |
i,j=1
4 i,j=1
k−1 k−1
11
X X
6 sk−1 + sk−1
4 2 i,j=1 i=1
i6=j
(k − 1)(k − 2) + 2(k − 1)
6 sk−1
8
k(k − 1)
6 sk−1 .
8
k(k − 1) 4 1
Sk−1 [w] 6 · sk 6 sk .
8 n(n − 1) 2
Rappelons que sk 6 S[x] = Sk−1 [y] + T [z] 6 12 sk + T [z]. Par la borne (6) on en
déduit que
|S| 1/(n−k+1)
sk 6 2Cn−k+1 . (7)
|Sk−1 |
En écrivant la décomposition
271
48. Théorème de Minkowski pour les formes quadratiques
Commentaires.
© Le développement repose sur l’utilisation de l’inégalité d’Hermite, présentée
dans le Développement 46, qui s’énonce comme suit :
Il existe une constante Cn > 0 telle que pour toute matrice symétrique
réelle définie-positive S ∈ Mn (R), on a
t
min xSx 6 Cn |S|1/n .
x∈Zn \{0}
© Il faut garder en tête que les matrices symétriques et les formes quadratiques
en dimension finie sont les mêmes objets. Ainsi, les résultats généraux gagnent
souvent à être prouvés par récurrence, sans pertre de vue l’interprétation des
décompositions matricielles en termes de formes, quadratiques : en effet, la symétrie
est une propriété qui se transmet aux sous-blocs diagonaux.
© La preuve du résultat énoncé en question a) ainsi que sa réciproque mentionnée
dans les exercices, peut faire l’objet d’un développement très élémentaire.
Questions.
1. Trouver la valeur optimale pour la constante c2 ?
Indication : considérer une forme quadratique semi-réduite générique de la forme
ax2 + 2bxy + cy 2 sur R2 , puis calculer le déterminant. Vérifier l’optimalité de la
constante avec la forme quadratique x2 + xy + y 2 .
2. Montrer que si toutes les matrices extraites de S ∈ Sn (R) obtenues en ne
conservant que les r premières lignes et colonnes, 1 6 r 6 n, sont définies-positives,
alors il en va de même pour S.
3. Montrer que si S ∈ Sn (R) est définie-positive est écrite sous la forme
!
S1 Y
S= tY S2
272
Développements d’analyse
Analyse fonctionnelle et topologie
Les espaces de Hilbert sont le bon cadre pour faire de la géométrie euclidienne
dans des espaces de dimension infinie. Ce développement illustre la particularité
géométrique de ces espaces (205, 213), dans lesquels l’existence de systèmes
orthonormaux complets, ou familles totales, donnent une importance particulière
aux approximations par densité. Si de nombreux résultats d’algèbre linéaire et
de topologie ne demeurent plus en dimension infinie, la structure des espaces de
Hilbert séparables permet de remplacer l’existence des décompositions selon une
base par un développement en série selon une famille totale. En particulier, cela
permet ici de caractériser les ensembles compacts (203) en termes de convergence
uniforme des restes des décompositions en séries selon une famille totale.
Correction.
a) Soit (ek )k∈N une famille orthonormale complète de H. Considérons (un )n∈N
une suite de H convergeant vers une limite u. Par l’inégalité de Bessel on a, pour
tout u ∈ H, X
|hu, ek i|2 6 kuk2 .
k>0
277
49. Compacts d’un espace de Hilbert séparable
kP un k 6 kP uk + kP un − P uk
X ε
6 |hu, ek i|2 +
k>N
2
1
6 ε.
Alors la suite (up )p∈N est une suite du compact K, de sorte qu’elle admet une
sous-suite convergente dans K, que nous pouvons noter (uϕ(p) )p∈N . Par la question
précédente, cela implique qu’elle admet des restes uniformément petits, autrement
dit X
∃N ∈ N, ∀p ∈ N, |huϕ(p) , ek i|2 6 ε.
k>N
En particulier, pour p tel que ϕ(p) > N , l’inégalité (2) n’est pas vérifiée. Ainsi, un
compact de H est un fermé, borné et satisfait la condition des restes uniformément
petits.
c) Soit K un ensemble fermé, borné et satisfaisant la condition des restes uni-
formément petits pour tout système orthonormé complet (ek )k∈N de H. On veut
prouver que K est compact. Soit (un )n∈N une suite de K. Il suffit de prouver
qu’elle admet une sous-suite convergente. Par complétude de H et puisque K est
fermé, il suffit de prouver que (un )n∈N admet une sous-suite de Cauchy.
Pour tout k > 1, la suite (hun , ek i)n∈N est une suite bornée de C. En effet, par
l’inégalité de Cauchy-Schwarz, on a |hun , ek i| 6 kun k qui est donc borné car K est
borné. Par le théorème de Bolzano-Weierstrass, la suite (hun , ek i)n∈N admet donc
une sous-suite convergente. Nous allons construire par récurrence une sous-suite
de (un )n∈N telle que les suites (hun , ek i)n∈N sont convergentes pour tout k ∈ N.
278
Analyse fonctionnelle et topologie
• La suite (hun , e1 i)n∈N est bornée, donc par compacité existe une sous-suite
(uϕ1 (n) )n∈N de (un )n∈N telle que (huϕ1 (n) , e1 i)n∈N converge.
• La suite (huϕ1 (n) , e2 i)n∈N est bornée, il existe donc une sous-suite (uϕ2 (n) )n∈N
de (uϕ1 (n) )n∈N telle que (huϕ2 (n) , e1 i)n∈N et (huϕ2 (n) , e2 i)n∈N convergent.
• En itérant le procédé, pour tout k > 1, on obtient ainsi une sous-suite (uϕk (n))n
de (un )n telle que (huϕk (n) , ei i)n converge pour tout i 6 k.
Considérons alors la suite diagonalement extraite vn = uϕn (n) de (un )n . Pour
tout k > 0, la suite (hvn , ek i)n converge puisqu’il s’agit d’une suite extraite à partir
d’un certain rang — à savoir k — de la suite (huϕk (n) , ek i)n qui est convergente
par construction.
Prouvons que la suite (vn )n est de Cauchy. Soit ε > 0. Considérons N ∈ N tel
que, pour tous n, ` > 0,
X ε2 X ε2
2 |hvn , ek i|2 6 et 2 |hvn+` , ek i|2 6 ,
k>N
3 k>N
3
ce qui est possible par la propriété des restes uniformément petits. De plus, pour
tout n ∈ N suffisamment grand on a, pour tout ` > 0,
X ε2
|hvn − vn+` , ek i|2 6 ,
k6N
3N
puisque les suites (hvn , ek i)n , pour k 6 N , sont convergentes donc de Cauchy et
en nombre fini. L’inégalité du parallélogramme donne alors, pour n suffisamment
grand et pour tout ` > 0,
X X
kvn − vn+` k2 = |hvn − vn+` , ek i|2 + |hvn − vn+` , ek i|2
k6N k>N
X X X
2
6 |hvn − vn+` , ek i| + 2 |hvn , ek i|2 + 2 |hvn+` , ek i|2
k6N k>N k>N
2
6ε .
Ainsi on obtient, pour tout n suffisamment grand,
∀` > 0, kvn − vn+` k 6 ε.
Ainsi la suite (vn )n est une sous-suite de Cauchy de (un )n , donc une sous-suite
convergente de H par complétude. Ainsi, K est compact.
Commentaires.
© Dans tout espace métrique, un compact est nécessairement fermé et borné, cela
demeure en particulier dans le cadre des espaces de Hilbert. Le théorème de Heine-
Borel donne une réciproque dans le cas des espaces vectoriels de dimension finie
sur R ou C. De plus, dans ce cadre des espaces de dimension finie, la convergence
d’une suite est équivalence à la convergence de la suite de ses composantes. Ces
propriétés tombent toutes en défaut en dimension infinie, et il est nécessaire
d’ajouter des propriétés supplémentaires aux caractères fermé et borné pour
assurer la compacité, ainsi que l’illustre ce développement.
279
49. Compacts d’un espace de Hilbert séparable
muni de la norme
+∞
X
k(un )n k2 = |un |2 .
n=0
Il existe une caractérisation des compacts valable pour tous les espaces de Hilbert,
généralisant le résultat prouvé dans ce développement :
Soit H un espace de Hilbert. Un ensemble K ⊂ H est compact si,
et seulement si, il est fermé, borné, et pour tout ε > 0 il existe un
sous-espace W de dimension finie de H tel que
Questions.
1. Montrer que la projection orthogonale P de H est continue.
2. Montrer que dans un espace métrique, l’ensemble des éléments d’une suite
convergente ainsi que sa limite forment un ensemble compact.
3. Donner une preuve de l’identité du parallélogramme :
4. Montrer qu’un espace vectoriel normé est préhilbertien si, et seulement si, sa
norme vérifie l’identité du parallélogramme (théorème de Fréchet-von Neumann-
Jordan).
280
Analyse fonctionnelle et topologie
Correction.
a) Supposons que K est un opérateur compact, de sorte que K(B(0, 1)) est
relativement compacte, c’est-à-dire d’adhérence compacte. Cela est équivalent
à être inclus dans un compact de H. En particulier (voir les commentaires ci-
après ou le Développement 49), l’image K(B(0, 1)) vérifie la propriété des restes
uniformément petits : pour toute famille totale (ek )k∈N de H et tout ε > 0, il
existe un entier N ∈ N tel que pour tout u ∈ B(0, 1) on a
X
|hK(u), ek i|2 6 ε2 . (1)
k>N
Les Kn sont des opérateurs linéaires de rang fini car, quel que soit n ∈ N, l’image
de Kn est contenue dans l’espace engendré par les ek pour k 6 n. Puisque (ek )k∈N
est un système orthogonal on a, par la propriété (1) des restes uniformément
petits, pour tout u ∈ B(0, 1) et tout n > N ,
X X
kK(u) − Kn (u)k2 = |hK(u), ek i|2 6 |hK(u), ek i|2 6 ε2 .
k>n k>N
281
50. Opérateurs compacts d’un espace de Hilbert
b) Soit (Kn )n∈N une suite d’opérateurs de rang fini convergeant vers K. Il faut
prouver que K est un opérateur compact, autrement dit que K(B(0, 1)) est
relativement compacte. Puisque K est un opérateur borné par hypothèse, on a
en particulier K(B(0, 1)) est borné et il en va donc de même pour son adhérence,
qui est également fermée. Par la caractérisation des compacts dans les espaces
de Hilbert séparables (voir Développement 49), pour montrer que K(B(0, 1)) est
compact il suffit de prouver qu’il satisfait la propriété des restes uniformément
petits, autrement dit que pour toute famille orthonormale complète (ek )k∈N et
pour tout ε > 0, il existe N ∈ N tel que pour tout u ∈ B(0, 1),
X
|hK(u), ek i|2 6 ε. (2)
k>N
Alors kPN k = 1 pour tout N > 0 puisque H est de dimension infinie. Soit ε > 0.
On cherche N ∈ N tel que si u ∈ B(0, 1), alors l’inégalité (2) est vérifiée ; autrement
dit tel que la borne kPN (K(u))k 6 ε est vérifiée pour tout u ∈ B(0, 1). Or on a
par l’inégalité triangulaire, pour tout n,
Commentaires.
© On a prouvé la caractérisation suivante des opérateurs compacts d’un espace
de Hilbert séparable :
Soit H un espace de Hilbert séparable. Un opérateur linéaire borné
K ∈ B(H) est compact si, et seulement si, il est limite d’une suite
d’opérateurs de rang fini.
Autrement dit, l’ensemble des opérateurs compacts est la fermeture dans H de
l’ensemble des opérateurs de rang fini dans l’ensemble des opérateurs bornés.
C’est une caractérisation importante et utile en pratique, puisque les opérateurs
282
Analyse fonctionnelle et topologie
de rang fini sont plus faciles à manipuler. Toutefois, attention à ne pas oublier
l’hypothèse : la limite doit être bornée ; il existe en effet des suites d’opérateurs
de rang fini convergeant vers un opérateur non borné.
En voyant les opérateurs compacts comme limites d’opérateurs de rang fini, on
pourrait suggérer que la compacité d’un opérateur n’est pas une propriété très
forte. Toutefois il n’en est rien : dans un espace de Hilbert de dimension infinie,
la boule unité n’est pas compacte de sorte que l’identité elle-même n’est pas un
opérateur compact.
© Rappelons la propriété des restes uniformément petits, utilisée de manière
centrale dans ce développement et caractérisant les compacts de H. Elle est
prouvée dans le Développement 49 de cet ouvrage.
Soit H un espace de Hilbert séparable. Un ensemble X est compact
dans H si, et seulement si, il est fermé, borné et si pour toute famille
orthonormale complète (ek )k∈N de H, on a
X
∀ε > 0, ∃N ∈ N, ∀x ∈ X, |hx, ek i|2 6 ε.
k>N
© Rappelons l’un des grands faits concernant les opérateurs compacts autoad-
joints : il s’agit du théorème spectral. En dimension finie, puisque tous les opé-
rateurs linéaires sont compacts, il s’énonce sous la forme plus habituelle de
diagonalisabilité des opérateurs symétriques réels ou hermitiens complexes. Dans
le cas plus général des espaces de Hilbert, on a le théorème spectral suivant :
Pour tout opérateur auto-adjoint compact K d’un espace de Hilbert H,
il existe une famille totale de H formée de vecteurs propres de K. Plus
précisément, l’orthogonal de Ker(K) admet soit une base orthonormale
finie de vecteurs propres de K, soit une famille totale infinie (ek )k∈N
de vecteurs propres de K associés aux valeurs propres (λk )k∈N . De
plus, on a λk → 0 lorsque k → +∞.
Cette propriété admet par ailleurs une réciproque : un opérateur K défini par une
famille totale de vecteurs propres (ek )k∈N telle que K(ek ) = λk ek pour tout k > 0
et λk → 0 lorsque k → +∞ est compact. Cette équivalence illustre notamment
la contrainte forte qu’est la propriété de compacité. En excluant un nombre fini
de vecteurs ek , l’opérateur K n’a que des très petites valeurs propres, donnant
une lecture a posteriori plus limpide du théorème : les opérateurs compacts sont
« presque » des opérateurs de rang fini.
Questions.
1. Prouver que kPN k = 1 si H est de dimension infinie. Que se passe-t-il en
dimension finie ?
2. Prouver que dans un espace de Hilbert séparable, l’ensemble K(H) des opéra-
teurs compacts forment un idéal bilatère fermé dans B(H) et stable par passage à
l’adjoint.
Remarque : on peut montrer que K(H) est le seul idéal bilatère non trivial de
l’ensemble des opérateurs linéaires de H.
283
50. Opérateurs compacts d’un espace de Hilbert
3. Montrer qu’un opérateur compact ne peut avoir d’inverse borné sur un espace
de Hilbert séparable de dimension infinie.
4. Soit H = L2 ([0, 1]). Définissons l’opérateur M par, pour tout f ∈ H,
M (f ) : x ∈ [0, 1] 7→ xf (x).
284
Analyse fonctionnelle et topologie
|||PL ◦ B ◦ PK ||| 6 ε.
Le cadre des espaces de Hilbert est très agréable pour faire de l’algèbre linéaire,
puisqu’il se rapproche grandement de celui de la dimension finie : tout vecteur se
décompose suivant une « base » hilbertienne, et la convergence de la série associée
est donnée par l’inégalité de Bessel. Ainsi, ce résultat est un développement
bienvenu dans la leçon sur les espaces de Hilbert (213), et une illustration de la
leçon sur les espaces vectoriels normés (208).
Correction.
a) (i) On construit par récurrence deux suites strictement croissantes (ki )i∈N∗
et (`j )j∈N∗ à valeurs dans N∗ vérifiant la propriété
ε
∀i, j ∈ N∗ , |hB(eki ), e`j i| 6 , (2)
2`j
et telles que
∀j > 1, 2kj < `j < kj+1 .
Posons k1 = 1. Puisque (en )n∈N∗ est une famille totale de H, n |hB(e1 ), en i|2
P
converge d’après l’inégalité de Bessel, donc hB(e1 ), en i tend vers zéro lorsque n
tend vers +∞. En particulier, il existe un indice `1 tel que |hB(e1 ), e` i| 6 ε/4
pour tout ` > `1 . On peut supposer sans perte de généralité que `1 > 2k1 .
Par construction, on a
ε
|hB(ek1 ), e`1 i| 6 `1 . (3)
2
285
51. Décomposition de Mityagin
et tels que
∀j > 1, 2kj < `j < kj+1 .
On construit maintenant kN +1 et `N +1 .
Pour tout i ∈ N∗ , les éléments 2ki ne sont dans aucune des suites (ki )i∈N∗
ou (`j )j∈N∗ par construction. Or les 2ki sont tous distincts, donc l’ensemble
R = N∗ \ (K ∪ L) est infini, d’où la propriété attendue.
(ii) Il suffit de considérer la partition de N∗ en K, L et R telle que construite
à la question précédente et de définir EK (resp. EL et ER ) comme l’adhérence
dans H du sous-espace de H engendré par la famille (ek )k∈K (resp. par les familles
(e` )`∈L et (er )r∈R ).
Pour tout u ∈ H, on peut écrire le projeté PK (u) ∈ EK sous la forme
X
PK (u) = hPK (u), ek iek ,
k∈K
286
Analyse fonctionnelle et topologie
On obtient alors pour tout u ∈ H, par les décompositions précédentes ainsi que
par bilinéarité et continuité du produit scalaire,
X
PL ◦ B ◦ PK (u) = PL (B ◦ PK (u)) = hB ◦ PK (u), e` ie`
`∈L
* +
X X
= B hPK (u), ek iek , e` e`
`∈L k∈K
XX
= hB(ek ), e` ihPK (u), ek ie` .
`∈L k∈K
γ : [0, 1] −→ GL(H)
s 7−→ B − sPL ◦ B ◦ PK .
Montrons que cette courbe est d’image contenue dans GL(H). En effet, puisque
B ∈ GL(H) on peut écrire, pour tout s ∈ [0, 1],
de sorte que γ(s) ∈ GL(H) pour tout s ∈ [0, 1]. Ainsi, l’image de la courbe γ est
bien contenue dans GL(H).
287
51. Décomposition de Mityagin
PL ◦ A ◦ PK = PL ◦ B ◦ PK − PL2 ◦ B ◦ PK
2
= 0,
Commentaires.
© Ce développement donne un résultat de décomposition partielle d’un espace
de dimension infinie en la somme de trois sous-espaces de dimension infinie
également, vérifiant la propriété PL ◦ B ◦ PK = 0. Les projections construites
lors de ce développement, à savoir PK , PL et PR , donnent une identification
entre H et la somme directe externe H ⊕ H ⊕ H, permettant de réduire l’étude
de l’opérateur B à l’étude de matrices par blocs de taille 3 × 3 dont les blocs
sont eux-mêmes des matrices représentatives d’opérateurs sur H. La condition
PL ◦ B ◦ PK = 0 signifie en particulier que dans ce formalisme, l’application
linéaire B admet une « matrice » de la forme
∗ ∗ ∗
0 ∗ ∗ .
∗ ∗ ∗
P1 = B ◦ PK ◦ B −1 ◦ (Id − PK ) et P2 = Id − PL − PK .
P1 ◦ B ◦ PK = B ◦ PK , P2 ◦ B ◦ PK = 0 et P3 ◦ B ◦ PK = 0.
288
Analyse fonctionnelle et topologie
Questions.
1. Justifier l’existence de l’adjoint d’un opérateur continu d’un espace de Hilbert.
2. Détailler les calculs sur les sommes effectués dans la question a)(ii).
3. Montrer qu’un espace de Hilbert est séparable si et seulement s’il possède une
famille totale.
4. Expliquer pourquoi deux espaces de Hilbert séparables sont isomorphes.
5. Montrer que GL(H) est ouvert dans L(H).
6. Soit B ∈ GL(H). Montrer que A − B est inversible si |||A||| < |||B −1 |||−1 . Cette
inégalité est-elle également une condition nécessaire ?
7. Montrer que la norme d’opérateur est sous-multiplicative, autrement dit que
pour tous A, B ∈ B(H), on a |||AB||| 6 |||A||| · |||B|||.
8. Montrer que le théorème de Kuiper est faux en dimension finie : il existe un
lacet de GLn (C) qui ne se déforme pas continûment en un point.
Indication : si un lacet γ de matrices se déforme continûment en un point, alors il
en va de même du lacet det ◦ γ dans C.
289
52. Une isométrie de L2 (R+ ) non surjective
on a, pour tout x ∈ R+ ,
Z x Z x
1
2
e ϕf (t) dt = − e−2x |ϕf (x)|2 + Re
−t −t
e ϕf (t)f (t)dt . (1)
0 2 0
T : L2 (R+ ) −→ L2 (R+ )
f 7−→ gf
Correction.
a) Soit x ∈ R+ . Supposons tout d’abord que f ∈ L2 (R+ ) est continue. Alors ϕf
est de classe C 1 sur R+ , et ϕ0f (t) = et f (t) pour tout t > 0. En intégrant la fonction
continue t 7→ e−2t et en dérivant |ϕf |2 , on a par intégration par parties
Z x Z x
2
e−t ϕf (t) dt = e−2t |ϕf (t)|2 dt
0 0
Z x
1
= − e−2x |ϕf (x)|2 + Re e−t ϕf (t)f (t)dt ,
2 0
290
Analyse fonctionnelle et topologie
Revenons à présent au cas général f ∈ L2 (R+ ). On considère une suite (fn )n∈N
de fonctions de L1 (R+ ) ∩ L2 (R+ ) continues sur R+ et convergeant dans L1 (R+ )
vers la fonction tronquée f 1[0,x] , ce qui est possible par exemple par densité de
l’ensemble des fonctions de classe C ∞ à support compact dans L2 (R+ ). Le cas des
fonctions continues traité précédemment donne, pour tout n ∈ N :
Z x Z x
1
2
e−t ϕfn (t) dt = − e−2x |ϕfn (x)|2 + Re e−t ϕfn (t)fn (t)dt . (2)
0 2 0
e−t ϕfn (t)fn (t) − e−t ϕf (t)f (t) = e−t ϕfn (t)fn (t) − ϕf (t)f (t)
6 ϕfn (t)fn (t) − ϕfn (t)f (t) + ϕfn (t)f (t) − ϕf (t)f (t)
Comme les ϕfn et ϕf sont continues, on a sup[0,x] |ϕfn | → sup[0,x] |ϕf | < +∞. On
en déduit Z x Z x
−t
e ϕfn (t)fn (t)dt −−−−−→ e−t ϕf (t)f (t)dt.
0 n→+∞ 0
On obtient alors (1) en faisant tendre n vers +∞ dans l’identité (2).
b) Soit f ∈ L2 (R+ ). Posons hf (x) = e−x ϕf (x) pour tout x ∈ R+ . Montrons dans
un premier temps que hf ∈ L2 (R+ ) et hf f ∈ L1 (R+ ). On remarque que
Z x Z x Z x
1
2
|hf | 6 − |hf (x)|2 + Re hf f 6 |hf f |
0 2 0 0
d’où
Z x Z x 1 Z x 1
2 2
|hf |2 6 |hf |2 |f |2
0 0 0
291
52. Une isométrie de L2 (R+ ) non surjective
R 1
et donc, en simplifiant l’inégalité par 0x |hf |2 2 dans le cas où 0x |hf |2 6= 0 (dans
R
pour tout x > 0. En faisant tendre x vers l’infini, on trouve finalement que
Z +∞
|hf |2 6 kf k22 < +∞,
0
donc hf ∈ L2 (R+ ). Comme hf et f (et donc f ) sont dans L2 (R), on obtient alors
bien que hf f ∈ L1 (R+ ).
Réécrivons à présent l’identité (1) sous la forme suivante :
Z x Z x
∀x ∈ R+ , |hf |2 (x) = 2 Re hf f − |hf |2 . (3)
0 0
Comme |hf |2 et hf f sont intégrables, la relation (3) implique que |hf |2 admet une
limite finie en +∞. Cette limite ne peut être que 0 puisque |hf |2 est intégrable,
donc en passant à la limite dans (3) on obtient
Z +∞ Z +∞
2
|hf | = Re hf f .
0 0
292
Analyse fonctionnelle et topologie
Une fonction g dans l’image de T est donc nécessairement telle que la fonction
f : R+ → R définie par
Z x
f (x) = g(x) + 2e x
e−t g(t) dt (6)
0
soit dans L2 (R+ ). Ce n’est évidemment pas le cas si g est telle que lim+∞ f = +∞,
ce qui est vérifié dès que g est positive et non presque partout nulle (par exemple
lorsque g : t 7→ e−t ). L’application T n’est donc pas surjective.
Commentaires.
© Tout au long de ce développement, on a commis l’abus de langage consistant
à considérer comme des fonctions les classes d’équivalence de fonctions pour
l’égalité sur presque tout R+ . Il est cependant bon de garder à l’esprit que les
quantités f (x) et gf (x) ne sont bien définies que pour presque tout x ∈ R+ . Les
fonctions φf et hf sont quant à elles définies sur R+ tout entier.
© On peut établir le résultat de la question b) en utilisant le produit scalaire
hermitien h·, ·i de L2 (R+ ). Pour ce faire, on procède en cinq étapes :
1. On établit tout d’abord que si f1 et f2 sont dans L2 (R+ ), alors
Z x
1
e−2t ϕf1 (t)ϕf2 (t)dt = − e−2x ϕf1 (x)ϕf2 (x)
0 2
1 x −t
Z
+ e ϕf1 (t)f2 (t) + f1 (t)ϕf2 (t) dt (7)
2 0
pour tout x ∈ R+ .
Cette identité peut être obtenue soit par un calcul direct comme dans
la question a) (auquel cas son énoncé et sa preuve peuvent remplacer la
question a)), soit en utilisant la question a) et l’identité de polarisation
ϕf1 (t)ϕf2 (t) = |ϕf1 +f2 (t)|2 − |ϕf1 −f2 (t)|2 + i |ϕf1 −if2 (t)|2 − i |ϕf1 +if2 (t)|2 .
293
52. Une isométrie de L2 (R+ ) non surjective
d’après le point précédent puisque les g1Ak sont deux à deux orthogonales.
On en déduit
n
! 2 n 2
X X
T αk 1Ak = αk 1Ak ,
k=1 2 k=1 2
ce qu’il fallait démontrer.
294
Analyse fonctionnelle et topologie
Questions.
1. Pourquoi la fonction |ϕf |2 est-elle dérivable lorsque f ∈ L2 (R+ ) est continue ?
2. Détailler les intégrations par parties effectuées dans le développement.
3. Si f ∈ L2 (R+ ) et x ∈ R+ , définir une suite (fn )n∈N de fonctions continues de
L1 (R+ ) ∩ L2 (R+ ) convergeant vers f 1[0,x] dans L1 (R+ ).
4. Donner un exemple de fonction f : R+ → C continue appartenant à L2 (R+ )
mais pas à L1 (R+ ).
5. Donner un exemple de fonction f : R+ → C continue appartenant à L1 (R+ )
mais pas à L2 (R+ ).
6. Dans la réponse à la question a), aurait-on pu simplement considérer une suite
(fn )n∈N de L2 (R+ ) continue sur R+ et convergeant vers f 1[0,x] dans L2 (R+ ) ?
7. Rappeler pourquoi, si f1 , f2 ∈ L2 (R+ ), alors f1 f2 ∈ L1 (R+ ).
8. Établir l’égalité (5) en utilisant le théorème de Fubini.
9. Si g ∈ L2 (R+ ) et si f est définie par (6), justifier que la limite de f en +∞ est
égale à +∞ lorsque g est positive et non presque partout nulle.
10. Une isométrie d’un espace vectoriel de dimension finie dans lui-même peut-elle
être non surjective ?
11. Montrer que la transformation de Fourier est une isométrie bijective de L2 (R).
12. Donner d’autres exemples d’isométries non surjectives d’un espace vectoriel
dans lui-même.
13. Détailler l’argument de densité qui clôt la preuve de la question b) donnée en
commentaire.
14. Est-il suffisant de savoir qu’une application linéaire préserve la norme sur un
sous-espace vectoriel dense de L2 (R+ ) pour déduire qu’il s’agit d’une isométrie ?
295
53. Logarithme et théorème de Brouwer
296
Analyse fonctionnelle et topologie
pour laquelle « le concept de connexité par arcs, le théorème du relèvement [...] sont
des sujets d’investigation pertinents » (extrait du rapport du jury de l’agrégation
2019). Il peut enfin être proposé pour illustrer la leçon 101, dans laquelle une partie
consacrée aux actions topologiques est tout à fait cohérente. Si le développement
semble long en termes de rédaction, on peut passer assez rapidement sur des
vérifications simples, voire moduler le développement en omettant la question b)(ii)
et le théorème de Brouwer, quitte à uniquement mentionner en commentaire qu’il
s’en déduit alors facilement de la question b)(i), laquelle est déjà un résultat
intéressant en soi (voir commentaire sur le rétract ci-après).
Correction.
a) (i) Soient V un voisinage ouvert de 1G et GV le groupe engendré par V .
Alors
• 1G ∈ GV car 1G ∈ V ; en particulier GV n’est pas vide.
• GV est un ouvert de G. En effet, puisque V ⊂ GV , on peut écrire
[
GV = g · V,
g∈GV
297
53. Logarithme et théorème de Brouwer
car kgn k∞ tend vers kgk, et khn − hk∞ et kgn − gk∞ tendent vers 0, ce qui montre
la continuité de la loi produit.
Enfin, pour la continuité de l’inverse, considérons une suite (gn )n∈N d’éléments de
C(K, C∗ ) convergeant uniformément vers une fonction g ∈ C(K, C∗ ). En vertu de
la continuité des fonctions |gn | et de |g|, de la compacité de K et du fait que les
fonctions gn et g ne s’annulent pas, on a
et
inf |g(x)| = min |g(x)| > 0.
x∈K x∈K
Ainsi
Puisque (gn )n∈N converge uniformément vers g, la suite (minK |gn |)n∈N converge
vers minK |g|, donc le majorant de l’inégalité précédente converge bien vers 0
lorsque n tend vers l’infini, ce qui montre la continuité de l’opération d’inversion.
Finalement C(K, C∗ ) est bien un groupe topologique.
(iii) On montre que toute application g ∈ C(K, C∗ ) peut être reliée par un arc à
l’application constante x 7→ g(0), laquelle peut elle-même être reliée à l’application
1C(K,C∗ ) . Pour g ∈ C(K, C∗ ), on pose l’application
γ : [0, 1] −→ C(K, C∗ )
t 7−→ γt := (x 7→ g(tx)),
|(γt1 − γt2 )(x)| = |g(t1 x) − g(t2 x)| 6 ωg (|t1 − t2 | · |x|) 6 ωg (M |t1 − t2 |),
298
Analyse fonctionnelle et topologie
(iv) Il s’agit de vérifier que les propriétés d’un sous-groupe sont satisfaites :
• L’élément neutre du groupe C(K, C∗ ), noté 1C(K,C∗ ) , qui est la fonction iden-
tiquement égale à 1, admet évidemment un logarithme continu, car 1 = exp(0),
donc 1C(K,C∗ ) ∈ G.
• Si g1 , g2 ∈ G, alors par définition il existe des fonctions h1 et h2 ∈ C(K, C) telles
que g1 = exp(h1 ) et g2 = exp(h2 ). Donc g1 g2 = exp(h1 +h2 ), où h1 +h2 ∈ C(K, C),
donc g1 · g2 admet un logarithme continu, i.e. g1 · g2 ∈ G.
• Si g ∈ G, il existe h ∈ C(K, C) tel que g = exp(h), donc g −1 = exp(−h),
donc g −1 admet un logarithme continu, i.e. g −1 ∈ G.
Ainsi, G est un sous-groupe de C(K, C∗ ).
(v) Soit g ∈ B(1G , 1/2), où B(1G , 1/2) désigne la boule ouverte dans C(K, C∗ )
de rayon 1/2 et centrée en 1G . Posant f := g − 1G , on a f ∈ C(K, C), g = 1G + f
et kf k∞ < 1/2. Étant donné que |f (x)| < 1/2 pour tout x ∈ K, on peut définir
l’application
h : K −→ C
+∞
X (−1)k
x 7−→ f (x)k = ln(1 + f (x)),
k=1
k
de sorte que h est continue et exp(h(x)) = 1 + f (x) = g(x) quel que soit x ∈ K.
Ainsi g admet un logarithme continu, d’où B(1G , 1/2) ⊂ G, et par conséquent G
contient un voisinage de 1G , qu’on note V . Notons GV le groupe engendré par V .
Alors on a bien évidemment GV ⊂ G ⊂ C(K, C∗ ), mais également C(K, C∗ ) = GV ,
car C(K, C∗ ) est engendré par tout voisinage de son élément neutre d’après les
questions a)(i) et a)(iii), d’où
C(K, C∗ ) = GV ⊂ G ⊂ C(K, C∗ ).
où t(x) > 0 est tel que |r(x)| = 1. Remarquons que pour tout x ∈ ∂D, par
définition r(x) = x, donc r est bien égale à l’identité sur ∂D. Il suffit ensuite de
voir que r est continue, et pour cela il suffit de montrer que x 7→ t(x) est continue.
À un point x ∈ D fixé, cherchons t = t(x) tel que |r(x)|2 = 1. On obtient
299
53. Logarithme et théorème de Brouwer
r(x)
1 x •
•
f (x) •
0 1
300
Analyse fonctionnelle et topologie
Posant I = ϕ(∂D) ⊂ R, on conclut que ϕ|∂D est une bijection continue entre ∂D
et I, et comme ∂D est un compact, ϕ|∂D est un homéomorphisme. Par ailleurs I est
un compact connexe comme image d’un compact connexe par une application conti-
nue, donc I est un segment. Mais alors le fait que ϕ réalise un homéomorphisme
entre ∂D et I est absurde. En effet, on peut voir que le segment I = [a, b] ne peut
être homéomorphe à ∂D en raisonnant par connexité : introduisons x = ϕ|−1 ∂D (a)
et y = ϕ|−1∂D (b) les antécédents par ϕ| ∂D de a et b respectivement, alors d’une part
−1
l’ensemble ϕ|∂D (]a, b[) est connexe comme image d’un connexe par l’application
continue ϕ|−1 −1
∂D , mais d’autre part on remarque que ϕ|∂D (]a, b[) = ∂D \ {x, y} n’est
pas connexe, car x 6= y. En conclusion toute application continue de D dans D
admet un point fixe.
Commentaires.
© Dans la question b)(ii) on montre en réalité que ∂D n’est pas un rétract de D.
En effet, étant donné un espace topologique X et un ensemble A ⊂ X, on dit
que A est un rétract de X si l’application identité de A dans A se prolonge en
une application continue r ∈ C(X, A). L’application r est appelée une rétraction
de X sur A.
© Remarquons que si l’identité Id : ∂D → ∂D ne peut s’étendre en une application
continue de D dans ∂D, elle peut néanmoins s’étendre en une application continue
de D dans C en appliquant le théorème de Tietze-Urysohn aux parties réelle et
imaginaire de l’identité.
© Le théorème de Brouwer est également vrai en dimension finie supérieure, et
se généralise même à tout espace euclidien : toute application continue de la
boule unité fermée d’un espace euclidien dans elle-même admet un point fixe.
Les démonstrations de ce résultat font alors généralement appel à des notions
de calcul différentiel, et pas uniquement des arguments de continuité. À noter
également l’existence du théorème du point fixe de Schauder, qui généralise encore
le théorème de Brouwer pour des espaces de Banach quelconques.
© Une alternative pour montrer dans la question a)(v) que G contient un voisinage
de 1G est d’utiliser le théorème d’inversion locale pour déduire que l’exponentielle
réalise un difféomorphisme entre un voisinage de 0 dans C et un voisinage de 1
dans C∗ . L’avantage de cette méthode est qu’elle permet de généraliser facilement
l’existence d’un logarithme continu pour toute fonction de C(K, GLn (C)), où K
est un compact étoilé par rapport à 0 de Mn (C) (voir questions ci-après). On
pourrait même généraliser le résultat à C(K, G) où K est un compact étoilé par
rapport à 0 de g, l’algèbre de Lie associée à un groupe de Lie connexe G, puisqu’il
existe un voisinage U de 0 dans g et un voisinage V de 1G dans G tels que
exp : U → V est un difféomorphisme d’après le théorème de Cartan-von Neumann
(voir Développement 55).
301
53. Logarithme et théorème de Brouwer
Questions.
1. Soit (G, ·) un groupe topologique, et soit V un voisinage de 1G . On considère GV
le groupe engendré par V . Justifier que pour tout g ∈ G \ GV , l’ensemble g · V
est inclus dans G \ GV .
2. Montrer que C∗ est connexe par arcs.
3. Montrer le théorème de Brouwer en dimension 1, i.e. que toute fonction continue
de [0, 1] dans [0, 1] admet un point fixe.
4. Montrer que si f est une bijection continue d’un espace topologique com-
pact K dans un espace topologique séparé, alors f −1 est continue, i.e. f est un
homéomorphisme.
Indication : montrer que f est fermée, et que ceci implique la continuité de f −1 .
5. Montrer que si un espace topologique est localement connexe par arcs et
connexe, alors il est connexe par arcs.
6. Montrer que si K est un compact quelconque, l’ensemble G défini dans la
question a)(iv) est égal à G0 , où G0 désigne la composante connexe de 1C(K,C∗ ) .
Indication : on pourra se servir de la question précédente pour déduire que G0 est
en fait la composante connexe par arcs de 1C(K,C∗ ) . Montrer alors que G0 est un
sous-groupe de C(K, C∗ ) contenant G.
7. Montrer que GLn (K) est un groupe topologique, pour K = R ou C.
8. Montrer que le groupe GLn (C) est connexe. En déduire qu’il est engendré
par n’importe quel voisinage de la matrice identité In . Le groupe GLn (R) est-il
également engendré par n’importe quel voisinage de In ?
9. Pour K = R ou C, on rappelle que l’exponentielle de matrices est l’application
Montrer que cette application est bien définie et continue sur Mn (K).
10. Soit K un compact de Mn (C) étoilé par rapport à 0. Montrer que toute
fonction f ∈ C(K, GLn (C)) admet un logarithme continu, i.e. il existe une fonc-
tion g ∈ C(K, Mn (C)) telle que f = exp(g).
Indication : on pourra se servir des questions 7 à 9 et du dernier point en
commentaire en étudiant la différentiabilité de l’exponentielle, en particulier au
voisinage de 0.
302
Analyse fonctionnelle et topologie
Les espaces Lp (Ω) sont des espaces de fonctions (201, 234) fondamentaux en ana-
lyse fonctionnelle, notamment en raison de leur complétude (205) qui constitue le
sujet principal de ce développement. L’argumentation repose sur des manipulations
élémentaires de suites de Cauchy ainsi que sur le théorème de convergence dominée
et ses variations, faisant de ce développement une bonne illustration des leçons
sur les espaces vectoriels normés (208) et sur les suites et séries de fonctions
Lebesgue-intégrables (241).
Correction.
a) Soit (fn )n∈N une suite de Cauchy dans L∞ (Ω). Montrons que (fn )n∈N est une
suite qui converge dans L∞ (Ω). Puisque c’est une suite de Cauchy, pour tout k > 1
il existe un nk ∈ N tel que
1
∀q, r > nk , kfr − fq k∞ 6 .
k
Cela signifie que, pour tout entier k > 1 et pour tous q, r > nk , il existe un
sous-ensemble de Ω de mesure nulle Ek,q,r tel que
1
∀x ∈
/ Ek,q,r , |fr (x) − fq (x)| 6 . (1)
k
Introduisons [
E= Ek,q,r ,
k>1
q,r>nk
303
54. Théorème de Riesz-Fischer
Il s’ensuit que (fn (x))n∈N est une suite de Cauchy pour tout x ∈/ E. Par complétude
de C, pour tout x ∈ / E la suite (fn (x))n∈N converge donc vers une limite que nous
notons f (x) pour tout x ∈ / E. En laissant r tendre vers l’infini dans le critère de
Cauchy (1) il vient alors que, pour tout x ∈ / E et tout k > 1,
1
∀q > nk , |f (x) − fq (x)| 6 , (2)
k
De plus, par le critère de Cauchy, pour tout ε > 0 il existe n2 ∈ N tel que
ε
∀r, s > n2 , kfr − fs kp 6 .
2
Pour tout n > n2 , puisque φ est une extractrice, on a φ(n) > n > n2 . Il vient
alors, par inégalité triangulaire et les inégalités ci-avant,
Introduisons la suite extraite (hn )n∈N définie par hn = fφ(n) pour tout n ∈ N. Les
inégalités (3) garantissent alors que khn − hn+1 kp 6 2−n pour tout n ∈ N. Pour
presque tout x ∈ Ω et pour tout n ∈ N, on pose alors
n
X
gn (x) = |hk+1 (x) − hk (x)|.
k=0
La suite (gn )n∈N est alors bien définie presque partout, elle est croissante et
uniformément dominée par 1. Par le théorème de convergence monotone, la suite
304
Analyse fonctionnelle et topologie
(gn )n∈N converge simplement presque partout vers une limite g ∈ Lp (Ω). D’après
l’inégalité triangulaire on a, pour presque tout x ∈ Ω et tout entier r ∈ N :
s−1
X
∀s > r, |hr (x) − hs (x)| = (hn+1 (x) − hn (x))
n=r
s−1
X
6 |hn+1 (x) − hn (x)|
n=r
= gs−1 (x) − gr−1 (x)
6 g(x) − gr−1 (x). (4)
Or, pour presque tout x ∈ Ω, on a g(x) − gr−1 (x) → 0 quand r → +∞. Ainsi,
pour presque tout x ∈ Ω la suite de nombres complexes (hn (x))n∈N est de Cauchy,
donc converge vers une certaine limite que l’on note h(x).
En passant à la limite dans (4) pour s → +∞, il vient donc que pour tout r ∈ N et
presque tout x ∈ Ω on a |hr (x)−h(x)| 6 g(x)−gr−1 (x) 6 g(x). Deux conséquences
s’ensuivent :
• Pour tout r ∈ N et pour presque tout x ∈ Ω, l’inégalité triangulaire donne
Commentaires.
© Il est possible d’affiner la question b)(i) pour prouver qu’une suite convergeant
vers f dans Lp (Ω) admet une sous-suite convergente presque partout vers f .
En effet, supposons que (fn )n∈N converge pour la norme de Lp (Ω). Alors (fn )n∈N
est une suite de Cauchy dans Lp (Ω). Le même raisonnement que celui utilisé dans
la question b)(ii) permet donc d’en extraire une sous-suite (hn )n∈N convergeant
presque partout vers une fonction notée h, a priori différente de f dans Lp (Ω). Il
reste à montrer que h = f .
Conservons les mêmes notations qu’à la question b)(ii). Pour presque tout x ∈ Ω
et pour tout r ∈ N, on a
|h(x) − hr (x)| 6 g(x).
En particulier, par l’inégalité triangulaire il vient que |h(x)| 6 g(x) + |hr (x)| pour
presque tout x ∈ Ω. Puisque g et hr sont des fonctions de Lp (Ω), on a h ∈ Lp (Ω).
305
54. Théorème de Riesz-Fischer
Soit (φk )k∈N une famille orthogonale dans L2 ([a, b]). Soit (ck )k∈N une
suite de scalaires telle que c2k < +∞. Alors il existe f ∈ L2 ([a, b])
P
telle que
Z b
∀k > 0, ck = f (t)φk (t)dt.
a
On ne sait pas si les deux théorèmes sont équivalents, dans le sens où ils se
déduiraient de manière élémentaire l’un de l’autre sans utiliser des avatars du
théorème de représentation de Riesz. La version de Riesz est une conséquence de
la version de Fischer, mais la réciproque n’est pas connue. En 2000, Császár a
prouvé que la version de Fischer est une conséquence de la propriété plus forte
suivante :
Soit (φk )k∈N une famille orthogonale dans L2 ([a, b]). Soit (ck )k∈N une
suite de scalaires telle que c2k < +∞. Alors k ck φk est sommable
P P
306
Analyse fonctionnelle et topologie
Questions.
1. Rappeler pourquoi une union dénombrable d’ensembles de mesure nulle est un
ensemble de mesure nulle.
2. Montrer que l’inégalité (2) pour tout x ∈
/ E permet de déduire que la fonction f
est essentiellement bornée.
3. Justifier que la réunion définissant l’ensemble E de la question a) est une union
dénombrable.
4. Prouver que si φ est une extraction, alors φ(n) > n pour tout n ∈ N.
5. Justifier que la fonction φ dans (3) peut être choisie strictement croissante.
6. Soient (X, µ) un espace mesuré et des réels 1 6 p < q 6 +∞. Montrer qu’on a
l’inclusion Lq (X, µ) ⊆ Lp (X, µ) si et seulement si µ(X) est finie.
7. Soit E un espace vectoriel de dimension finie sur R. Montrer que Lp (E) est
séparable pour 1 6 p < +∞. Qu’en est-il de L∞ (E) ?
8. Rappeler pourquoi la somme de deux fonctions dans Lp (Ω) est dans Lp (Ω).
9. Montrer que l’espace R1 (]0, +∞[) des fonctions Riemann intégrables n’est pas
un espace complet.
Indication : considérer les fonctions définies, pour tout n ∈ N et tout x > 0, par
Vérifier que les gn sont Riemann-intégrables pour tout n ∈ N. Vérifier que (gn )n∈N
est une suite de Cauchy pour la norme k · k1 . Constater que toutefois il n’y a pas
de limite dans R1 (]0, +∞[), car une éventuelle limite devrait être égale presque
partout à la fonction − ln qui n’est pas bornée.
10. Montrer que la propriété de Császár implique celle de Riesz.
307
Calcul différentiel, équations
différentielles et EDP
et on suppose que toutes les solutions maximales cette équation sont définies sur
des intervalles de type ]a, +∞[ avec a < 0 (éventuellement a = −∞).
La Figure 2.2 illustre les différentes notions de stabilité sur des exemples issus
d’équations différentielles linéaires à coefficients constants. Il est utile de connaître,
au moins dans le cas n = 2, la classification des comportements qualitatifs de
telles équations en fonction du signe des valeurs propres de la matrice associée,
ainsi que l’allure des portraits de phase correspondants (voir [Dem06] p. 290).
310
Calcul différentiel, équations différentielles et EDP
−1
−2
−3
−π − π2 0 π
2
π 3π
2
2π 5π
2
3π
Figure 2.3 – Représentation du champ de vecteurs F : (x, y) 7→ y, − 12 sin(x) ,
dont le système différentiel associé admet des points d’équilibre stables mais non
attractifs.
311
Sous-solutions et sur-solutions d’une EDO
Soient J un intervalle ouvert de R et U un ouvert de R, tous deux non vides. On
se donne un champ de vecteurs F : J × U → R continu et on considère l’équation
différentielle
y 0 = F (t, y). (6)
Proposition 1
Si z est une sous-solution (resp. sur-solution) de l’équation (6) et y une solution
de (6) sur un même intervalle ouvert I ⊂ J et si z(t0 ) = y(t0 ) pour un certain
t0 ∈ I, alors z(t) < y(t) (resp. z(t) > y(t)) pour tout t ∈ I tel que t > t0 .
y y(t)
z(t)
312
Calcul différentiel, équations différentielles et EDP
Soit n > 1. Soit G un sous-groupe fermé de GLn (R), et son algèbre de Lie
sont dans g.
(ii) Montrer qu’il existe un voisinage V de 0 dans m avec exp(V ) ∩ G = {In }.
b) Pour deux sous-espaces E et F supplémentaires dans Mn (R), considérons
Ce développement ne doit pas rebuter par son formalisme : derrière des énoncés qui
utilisent des groupes et algèbres de Lie — ce qui peut être évité, voir commentaires
suivant le développement — il s’agit de manipuler des suites ainsi que les propriétés
de l’exponentielle et du logarithme de matrices, en faisant une bonne illustration
de la leçon sur l’exponentielle de matrices (156). Cela permet d’atteindre l’un des
grands résultats de la théorie des groupes de Lie, énonçant que les groupes de Lie
linéaires sont des variétés différentielles, dévoilant une dimension nouvelle des
groupes linéaires (106). Ce résultat rend le développement pertinent pour les leçons
de calcul différentiel (214, 215).
313
55. Théorème de Cartan-von Neumann
Correction.
a) (i) Soit x un point d’accumulation de la suite (xk )k∈N . Quitte à extraire,
on peut supposer que xk converge vers x. Notons yk = ln gk , qui est bien défini
pour k suffisamment grand de sorte que kgk − In k < 1. Pour t ∈ R, introduisons
la suite tk = tkyk k−1 , de sorte que txk = tk yk . En notant b·c la partie entière ainsi
que {·} la partie fractionnaire, il vient
bt c
exp(txk ) = exp(tk yk ) = exp(btk cyk ) exp({tk }yk ) = gk k exp({tk }yk ).
Puisque (gk )k∈N converge vers l’identité, la suite yk converge vers zéro. De plus,
puisque la suite des {tk } est bornée et que celle des yk converge vers 0, la suite des
{tk }yk converge vers zéro. Par continuité de l’exponentielle, on déduit donc que
la suite des exp({tk }yk ) converge vers l’identité. Comme le groupe G est fermé,
on obtient ainsi
bt c
exp(tx) = lim gk k ∈ G.
k→+∞
Puisque cela est valable pour tout t ∈ R, cela signifie que x ∈ g par définition.
(ii) Raisonnons par l’absurde et supposons qu’il existe une suite (zk )k∈N de m
qui converge vers zéro et telle que exp(zk ) 6= In pour tout k > 1. Tout point
d’accumulation z de la suite (zk /kzk k)k∈N = (ln(exp(zk ))/k ln(exp(zk ))k)k∈N est
dans g par la question précédente. Mais puisque m est un sous-espace vectoriel de
dimension finie, il est fermé et on a donc également z ∈ m. Ainsi, on aurait z = 0
puisque g et m sont supplémentaires, mais cela n’est pas possible puisque z est de
module 1. Ainsi, il existe un voisinage V de 0 dans m tel que exp(V ) ∩ G = {In }.
b) (i) En revenant à la définition de l’exponentielle comme somme de série on
a, pour tout h, k ∈ Mn (R),
+∞
X hn +∞
X kn
Φ(0 + h, 0 + k) =
n=0
n! n=0 n!
= In + (h + k) + O(khkk).
314
Calcul différentiel, équations différentielles et EDP
ce qui signifie que exp(y) = In , autrement dit que g = exp(x) ∈ G. Ainsi, tout
élément de W ∩ G est bien l’exponentielle d’un élément de U , ce qui achève de
prouver que exp : U → W ∩ G est surjective, et donc un difféomorphisme. Ainsi,
on a prouvé que exp : U → W ∩ G est un difféomorphisme d’un voisinage de 0
dans g dans un voisinage de l’identité dans G.
c) L’idée est de translater la propriété prouvée lors des questions précédentes,
qui concerne le voisinage de l’identité, en tout autre point du groupe. Pour g ∈ G,
introduisons l’application de translation
Lg : G −→ G
h 7−→ gh
Commentaires.
© L’exponentielle est un difféomorphisme local, mais toutefois cela ne suffit pas
à trivialiser l’exercice. En effet, cela assure qu’il existe un voisinage U de 0
dans Mn (R) et un voisinage V de In dans GLn (R) tels que exp : U → V est un
difféomorphisme. On ne peut pas pour autant en déduire que exp : U ∩ g → V ∩ G
est un difféomorphisme : même si exp : U ∩ g → V ∩ G est bien définie et injective,
rien ne garantit qu’elle est surjective. C’est tout l’enjeu du développement, atteint
à la question b)(iii) après une application fine du théorème d’inversion locale.
© Un sous-groupe fermé de GLn (R) est appelé un groupe de Lie linéaire. Ce
développement se propose de montrer l’importante correspondance entre groupes et
algèbres de Lie dans ce cadre : les deux sont isomorphes au voisinage de leur élément
neutre. En particulier, l’algèbre de Lie d’un groupe de Lie linéaire G détermine
sa composante connexe principale. Ainsi, si plusieurs groupes de Lie peuvent
avoir la même algèbre de Lie, il n’y en a qu’un qui est connexe et simplement
connexe, à isomorphisme près. La classification des groupes de Lie connexes et
simplement connexes se ramène donc à celle des algèbres de Lie associées, et
celles-ci se répertorient en quatre grandes familles d’algèbres de Lie ainsi que cinq
algèbres de Lie exceptionnelles, se traduisant par une classification analogue pour
les groupes de Lie. Beaucoup plus précisément, le théorème fondamental de la
théorie de Lie est le suivant :
315
55. Théorème de Cartan-von Neumann
• Le groupe spécial linéaire SLn (R) = {g ∈ GLn (R) : det(g) = 1} admet pour
algèbre de Lie l’espace de dimension n2 − 1 donné par
316
Calcul différentiel, équations différentielles et EDP
Questions.
1. Montrer que g est un sous-espace vectoriel de Mn (R).
2. Rappeler la définition de l’exponentielle d’une matrice, ainsi que de son loga-
rithme lorsqu’il est bien défini.
3. Si A, B ∈ Mn (R) commutent, montrer que exp(AB) = exp(A) exp(B).
4. Comment réduire exp(M ) en fonction de la réduction de M ∈ Mn (R) ?
Indication : penser à la décomposition de Dunford, rendue possible par la commu-
tativité entre M et exp(M ).
5. Donner l’image de l’ensemble des matrices symétriques réelles, Sn (R), par
l’exponentielle. Et des matrices hermitiennes ?
Indication : voir Développement 34, sur la décomposition polaire matricielle.
6. Si deux sous-groupes fermés de GLn (R) ont même algèbre de Lie, montrer
qu’ils ont même composante connexe de l’identité.
Indication : montrer que tout élément de la composante connexe de l’identité est
dans un exp(g)k , pour un certain k > 1.
7. Pourquoi l’application Lg est-elle un difféomorphisme ?
8. Vérifier les correspondances entre les groupes classiques et les algèbres de Lie
décrites dans les commentaires.
317
56. Théorème de stabilité de Liapounov
y 0 = f (y), (1)
318
Calcul différentiel, équations différentielles et EDP
Correction.
a) Notons λ1 , . . . λk ∈ C les valeurs propres de A, où k 6 n. La décomposition en
sous-espaces caractéristiques de A s’écrit, pour certains m1 , . . . , mk ∈ N∗ :
k
M
Cn = où Ej = Ker (A − λj In )mj .
Ej , (3)
j=1
mj −1 p
X t
tA tλj
∀t > 0, ke xj k 6 e Cj kxj k 6 etRe(λj ) Pj (t)Cj kxj k. (4)
p=0
p!
des croissances comparées montre que pour tout a < − maxj Re(λj ) avec a > 0, il
existe C > 0 vérifiant
∀t > 0, kz(t)k 6 Ce−at kxk,
d’où le résultat attendu.
b) On peut donner explicitement la différentielle d’une forme quadratique en
fonction de sa forme bilinéaire associée : pour tout u ∈ Rn ,
Z +∞ D E
h∇q(u), Aui = 2b(u, Au) = 2 etA u, AetA u dt
0
Z +∞
d D tA E
= e u, etA u dt
0 dt
h i+∞
= ketA uk2
0
2
= −kuk ,
d’après la question a) qui assure que etA u tend vers zéro lorsque t → +∞.
c) (i) Par définition, on a y 0 (t) = f (y(t)) = Ay(t) + r(y(t)) pour tout t ∈ I. Il
vient alors, par bilinéarité de b et par le résultat de la question précédente,
d
q(y(t)) = 2b y(t), y 0 (t)
∀t ∈ I,
dt
= 2b y(t), Ay(t) + 2b y(t), r(y(t))
= −ky(t)k2 + 2b y(t), r(y(t)) .
(6)
p
Par l’inégalité de Cauchy-Schwarz pour la norme k · kq = q(·) associée à la forme
quadratique définie positive q, on a
∀t ∈ I, b y(t), r(y(t)) 6 ky(t)kq kr(y(t))kq . (7)
Constatons que r(u) = f (u) − f (0) − df (0) · u pour tout u ∈ Rn , de sorte que la
définition de la différentielle permet de borner r(u) en norme k · kq . En effet, la
formule de Taylor-Young assure que r(u) = o(kukq ), donc il existe α > 0 tel que
pour tout u ∈ Rn vérifiant q(u) < α on ait
1
kr(u)kq 6 kukq .
4
L’inégalité (7) donne alors
1
∀t ∈ I : q(y(t)) < α, |b(y(t), r(y(t)))| 6 ky(t)k2q .
4
Par équivalence des normes en dimension finie, il existe une constante C > 0 telle
que Ckukq 6 kuk, c’est-à-dire C 2 q(u) 6 kuk2 , pour tout u ∈ Rn .
D’après la relation (6), on a alors :
d
∀t ∈ I : q(y(t)) < α, q(y(t)) = −ky(t)k2 + 2b(y(t), r(y(t)))
dt
1
6 − ky(t)k2 6 −βq(y(t))
2
en posant β = 21 C 2 > 0.
320
Calcul différentiel, équations différentielles et EDP
(ii) Supposons que q(x) < α. Si la quantité q(y(t)) ne restait pas toujours
inférieure à α, il existerait par continuité de q et de y un premier instant t0 > 0
tel que q(y(t0 )) = α, c’est-à-dire
d βt d
e q(y(t)) = eβt q(y(t)) + βq(y) 6 0
dt dt
grâce à la question b)(i). Ainsi, la fonction t 7→ etβ q(y) est décroissante, et donc
inférieure à sa valeur initiale. Puisque y(0) = x, il vient que, pour tout t > 0,
autrement dit ky(t)k2q 6 e−βt kxk2q pour tout t > 0. En particulier, par équivalence
des normes en dimension finie, la solution y du système tend exponentiellement
vers zéro, d’où le théorème de Liapounov.
Commentaires.
© Ce développement illustre la méthode de linéarisation : on approche le compor-
tement de la solution y du système par celui de la solution du système linéarisé
défini par z 0 = Az avec la condition initiale z(0) = x, qui a pour solution explicite
la fonction z(t) = etA x. Le comportement de cette solution approchée n’est pas
très éloigné de celui de la solution originale par définition de la différentielle. C’est
là l’esprit de l’analyse : remplacer l’étude de l’objet voulu par celle d’un objet
approché (étude réalisée en question a)) tout en contrôlant suffisamment l’erreur
pour en déduire des informations sur l’objet initial (conclusion atteinte dans la
question c)). Les mots de Dieudonné « majorer, minorer, approcher » synthétisent
parfaitement cette approche de l’analyse.
© Ce développement est essentiellement adapté de [Rou03], qui est un excellent
livre de préparation à l’agrégation, apportant un grand recul sur le programme de
calcul différentiel en général, de nombreuses remarques heuristiques et intuitives
ainsi que des exemples très pertinents traités en détail.
321
56. Théorème de stabilité de Liapounov
Questions.
1. Rappeler comment obtenir la décomposition d’un espace vectoriel de dimension
finie en somme de sous-espaces caractéristiques.
2. Justifier l’égalité etA xj = etλj et(A−λj In ) xj utilisée à la question a).
3. Détailler le calcul donnant la différentielle d’une forme quadratique.
4. Justifier que b est bien définie et que q est définie positive.
5. Montrer que le t0 défini en question c)(ii) satisfait q(y(t0 )) = α.
6. Justifier l’inégalité max16j6k kxj k 6 kxk, où x = x1 + · · · + xk est l’écriture
du vecteur x associée à la décomposition Cn = kj=1 Ej .
L
322
Calcul différentiel, équations différentielles et EDP
Γ = {x ∈ U : ∀i ∈ J1, pK , gi (x) = 0} .
Γ ∩ W = {π(z, φ(z)), z ∈ V } .
x1 p1 + . . . + xn pn = R.
Montrer que
∂u ∗ ∂u ∗ pi
∀i, j ∈ J1, nK , (x ) (x ) = .
∂xi ∂xj pj
323
57. Des extrema liés au consommateur
Correction.
a) Posons g = (g1 , . . . , gp ) ; on a alors Γ = {x ∈ U : g(x) = 0}. La matrice
jacobienne de g en a
∂g1 ∂g1
∂x1 (a) ··· ∂xn (a)
.. .. ..
Dg(a) = .
. .
∂gp ∂gp
∂x1 (a) ··· ∂xn (a)
est de rang p par hypothèse, donc on peut extraire de la famille (C1 , . . . , Cn ) de ses
vecteurs colonnes une famille libre à p éléments 12 (Cσ(n−p+1) , . . . , Cσ(n) ) pour une
certaine permutation σ de J1, nK. Notons à présent (e1 , . . . , en ) la base canonique
de Rn et considérons l’endomorphisme π ∈ L(Rn ) défini par π(ei ) = eσ(i) pour
tout i ∈ J1, nK ; alors π est bien une application de permutation des coordonnées.
Par ailleurs, on sait par construction que
∂g1 ∂g1
(a) · · · (a)
∂xσ(n−p+1) ∂xσ(n)
.. .. ..
J = .
. .
∂gp ∂gp
(a) · · · (a)
∂xσ(n−p+1) ∂xσ(n)
est inversible, or J est la matrice jacobienne dans la base canonique de Rp de
l’application partielle y 7→ g(π(α, y)) en β. Comme cette application s’annule en β,
le théorème des fonctions implicites donne alors l’existence d’un voisinage V de α
dans Rn−p , d’un voisinage W 0 de (α, β) = a0 dans π −1 (U ) ainsi que d’une fonction
φ : V → Rp de classe C 1 tels que
n o
x ∈ π −1 (U ) : g(π(x)) = 0 ∩ W 0 = (z, φ(z)) , z ∈ V 0 ,
324
Calcul différentiel, équations différentielles et EDP
puis
π −1 (Γ ∩ W ) = {(z, φ(z)), z ∈ V },
et enfin
Γ ∩ W = {π(z, φ(z)), z ∈ V }, (1)
ce qu’il fallait démontrer.
b) Si p = n, les dgi (a) forment une base de l’espace des formes linéaires sur Rn ,
donc df (a) s’exprime bien comme combinaison linéaire des dgi (a). On suppose
donc à présent que p < n. Comme le rang de la matrice Dg(a) est égal à p par
hypothèse, il suffit pour conclure de montrer que la matrice
!
Df (a)
Dg(a)
où Dx (g̃)(α, φ(α)) (resp. Dy (g̃)(α, φ(α))) est la matrice dans la base canonique
de Rn−p (resp. Rp ) de la différentielle de l’application x 7→ g̃(x, φ(α)) (resp. de
l’application y 7→ g̃(α, y)). On a φ(α) = β d’après la question a)(i) puisque
a = π(α, β) ∈ Γ ∩ W , donc l’équation (2) donne
325
57. Des extrema liés au consommateur
!
Df˜(a0 )
Le rang de est donc inférieur au rang minimal des matrices
Dg̃(a0 )
!
Dy f˜(a0 )
∈ Mp+1,p (R) et −Dφ(α) Ip ∈ Mp,n (R),
Dy g̃(a0 )
Dg̃(a0 ) = Dg(a) · Π.
que u(x) = 0 dès lors que l’une des coordonnées de x est nulle assurent que
si R > 0 on a x∗i > 0 pour tout i ∈ J1, kK. Les hypothèses du théorème des extrema
liés sont donc vérifiées avec p = 1, g1 : x 7→ ni=1 pi xi− R (dont la différentielle
P
n
en tout point est bien non nulle), f = u et U = R∗+ . On peut donc conclure
qu’il existe λ ∈ R tel que du(x∗ ) = λdg1 (x∗ ), c’est-à-dire tel que :
∂u ∗
∀i ∈ J1, nK , (x ) = λpi .
∂xi
Or λ ne peut être nul du fait des hypothèses sur les dérivées partielles de u, d’où
le résultat attendu.
Commentaires.
© La formulation de la question a) est assez lourde, mais l’idée qu’elle recouvre
est très simple : elle revient à montrer qu’à permutation des coordonnées près, Γ
est, au voisinage de a, le graphe d’une fonction de classe C 1 de Rn−p dans Rp .
Cette idée est plutôt naturelle puisqu’intuitivement, l’hypothèse de liberté des
différentielles dg1 (a), . . . , dgp (a) correspond au fait que les contraintes gi (x) = 0
ne sont pas redondantes et se traduisent bien par la perte de p degrés de liberté
par la variable x qui en possède initialement n.
13. Cela signifie que la somme disponible est entièrement utilisée. En effet, la consommation
d’une quantité supplémentaire de n’importe quel bien est toujours associée à un accroissement
de la satisfaction du consommateur, si bien que celui-ci consomme nécessairement l’intégralité de
son revenu lorsque son comportement est optimal.
326
Calcul différentiel, équations différentielles et EDP
∂u ∂u
TMSi,j =
∂xi ∂xj
p !⊥
⊃ Ker (ϕ)⊥ ,
\
Ker (ϕi )
i=1
327
57. Des extrema liés au consommateur
Or pour toute forme linéaire u ∈ L(Rn , R), l’orthogonal Ker (u)⊥ est la droite
Vect (u) : en effet, Ker (u)⊥ est constitué des formes linéaires sur Rn ayant le
même noyau que u, c’est-à-dire colinéaires à u. On déduit alors de (5) que
p
X
Vect (ϕ) ⊂ Vect (ϕi ),
i=1
ce qui conclut.
On procède alors à la démonstration du théorème des extrema liés. Soit v un
vecteur de l’espace Ta Γ = Ker (dg(a)) tangent à Γ au point a (on rappelle que
l’on note g = (g1 , . . . , gp )). Il existe alors ε > 0 et une courbe γ : ] − ε, ε[ → Γ de
classe C 1 telle que γ(0) = a et γ 0 (0) = v. En différenciant f ◦ γ en 0, on obtient
Questions.
1. Rappeler pourquoi le rang d’une matrice s’exprime à la fois comme son nombre
maximal de lignes linéairement indépendantes et comme son nombre maximal de
colonnes linéairement indépendantes.
2. Montrer que l’ensemble W = π(W 0 ) est bien un voisinage de a.
3. Justifier l’égalité π −1 (Γ) ∩ π −1 (W ) = {(z, φ(z)), z ∈ V }. Peut-on écrire l’éga-
lité f −1 (f (A)) = A pour toute application f ?
4. Justifier le passage de l’égalité
π −1 (Γ ∩ W ) = {(z, φ(z)), z ∈ V }
à l’égalité
Γ ∩ W = {π(z, φ(z)), z ∈ V }
dans la question a)(i).
328
Calcul différentiel, équations différentielles et EDP
5. Dans la question a)(ii), pourquoi suffit-il pour conclure de vérifier que le rang
de la matrice !
Df (a)
Dg(a)
est au plus égal à p ?
6. Justifier que si A et B sont des matrices réelles de formats compatibles, alors on
a rg(AB) 6 min(rg(A), rg(B)). Dans quel cas cette inégalité est-elle une égalité ?
7. Rappeler la définition de l’orthogonal d’un sous-espace de L(Rn , R) pour la
dualité. Si F1 et F2 sont des sous-espaces vectoriels de L(Rn , R), montrer que
F1 ⊂ F2 ⇒ F1⊥ ⊃ F2⊥
et que
(F1 ∩ F2 )⊥ = F1⊥ + F2⊥ .
ya
∇f2 (a)
xa x
329
57. Des extrema liés au consommateur
9. Utiliser le théorème des extrema liés pour déterminer le triangle d’aire maximale
ayant un périmètre p > 0 fixé.
Indication : on pourra utiliser la formule de Héron stipulant que l’aire A d’un
triangle ayant des côtés de longueur a, b, c ∈ R∗+ est égale à
1q 2
A= (a + b2 + c2 )2 − 2(a4 + b4 + c4 ).
4
10. En utilisant les fonctions f et g définies sur Rn+ par f : (x1 , . . . , xn ) 7→ ni=1 xi
Q
géométrique suivante :
n
!1 n
n
Y 1X
∀(x1 , . . . , xn ) ∈ Rn+ , xi 6 xi ,
i=1
n i=1
pour tout i ∈ J1, nK et tout vecteur hi ∈ Rn , puis évaluer cette égalité pour des
vecteurs hi bien choisis pour montrer que (v1 , . . . , vn ) est une famille orthonormale
de Rn et conclure.
12. Vérifier que les hypothèses du théorème des extrema liés sont bien satisfaites
dans la question b).
13. Si n = 2 et α, β ∈ R∗+ , calculer le panier de biens optimal dans le cas où u est
la fonction de Cobb-Douglas définie par :
∀x, y ∈ R, u(x, y) = xα y β .
Remarquer que la fraction du revenu allouée à chacun des deux biens est indépen-
dante de R.
14. Interpréter économiquement le fait que seul le prix relatif pi /pj intervienne
dans la détermination du panier de biens optimal à revenu donné. Cela implique-t-il
qu’un doublement des prix laisse le panier optimal de consommation inchangé ?
330
Calcul différentiel, équations différentielles et EDP
15. Montrer que si n = 2 et si le panier de biens optimal (x∗1 , x∗2 ) est une fonction
dérivable du prix relatif p = ppxy et de R, alors l’accroissement du niveau d’utilité
optimal associé à un relâchement infinitésimal de la contrainte budgétaire est λ,
c’est-à-dire que
∂u (x∗1 (p, R), x∗2 (p, R))
= λ.
∂R
Remarque : cette propriété vaut au multiplicateur de Lagrange λ le nom de shadow
value associée à l’allègement de la contrainte budgétaire. On voit alors pourquoi ce
multiplicateur est nul dans le cas d’une contrainte non saturée sous les hypothèses
du théorème de Kuhn-Tucker (voir commentaires suivant le Développement 41).
16. En écrivant la contrainte budgétaire sous la forme
R X pi
xj = − xi ,
pj i6=j pj
331
58. Théorème de Cauchy-Peano
a) Montrer qu’il existe des constantes a, b > 0 telles que le champ de vec-
teurs donné par (t, y) 7→ f (t, y) est borné sur [t0 , t0 + a] × B(y0 , b) par une
constante M , où B(y0 , b) désigne la boule fermée de centre y0 et de rayon b.
b) Soit F l’espace des fonctions z d’un intervalle I de R à valeurs dans Rn ,
qui sont M -lipschitziennes et telles que z(t0 ) = y0 . Pour z ∈ F, on définit
Z t
F (z) = max z(t) − y0 − f (s, z(s))ds .
t∈I t0
Montrer qu’il existe un choix de I non trivial tel que F est bien définie et
que z est solution de (1) si F (z) = 0.
c) Montrer que F est compact pour la topologie de la norme uniforme.
d) Montrer l’existence d’une solution locale au système initial à droite, i.e.
une fonction φ : [t0 , t0 + a] → Rn dérivable et telle que
(
φ0 (t) = f (t, φ(t)), pour tout t ∈ [t0 , t0 + a],
φ(t0 ) = y0 .
Ce développement est particulièrement adapté aux leçons sur les équations différen-
tielles ordinaires (220). Il se fonde sur l’approximation d’une solution éventuelle
à un système d’équations différentielles, en faisant une illustration de la leçon sur
les suites et séries de fonctions (241). Par ailleurs, l’essentiel de l’argument est de
traduire la recherche d’une solution du système en un problème de minimisation
d’une fonctionnelle continue sur un compact, rendant le développement pertinent
pour la leçon sur la compacité (203).
La preuve de l’existence de solutions extrémales en tout point dans le cas de la
dimension un est donnée en commentaire, et peut faire l’objet d’un développement
adapté aux leçons sur les extremums (219) ainsi que sur l’analyse des fonctions
d’une variable réelle (228). Enfin, l’application à la détermination des applications
de gradient de norme 1 proposée en commentaire peut également illustrer le
théorème de Cauchy-Peano dans le cadre de la leçon de calcul différentiel (215).
332
Calcul différentiel, équations différentielles et EDP
Correction.
a) L’ensemble Ω est ouvert, il existe donc a, b > 0 tels que [t0 , t0 + a] × B(y0 , b) est
inclus dans Ω. Ainsi, f est définie et continue sur le compact [t0 , t0 + a] × B(y0 , b).
En particulier, la continuité de f sur ce compact assure qu’il existe M > 0 tel que
est donc bien définie et continue sur un compact. On en déduit donc que son
maximum F (z) est bien défini.
Si F (z) = 0 alors, pour tout t ∈ I,
Z t
z(t) = y0 + f (s, z(s))ds,
t0
de sorte que z est dérivable sur I et est solution du système (1) sur I.
c) Nous allons vérifier les hypothèses du théorème d’Arzelà-Ascoli pour F :
• F est fermé pour la topologie uniforme (même simple). En effet, la M -
lipschitzianité est conservée par passage à la limite uniforme (même simple),
de même que la condition z(t0 ) = y0 .
• F est constitué de fonctions uniformément bornées (par b) par la question a).
• F est constitué de fonctions uniformément continues. En effet, soient ε > 0
et δ = ε/M . En utilisant la M -lipschitzianité on obtient que, pour toute
fonction f ∈ F et tous x, y ∈ I, on a
|x − y| 6 δ =⇒ kf (x) − f (x)k 6 M |x − y| 6 ε.
333
58. Théorème de Cauchy-Peano
Nous souhaitons prouver que F peut être arbitrairement petite sur F. Pour tout
entier k > 2 on introduit le problème approché
c c c
0
y (t) = f t − ,y t − si t ∈ t0 + , t0 + c ,
k k k
(2)
c
y(t) = y0 si t ∈ t0 , t0 + .
k
de sorte que les zk sont M -lipschitziennes. Ainsi, les zk sont dans F pour tout
entier k > 2.
Le minimum de F est donc inférieur aux F (zk ), pour tout k > 2. On obtient donc
par définition, pour tout t ∈ t0 , t0 + kc , que
Z t Z t
Mc
zk (t) − y0 − f (s, zk (s))ds = f (s, y0 )ds 6 ,
t0 t0 k
334
Calcul différentiel, équations différentielles et EDP
La fonction g est continue sur un voisinage de (−t0 , y0 ), de sorte que le problème (3)
admet une solution définie pour t ∈ [−t0 , −t0 + ε] pour un ε > 0 par la question
précédente. Autrement dit, avec le changement de variables t 7→ −t, on obtient
une solution au système (1) sur [t0 − ε, t0 ]. Pour un ε > 0 suffisamment petit, le
recollement d’une solution à droite yd sur [t0 , t0 + ε] et d’une solution à gauche yg
sur [t0 − ε, t0 ] est alors continu, car yg (t0 ) = y0 = yd (t0 ), et dérivable, car on a
yg0 (t0 ) = f (t, y0 ) = yd0 (t0 ). Cela fournit une solution sur [t0 − ε, t0 + ε].
Commentaires.
© Nous avons prouvé le théorème d’existence de Cauchy-Peano, donnant un critère
d’existence de solutions de systèmes d’équations différentielles ordinaires :
335
58. Théorème de Cauchy-Peano
∃M > 0, ∀f ∈ F, kf k 6 M ;
Nous proposons une preuve de ce fait, qui peut servir de développement alternatif
de niveau F, en admettant la version prouvée ci-avant. Cette conséquence illustre
très bien les raisonnements variationnels et peut être intégrée à la leçon 219 sur
les extremums ainsi qu’à la leçon sur les fonctions d’une variable réelle (228).
Considérons l’ensemble S des solutions de (1) sur l’intervalle I comme défini dans
le développement. Par le théorème de Peano prouvé ci-avant, il est non vide. De
plus, S ⊆ F qui est compact et S est fermé pour la topologie uniforme. Ainsi, S
est compact, et donc la fonctionnelle continue
Z t0 +c
I : φ ∈ S 7−→ I(φ) = φ(s)ds
t0
336
Calcul différentiel, équations différentielles et EDP
Il est aisé de vérifier que les valeurs prises par les fonctions ainsi que par les
dérivées à gauche et à droite sont égales en t2 , de sorte que ψ ∈ S. De plus, on
a φ+ 6 ψ sur tout I, et l’inégalité est stricte sur [t2 , t3 ] de sorte que I(φ+ ) < I(ψ),
contredisant la maximalité de φ+ , et achevant la preuve.
© Il s’agit d’un résultat propre à la dimension finie. En effet, pour tout espace
de Banach de dimension infinie il est possible de trouver un problème de Cauchy
défini par une fonction continue qui ne possède aucune solution locale. Dans
certains cas pathologiques, il se peut même que l’équation autonome x0 = f (x)
n’admette aucune solution locale.
© Peano avait de son temps déjà fourni un exemple pathologique ayant une infinité
de solutions en dimension 1. Il s’agit du problème
(
y 0 = 3y 2/3 ,
y(0) = 0.
On peut vérifier qu’il existe une infinité de solutions locales à ce système. Hormis
les solutions φ(t) = 0 et φ(t) = t3 , les solutions sont données par
3
(t − t1 )
si t < t1 ,
φ(t) = 0 si t1 6 t 6 t2 ,
(t − t )3 si t < t,
2 2
où pour t1 6 0 6 t2 .
© Une application originale et intéressante du théorème de Cauchy-Peano est de
montrer que toute application différentiable sur Rn qui admet un gradient de
norme constante est affine. Même si l’énoncé semble immédiat, il n’en est rien.
Donnons l’énoncé précis du résultat, en toute dimension n > 1 :
337
58. Théorème de Cauchy-Peano
∂f (yx (t))
= ∇f (yx (t)), yx0 (t) = k∇f (yx (t))k2 = 1.
∂t
En intégrant cette égalité entre 0 et t, on obtient
Comme yx est paramétré par la longueur d’arc, la longueur de yx ([0, t]) est t.
Ainsi, kyx (t) − xk = kyx (t) − yx (0)k 6 t. L’inégalité précédente est donc
nécessairement une égalité. Comme on a, pour tout s ∈ [0, 1],
on a aussi l’égalité pour s ∈ [0, 1]. Plus précisément, ∇f (syx (t) + (1 − s)x)
et yx (t) − x doivent être colinéaires et de même sens par le cas d’égalité de
l’inégalité de Cauchy-Schwarz. Donc, puisque k∇f (syx (t) + (1 − s)x)k = 1,
yx (t) − x
∇f (syx (t) + (1 − s)x) = .
kyx (t) − xk
yx (t)−x
En particulier pour s = 0, on obtient ∇f (x) = kyx (t)−xk , autrement dit
338
Calcul différentiel, équations différentielles et EDP
• Montrons que yx est une solution globale, i.e. définie sur tout Rn .
Pour tout compact K de R, il existe a < b tel que K ⊂ [a, b]. Alors, par
l’expression (5) on en déduit que, pour tout t ∈ K,
Ainsi, yx est bornée sur tout compact. Par le théorème des bouts, la
solution yx est donc définie sur tout R.
• Soit x0 ∈ Rn et Hx0 = x0 +∇f (x0 )⊥ l’hyperplan passant par x0 et orthogonal
à ∇f (x0 ). Montrons que f est constante sur Hx0 .
Soit t > 0 et z ∈ B(yx0 (t), t). Alors, comme précédemment, on a
Z 1
|f (yx0 (t)) − f (z)| 6 |h∇f (syx0 (t) + (1 − s)z, yx0 (t) − zi|ds
0
6 kyx0 (t) − zk 6 t.
Par l’inégalité triangulaire, on en déduit que f (z) > f (yx0 (t)) − t = f (x0 ).
Soit x ∈ Hx0 . Il existe une suite (zn )n∈N avec zn ∈ B(yx0 (n), n) pour tout
n > 0, qui converge vers x (voir figure ci-après). On déduit alors de l’inégalité
précédente que f (zn ) > f (x0 ) donc, par continuité de f , on a f (x) > f (x0 ).
n + 1 yx0 (n + 1)
•
yx0 (n)
zn •
Hx0 zn+1 • •
• •
x x0
Le même raisonnement avec t < 0 fournit une suite (zn )n∈N telle que, pour
tout n > 0, on a zn ∈ B(yx0 (−n), n) et qui converge vers x et f (zn ) 6 f (x0 )
donc f (x) 6 f (x0 ).
Donc on a f (x) = f (x0 ) pour x ∈ Hx0 . Ainsi, f est constante sur Hx0 .
• Soit x ∈ Rn . Comme yx0 décrit une droite dirigée par ∇f (x0 ) d’après
l’expression (5), il existe x0 ∈ Rn et t ∈ R tels que x ∈ Hyx0 (t) . Par le point
précédent, la fonction f est constante sur cet hyperplan. On a donc
En utilisant le fait que yx0 (t) − x0 est colinéaire à ∇f (x0 ) par (5), on a alors
339
58. Théorème de Cauchy-Peano
Questions.
1. Si (zn )n∈N est une suite de fonctions définies sur un segment I qui converge
uniformément vers z, montrer que maxI zn converge vers maxI z.
2. Montrer que toute fonction z solution de l’équation différentielle ordinaire (1)
est telle que F (z) = 0.
3. Justifier que le système (2) admet une unique solution telle que zk (t) reste
dans B(y0 , b) pour tout t ∈ I, et qui est donnée par les formules proposées.
Indication : faire une récurrence pour prouver la formule sur la partition t0 + ci/k
avec i ∈ J0, kK, puis faire un changement de variables.
4. Commenter les similarités et différences entre le théorème de Cauchy-Peano et
le théorème de Cauchy-Lipschitz.
5. L’équation différentielle xy 0 +y = arctan(x) admet-elle une solution au voisinage
de x = 0 ? Est-elle unique ?
340
Calcul différentiel, équations différentielles et EDP
On a donc
Y = F (K, L) = Lf (k),
K
où k := L représente la quantité de capital par tête dans l’économie.
a) Montrer que la quantité de capital par tête k est solution de l’équation
différentielle
k̇ = sf (k) − (α + δ)k. (1)
∀x > 0, f (x) = xβ
341
59. Modèle de croissance de Solow-Swan
Correction.
On rappelle que la notion de point d’équilibre d’un système dynamique et les
notions de stabilité afférentes sont définies à la page 310.
a) La fonction f est de classe C 2 puisque F l’est. Comme K et L sont dérivables
et comme L ne s’annule pas par hypothèse, k est dérivable et on a
K̇L − K L̇
k̇ =
L2
(sY − δK)L − KαL
=
L2
sY − δK − αK
=
L
= sf (k) − (α + δ)k,
ce qu’il fallait démontrer.
b) On vient de voir que k vérifie k̇ = g(k), où g est la fonction définie par
g : R∗+ −→ R
x 7−→ sf (x) − (α + δ)x.
Les points d’équilibre du système décrit par l’équation différentielle (1) sont donc
les points d’annulation de g.
Les hypothèses faites sur f assurent que la fonction g est deux fois dérivable
puisque f l’est, et que pour tout x ∈ R∗+ on a g 00 (x) = sf 00 (x) < 0. Par ailleurs, sa
dérivée g 0 est continue sur R∗+ , admet +∞ pour limite en 0 et −(α + δ) < 0 pour
limite en +∞. On obtient donc le tableau de variations suivant pour une certaine
valeur de x0 ∈ R∗+ , où les variations représentées sont strictes :
x 0 x0 +∞
+∞
g 0 (x) 0
−(α + δ)
g(x0 )
g(x)
0 −∞
342
Calcul différentiel, équations différentielles et EDP
y = (α + δ)x
y = sf (x)
•
k∗
y = g(x)
admet une limite ` ∈ ]0, k ∗ ] en +∞, mais alors k̇ admet g(`) pour limite en +∞
puisque g est continue, d’où g(`) = 0 (sans quoi k n’admettrait pas de limite finie
en +∞) et finalement ` = k ∗ .
Un raisonnement similaire permet de voir que si k(0) > k ∗ , alors k est strictement
décroissante et admet k ∗ pour limite en +∞. Ainsi, k converge vers k ∗ quelle que
soit la valeur de k(0) ∈ R∗+ , donc k ∗ est un équilibre attractif du système.
c) On sait que k est une solution strictement positive de l’équation différentielle
k̇ = sk β − (α + δ)k.
soit
ḣ = (1 − β)s − (1 − β)(α + δ)h.
s s
∀t > 0, h(t) = h(0) − e−(1−β)(α+δ)t + ,
α+β α+β
343
59. Modèle de croissance de Solow-Swan
d’où
1
∀t > 0, k(t) = h(t) 1−β
1
s s
1−β
−(1−β)(α+δ)t
= h(0) − e +
α+β α+β
1
s s
1 1−β
−(1−β)(α+δ)t
= k(0) 1−β − e + . (2)
α+β α+β
k(t)
k(0) = 1
k(0) = k ∗ = 0, 25
k(0) = 0, 15
t
Commentaires.
© Le modèle de Solow-Swan est un modèle de croissance économique créé en 1956
par l’économiste T.W. Swan à partir de la théorie de la croissance développée par
R. Solow. Il n’est pas conseillé de s’étendre sur la signification économique des
hypothèses sous-jacentes au modèle — et encore moins de les discuter ! — mais il
est appréciable de pouvoir répondre à quelques questions simples sur le sujet.
Plusieurs points appellent un commentaire :
• Le fait que la quantité de travail offerte croisse à un taux constant suggère
que le marché du travail n’est pas pris en compte dans ce modèle : la force
de travail disponible est proportionnelle au nombre d’individus présents dans
l’économie considérée, qui croît à taux constant.
344
Calcul différentiel, équations différentielles et EDP
• L’épargne réalisée par les agents à partir du revenu Y généré par la production
est égale à sY et entièrement réinvestie sous forme d’investissement, c’est-à-
dire d’acquisition de capital, ce qui explique la présence du terme sY dans
l’équation donnant K̇. On suppose donc qu’il n’existe pas de thésaurisation
des revenus ni d’investissements à l’étranger.
• L’existence d’un taux de dépréciation du capital signifie qu’à chaque période
infinitésimale, une partie du capital investi est perdu ; cet artéfact mathéma-
tique modélise à la fois l’usure du capital matériel (comme les machines ou
les locaux) et l’obsolescence du capital immatériel (comme les brevets ou les
logiciels). Une partie du capital acquis à chaque période ne sert donc qu’à
reconstituer le stock de capital amoindri par la dépréciation.
• Le fait que la fonction F soit homogène de degré 1 permet d’écrire l’égalité
F (K, L) = Lf (k) et de ramener le problème à l’étude d’une fonction à une
seule variable. Il signifie qu’une multiplication par un même coefficient des
quantités des deux facteurs productifs induit une augmentation proportion-
nelle de la production. Ce choix revient à faire l’hypothèse de rendements
d’échelle constants : pour un niveau de capital par tête donné, la production
d’une unité de biens supplémentaire par tête exige autant de ressources
lorsque l’économie produit déjà beaucoup de biens que lorsqu’elle en produit
peu.
Utiliser une fonction de production homogène de degré strictement inférieur
à 1 (resp. strictement supérieur à 1) aurait traduit l’existence de rendements
d’échelles décroissants (resp. croissants), c’est-à-dire l’idée selon laquelle à
niveau de capital par tête donné, la production d’une unité de biens supplé-
mentaire exige moins (resp. plus) de ressources lorsque l’économie produit
déjà beaucoup de biens que lorsqu’elle en produit peu. La production agricole
sur des terres de qualité décroissante exhibe par exemple des rendements
d’échelle décroissants, tandis que le secteur des télécommunications, caracté-
risé par des coûts fixes importants et des économies d’échelle dues au faible
coût marginal de l’utilisation des réseaux (c’est-à-dire le coût induit par
l’arrivée d’un utilisateur supplémentaire), exhibe par exemple des rendements
d’échelle croissants.
345
59. Modèle de croissance de Solow-Swan
Questions.
1. Montrer que sous les hypothèses faites sur f , toute solution maximale de
l’équation différentielle (1) définie en 0 est définie sur R+ tout entier.
2. Justifier que g(x) tend vers −∞ lorsque x tend vers +∞.
3. Montrer que la fonction f : x 7→ xβ introduite dans la question c) satisfait bien
les hypothèses de l’énoncé.
4. Proposer une méthode générale de résolution d’une équation différentielle de
Bernoulli, c’est-à-dire de la forme y 0 = a(t)y + b(t)y c , où a et b sont des fonctions
continues sur un intervalle de R et à valeurs dans R et où c ∈ R.
Indication : on pourra se débarrasser des cas triviaux c = 0 et c = 1 puis poser
z = y 1−c lorsque cela est possible, en justifiant soigneusement le raisonnement
utilisé.
5. Interpréter économiquement les hypothèses faites sur la fonction f .
6. Comment expliquer économiquement qu’une valeur de k trop élevée soit « au-
tomatiquement » ramenée vers k ∗ ?
7. Donner la forme explicite de F sous l’hypothèse faite dans la question c). En
supposant que le prix d’une unité de travail est w est que celui d’une unité de
capital est r (avec w, r ∈ R∗+ ), déterminer le couple (K0 , L0 ) de coût minimal
pour réaliser un niveau de production Y0 > 0 donné.
Indication : on pourra utiliser le théorème des extrema liés (présenté dans le
Développement 57) pour montrer que
βL0 r
=
(1 − β)K0 w
346
Calcul différentiel, équations différentielles et EDP
N N2
0
N = αN 1 − −β (2)
K γ2 + N 2
Correction.
On utilise dans le développement la notion de sous-solution d’une équation
différentielle, dont la définition est donnée à la page 312. La notion de point
d’équilibre d’un système différentiel, quant à elle, est définie à la page 310.
Avant d’entamer la lecture de ce qui suit, il est fortement conseillé de se reporter
aux commentaires qui font suite à la correction et donnent une interprétation
des modèles étudiés. On veillera à évoquer rapidement cette interprétation avant
toute présentation orale.
a) L’équation (1) satisfaitles hypothèses du théorème de Cauchy-Lipschitz car
x
la fonction x 7→ αx 1 − K est de classe C 1 sur R. Considérons donc la solution
maximale f de (1) issue de n0 et définie sur un intervalle maximal J ⊂ R ; on va
montrer que J contient R+ , ce qui permettra de conclure que n est bien définie.
347
60. Croissance logistique et prédation
Comme m n’explose pas sur J∩ ]0, +∞[, ce n’est pas non plus le cas de N , si bien
que R+ ⊂ J d’après le théorème d’explosion. Ainsi, N est bien définie sur R+
tout entier.
348
Calcul différentiel, équations différentielles et EDP
(ii) Les points d’équilibre du système (2) sont les solutions positives de l’équation
x x2
αx 1 − =β .
K γ 2 + x2
x x
α 1− =β .
K γ 2 + x2
Taux
x0 x1 x2 x3 K N
349
60. Croissance logistique et prédation
Commentaires.
© Faisons quelques commentaires sur le modèle de population logistique défini
par l’équation (1).
Commençons par interpréter le paramètre K. La population étudiée décroît
lorsqu’elle dépasse le seuil K, et son taux de décroissance est d’autant plus fort
n
que le rapport K est élevé. En revanche, elle croît si la population est inférieure
n
à K, et son taux de croissance est alors d’autant plus fort que le rapport K est
faible. Le paramètre K représente un seuil au-delà duquel l’environnement ne
permet plus à la population de grandir, que l’on peut interpréter comme une
quantité fixe de ressources disponibles (nourriture, espace, proies, biens communs,
etc.). C’est l’apport principal du modèle logistique, dans lequel les membres de
la population sont en compétition pour l’accès à ces ressources : le fait que la
croissance de la population ralentisse lorsque celle-ci tend vers K par valeurs
inférieures rend alors compte du fait que la pression compétitive augmente avec
la saturation de la contrainte de ressources.
On peut proposer une grande variété d’interprétations de l’équation (1) selon les
cas étudiés ; on peut par exemple remarquer que le nombre d’interactions possibles
entre des individus d’une population de taille n est de l’ordre de n2 , ce qui rend
la présence d’un terme en −n2 dans l’équation (1) légitime dans un modèle de
population avec compétition, que cette dernière soit ou non liée à une contrainte
de ressources. On utilise aussi le modèle logistique pour décrire l’évolution d’une
épidémie au sein d’une population dans laquelle un grand nombre d’infections
conduit à une réduction du nombre d’individus susceptibles d’être contaminés
et donc à un ralentissement de la propagation de l’épidémie (voir le modèle SIS
présenté dans le Développement 61).
K•
α=2
α=1
α = 0, 5
n0 •
350
Calcul différentiel, équations différentielles et EDP
Questions.
1. Détailler l’argument permettant d’affirmer dans la question a) que f est
strictement positive si n0 > 0.
2. Proposer une méthode générale de résolution d’une équation différentielle de
Bernoulli, c’est-à-dire de la forme y 0 = a(t)y + b(t)y c , où a et b sont des fonctions
continues sur un intervalle de R et à valeurs dans R et où c ∈ R.
Indication : on pourra se débarrasser des cas triviaux c = 0 et c = 1 puis poser
z = y 1−c lorsque cela est possible, en justifiant soigneusement le raisonnement
utilisé.
14. Dans le cadre d’un modèle malthusien, ce taux est défini comme la différence entre le
taux de natalité et le taux de mortalité intrinsèques de la population. L’inaptitude d’un tel
modèle à rendre compte de manière endogène de l’effet de l’environnement sur les dynamiques de
populations est ce qui a conduit Pierre François Verhulst à proposer en 1840 le modèle logistique
que nous étudions ici.
351
60. Croissance logistique et prédation
N2
β γ 2 +N 2
β=1
0, 5
γ = 0, 2
γ = 0, 5
γ=1
0, 2 0, 5 1 N
3. Pourquoi une solution maximale de (2) est-elle définie sur un intervalle ouvert ?
4. Esquisser la preuve du théorème d’explosion.
5. Justifier que n et N sont bien définies sur R+ en utilisant le théorème d’existence
de solutions globales d’équations différentielles associées à des champs de vecteurs
à croissance au plus linéaire.
6. Avec les valeurs numériques données dans la question b)(ii), quel est le com-
portement asymptotique d’une solution issue de 0, 01 ? de 1, 99 ? de 2, 01 ? de
K = 10 ? de 1000 ?
352
Calcul différentiel, équations différentielles et EDP
Correction.
La notion de point d’équilibre du système (2) est définie à la page 310. Par
ailleurs, on utilise dans le développement la notion de sous-solution d’une équation
différentielle, dont la définition est donnée à la page 312.
a) On considère que chaque individu infecté de la population entreprend un
contact infectieux avec un autre individu choisi au hasard dans la population
à un taux temporel β, ce qui occasionne entre les temps t et t + dt un nombre
d’interactions infectieuses entre des individus infectés et des individus sains
proportionnel à βI(t) S(t)
N dt. Dans cette équation, le facteur β traduit à la fois la
fréquence des contacts entrepris entre les individus et la proportion (déterministe
ou statistique) des contacts entre individus sains et individus infectés qui donne
lieu à l’infection de nouveaux individus. Par ailleurs, la guérison des individus
infectieux intervient à taux γ : une fraction γdt des I(t) individus infectés au
15. En 0, cette équation différentielle est à comprendre au sens de la dérivée à droite.
353
61. Modèle épidémiologique SIS
temps t redevient saine en une unité de temps infinitésimale dt, ce que traduit la
présence du terme γI(t) dans l’expression de Ṡ(t). On peut d’ailleurs réécrire le
système différentiel de façon plus symétrique sous la forme
Ṡ = γI − β IS
N
(2)
˙ IS
I=β N − γI,
dans laquelle les deux lignes sont bien sûr équivalentes puisque I := N − S.
Le modèle SIS introduit ici est l’un des deux 16 modèles mécanistes élémentaires les
plus communs en épidémiologie. Il rend compte de la dynamique épidémiologique
au sein de la population par le passage des individus d’un statut sanitaire à l’autre,
représenté comme un « déplacement entre deux compartiments », ce qui lui vaut
le nom de modèle compartimental. La dynamique modélisée est schématisée sur la
Figure 2.11.
S I
b) Soit s0 ∈ [0, N ]. On cherche à montrer que (1) admet une unique solution S
vérifiant S(0) = s0 définie sur R+ tout entier, et que S (et donc I) est bien à
valeurs dans [0, N ].
La fonction
F : R −→ R
−s)s
s 7−→ γ(N − s) − β (N N
étant de classe C 1 , l’équation différentielle (1) admet une unique solution maxi-
male f vérifiant f (0) = s0 d’après le théorème de Cauchy-Lipschitz. On note J
son intervalle de vie, et on cherche à montrer que f est à valeurs dans [0, N ] et
que l’on a R+ ⊂ J, ce qui impliquera que S est bien définie et à valeurs dans
[0, N ] en tant que restriction de f à R+ .
Comme la fonction constante égale à N est solution de l’équation différentielle
autonome (1) et comme f (0) = s0 6 N , on a f (t) 6 N pour tout t ∈ J ∩ R+
d’après le résultat d’unicité du théorème de Cauchy-Lipschitz. Par ailleurs, f est
à valeurs positives sur R puisque la fonction nulle est une sous-solution de (1)
et f (0) = s0 > 0. On a donc f (t) ∈ [0, N ] pour tout t ∈ J ∩ R+ , si bien que J
contient R+ tout entier d’après le théorème d’explosion.
16. L’autre est le modèle SIR, présenté dans le Développement 62.
354
Calcul différentiel, équations différentielles et EDP
réel x ∈ [0, N ], si bien que S est croissante sur I d’après l’équation (1).
Elle admet donc en +∞ une limite réelle ` ∈ [0, N ], ce qui implique que sa
dérivée tend vers (N − `)(γ − β N` ) d’après (1). Or ce dernier réel ne peut
être que nul puisque S est bornée ; on a donc ` = N ou ` = βγ N , ce dernier
cas étant impossible puisque βγ N > N . Ainsi, S tend vers N en +∞, ce qui
montre que N est un point d’équilibre asymptotiquement stable du système :
l’attraction par ce point d’équilibre a lieu quelle que soit la condition initiale
dans [0, N ].
Notons que l’hypothèse γ > β revient à dire que le taux de rémission est plus
important que le taux d’infection, ce qui est intuitivement conforme avec le
phénomène d’extinction asymptotique de la maladie à long terme.
• Si γ 6 β, la quantité (N − x) γ − β Nx est positive si x ∈ [0, βγ N ] et négative
355
61. Modèle épidémiologique SIS
0 N y = (N − x) γ − β Nx
y = (N − x) γ − β Nx
0 γ
N
βN
Figure 2.12 – Illustration sur [0, N ] du flot associé à l’équation différentielle (1)
dans le cas γ > β (en haut) et dans le cas γ 6 β (en bas).
g : [0, N [ −→ R
x 7−→ (N −x) 1γ−β x
( N)
G : [0, N [ −→ R
1
x 7−→ β−γ ln(N − x) − ln βγ N − x .
∀t ∈ R+ , G ◦ S(t) = t + α. (4)
356
Calcul différentiel, équations différentielles et EDP
1 − βγ e(β−γ)(t+α)
∀t ∈ R+ , S(t) = N
1 − e(β−γ)(t+α)
γN − βS(0) − γ(N − S(0))e(β−γ)t
= N.
γN − βS(0) − β(N − S(0))e(β−γ)t
Comme γ > β, on retrouve bien le fait que S converge vers N .
• Supposons à présent que β > γ. La fonction rationnelle g définie par la
même expression que dans le cas précédent sur [0, N [ \{ βγ N } admet la même
décomposition en éléments simples et possède donc
G : [0, N [ \{ βγ N } −→ R
x 7−→ 1
β−γ ln(N − x) − ln x − βγ N
pour primitive sur [0, βγ N [ et sur ] βγ N, N ]. Or S est à valeurs dans [0, βγ N [ ou
à valeurs dans ] βγ N, N [, si bien que G ◦ S est bien définie, dérivable sur R+
et de dérivée égale à 1 d’après (3). L’équation (4) est donc toujours valable
pour un certain α ∈ R.
Si S(0) < βγ N , le même raisonnement que dans le cas précédent donne
G : [0, N [ −→ R
N 1
x 7−→ ,
β N −x
et on a (G ◦ S)0 = 1 d’après l’équation (3). Il existe donc α ∈ R tel que
∀t ∈ R+ , G ◦ S(t) = t + α,
N N
S(t)
γ S(t)
βN
I(t)
S(0) I(t) S(0)
N S(t)
S(0) I(t)
Figure 2.13 – Courbes représentatives des fonctions S et I dans les cas γ > β
(en haut à gauche), γ < β (en haut à droite) et γ = β (en bas).
358
Calcul différentiel, équations différentielles et EDP
Commentaires.
© On pourra omettre la question d) dans le cas où le développement n’est pas
présenté comme une illustration des méthodes de calcul d’intégrales (leçon 236).
Le cas échéant, on veillera malgré tout à bien comprendre la stratégie adoptée
dans la détermination explicite de S pour pouvoir répondre à une éventuelle
question.
© Dans le cas où la question c) est présentée, on pourra raccourcir considérable-
ment la présentation de la question a).
© Dans le cas où β > γ, l’équation (1) se réécrit sous la forme
β γ
I˙ = I N 1 − −I
N β
et l’évolution de I est alors décrite par un modèle de croissance logistique avec
une capacité N (1 − βγ ) (voir le Développement 60). On retrouve la forme caracté-
ristique de la courbe de I lorsque I(0) prend une valeur faible, comme l’illustre
la Figure 2.14. Dans ce cas, l’épidémie croît d’abord de manière exponentielle
(ce qui correspond à un développement malthusien au sein d’une population
principalement constituée d’individus susceptibles), puis ralentit jusqu’à rejoindre
un seuil correspondant à une proportion d’infectés trop forte pour que le nombre
des contaminations instantanées surpasse celui des rémissions.
γ
βN
S(t)
γ
I(t)
1− β N
359
61. Modèle épidémiologique SIS
d’équilibre RR0 −1
0
N associé à une quantité d’individus infectieux non nulle,
appelé équilibre endémique du système. Ce point d’équilibre est alors asymp-
totiquement stable.
© Le modèle SIS modélise de façon adéquate des populations non structurées avec
des contacts homogènes dans lesquelles se propage un pathogène contre lequel les
individus remis ne développent pas d’immunité de long terme, comme le rhume
ou la grippe.
© Le modèle SIS présenté ici a été décliné en de multiples versions depuis sa
formulation initiale par Kermack et McKendrick dans les années 1920. Les modèles
déterministes ainsi obtenus correspondent notamment à l’introduction de nouveaux
compartiments représentant des statuts sanitaires non binaires (par exemple le
compartiment R des individus remis et immunisés ou le compartiment E des
individus en période d’incubation) ou à la structuration de la population en
sous-groupes induisant des structures de contact complexes.
© Dans le cas où la guérison des individus infectés est impossible, c’est-à-dire le
cas γ = 0, le modèle SIS est appelé modèle SI.
© Le modèle SIS admet un analogue stochastique construit sur des processus
de Poisson d’intensités β et γ, dans lequel les individus, en nombre fini et fixé,
changent de compartiment à un taux aléatoire dépendant de leur statut sanitaire
actuel et de leur exposition à la maladie. Dans ce modèle, l’extinction de la maladie
à long terme survient avec probabilité 1 pour peu que γ > 0, mais on observe un
phénomène de seuil : si R0 6 1, l’extinction a lieu en un temps relativement court
et qui ne tend pas vers l’infini avec N (on parle d’épisode épidémique mineur),
tandis que si R0 > 1, avec une probabilité strictement positive la maladie s’étend
à une proportion non nulle de la population et s’éteint en un temps en moyenne
proportionnel à N ln(N ) (on parle alors d’épisode épidémique majeur).
© On consultera utilement le Développement 62 pour acquérir un recul supplé-
mentaire sur les modèles compartimentaux.
Questions.
1. Illustrer graphiquement le raisonnement permettant d’établir le fait que la
solution maximale de (1) est à valeurs dans [0, N ] dans la question a).
2. Détailler l’argument permettant de montrer que S ne peut prendre la valeur N
si elle n’est pas constante.
3. Donner une démonstration du fait que S est positive qui n’utilise pas la notion
de sous-solution.
4. Représenter le cas γ = β non traité dans la Figure 2.12.
5. Détailler les décompositions en éléments simples réalisées dans la question c).
6. Définir un modèle SIS probabiliste à temps discret sous la forme d’une chaîne
de Markov, puis étudier un tel modèle.
360
Calcul différentiel, équations différentielles et EDP
H : R+ −→ R
R(t)
x 7−→ S(t) exp βγ N .
β R∞
(N − R∞ ) exp = S(0).
γ N
Correction.
On utilise dans le développement la notion de sur-solution d’une équation diffé-
rentielle, dont la définition est donnée à la page 312.
a) On considère que chaque individu infecté de la population entreprend un
contact infectieux avec un autre individu choisi au hasard dans la population
à un taux temporel β, ce qui occasionne entre les temps t et t + dt un nombre
361
62. Modèle épidémiologique SIR
IS
Ṡ
= −β N
I˙ = β IS
N − γI (2)
Ṙ = γI.
S β I γ R
F : R2 −→ R 2
is is
(s, i) 7−→ −β , β − γi
N N
362
Calcul différentiel, équations différentielles et EDP
Remarquons d’emblée que comme f (0), g(0) ∈ ]0, N [, par continuité de (f, g) on a
τ > 0, et f et g sont à valeurs dans ]0, N [ 2 sur ]0, τ [.
On sait que (f + g)0 = −γg, donc f + g est strictement décroissante sur [0, τ ], si
bien que (f + g)(τ ) < N et donc f (τ ) < N et g(τ ) < N puisque f > 0 et g > 0.
Par ailleurs, on a f 0 = −βf Ng donc f est une sur-solution de l’équation différentielle
y 0 = −βy sur ]0, τ [ ; on en déduit que f (t) > s0 e−βt > 0 pour tout t ∈ [0, τ ], donc
en particulier que f (τ ) > 0.
Enfin, comme g 0 = β fNg − γg, la fonction g est une sur-solution de l’équation
différentielle g 0 = −γg sur ]0, τ [, donc g(t) > i0 e−γt pour tout t ∈ [0, τ ], et en
particulier g(τ ) > 0.
Ainsi, (f, g)(τ )∈ ]0, N [ 2 , ce qui contredit le fait que (f, g) soit continue et ]0, N [ 2
ouvert. La solution (f, g) est donc bien à valeurs dans le pavé ]0, N [ 2 sur J ∩ R∗+ .
Comme (f, g) est à valeurs dans ]0, N [ 2 sur J ∩ R∗+ , le théorème d’explosion
implique bien que l’intervalle de vie J contient R+ tout entier, ce qui permet de
définir de manière unique les restrictions S et I de f et g à R+ . On a par ailleurs
montré que f et g (et donc S et I) sont à valeurs positives sur R+ . Enfin, pour
prouver que S + I 6 N , il suffit d’appliquer à nouveau l’argument selon lequel
l’égalité (f + g)0 = −γg < 0 implique que f + g est décroissante sur R+ et donc
que S + I est à valeurs inférieures à S(0) + I(0) = s0 + i0 6 N .
363
62. Modèle épidémiologique SIR
Commentaires.
© On pourra à l’envi raccourcir la présentation heuristique effectuée dans la
question a) pour libérer le temps nécessaire à l’exposé de la question b), riche en
arguments analytiques simples mais précis.
© Il est utile d’étudier le Développement 61 ainsi que les commentaires et les
questions qui le suivent pour acquérir davantage de recul sur les modèles épidé-
miologiques compartimentaux et se préparer à satisfaire la curiosité du jury.
© Contrairement au cas du processus SIS décrit dans le Développement 61, le
comportement asymptotique du processus SIR ne présente pas de phénomène de
seuil, et l’équation (4) montre que R∞ est une fonction strictement croissante et
continue du rapport R0 := βγ , appelé nombre de reproduction de base.
364
Calcul différentiel, équations différentielles et EDP
0 N s
Questions.
1. Supposons que (i0 , s0 ) ∈ ]0, N [2 avec i0 + s0 6 N . La solution maximale (f, g)
étudiée dans la question b) est-elle à valeurs dans ]0, N [ sur J tout entier ?
2. Détailler l’utilisation faite dans la question b) du résultat sur les sur-solutions
exposé à la page 2.
3. Quelle est la taille finale de l’épidémie si S(0) = N ?
4. Dans le modèle SIR, montrer que I est décroissante sur R si et seulement si
on a βS(0) − γ 6 0, et que dans le cas contraire le maximum de I est atteint à
l’unique temps t > 0 tel que S(t) = βγ .
365
62. Modèle épidémiologique SIR
N
S(0)
S(t) R(t)
I(t)
I(0)
366
Calcul différentiel, équations différentielles et EDP
(E) x0 = x2 − t.
a) Montrer que (E) admet des solutions maximales et qu’elles sont de classe C ∞
sur leur intervalle de définition.
On suppose donnée une solution maximale (x, I) de (E), définie sur un
intervalle I = ]a, b[ où −∞ 6 a < b 6 +∞.
b) Montrer que x admet au plus un point critique et au plus un point
d’inflexion. En déduire que x et x0 sont strictement monotones aux voisinages
de a et de b dans I.
c) Montrer que a > −∞. En déduire que x(t) → −∞ ainsi que x0 (t) → +∞
lorsque t → a+ .
d) Montrer que si b < +∞, alors x est croissante et x admet un unique point
d’inflexion.
e) Montrer que si x est croissante, alors x est une bijection de I dans R.
f) Montrer que si x admet un point critique, alors b = +∞, x admet un
unique point d’inflexion, et on a le développement asymptotique
√
1
x(t) = − t + o √ lorsque t → +∞.
t
Ce développement est un choix évident pour la leçon 220. La forte présence des
propriétés des fonctions d’une variable réelle (théorèmes des valeurs intermédiaires,
de Rolle, de la bijection, et de la limite monotone) le rendent aussi pertinent pour
illustrer les leçons 228 et 229.
La correction qui suit est inspirée d’une réponse d’Alain Tissier publiée dans la
Revue de la Filière Mathématiques [Tis10].
Correction.
Le développement repose essentiellement sur le théorème d’explosion et sur le
lemme suivant :
367
63. Étude qualitative d’une équation de Riccati
x0 = x2 − t, (1)
00 0
x = 2xx − 1, (2)
000 02 00
x = 2x + 2xx . (3)
x0 (u)
Z c
du > c − t.
t x(u)2 + ω 2
1 x(c) x(t)
arctan − arctan > c − t.
ω ω ω
Alors ωπ > c − t, ce qui est absurde lorsque t → −∞. On en déduit que a > −∞
et, par le théorème des bouts, la limite de x en a+ ne peut être finie. D’après (1),
on a donc x0 (t) → +∞ puis x(t) → −∞ lorsque t → a+ .
d) Supposons b < +∞. La question b) garantit que x est monotone au voisinage
de b− , donc admet une limite ` en b− (par le théorème de la limite monotone).
Or b est fini donc le théorème des bouts assure que ` est infinie. Mais alors on
a x0 (t) = x(t)2 − t → +∞ lorsque t → b− . D’après notre réponse à la question b),
la solution x est donc croissante. Ainsi ` = +∞, d’où limt→b− x00 (t) = +∞
d’après (2) et limt→a+ x00 (t) = −∞ d’après c). Grâce au théorème des valeurs
intermédiaires, x admet un point d’inflexion, qui est unique d’après b).
368
Calcul différentiel, équations différentielles et EDP
Commentaires.
© Une étude qualitative d’équation différentielle consiste à déterminer les pro-
priétés de solutions non connues explicitement, telles que leur existence et leur
unicité, leur domaine de définition, leur comportement au bord du domaine, etc.
© Les équations de Riccati sont les équations différentielles ordinaires non linéaires
de la forme x0 = ax2 + bx + c où a, b, c sont des fonctions de t (ici a(t) = 1,
b(t) = 0 et c(t) = −t). On les rencontre par exemple en physique quantique, en
électronique ou encore en mathématiques financières. Elles n’admettent en général
pas de solution explicite. Dans le cas présent, on peut exprimer toutes les solutions
de (E) à l’aide des fonctions d’Airy de première et seconde espèces A et B (voir
les questions ci-après).
© Démontrons le lemme énoncé en début de correction.
Si α ∈ I est un zéro de f , alors f 0 (α) 6= 0 et donc f (t) ∼ (t − α)f 0 (α) lorsque
t → α. Ainsi, les zéros de f sont isolés, donc f est strictement positive au voisinage
de α+ et f est strictement négative au voisinage de α− . Si α < β sont deux zéros
consécutifs, alors f (t) ∼ (t−α)f 0 (α) > 0 lorsque t → α+ et f (t) ∼ (t−β)f 0 (β) < 0
lorsque t → β − , donc d’après le théorème des valeurs intermédiaires f s’annule
sur ]α, β[, ce qui est absurde. Ainsi, f s’annule au plus une fois. Le signe de f
découle aussi du théorème des valeurs intermédiaires.
© Les questions c), d), e), et f) ne couvrent pas tous les cas : par exemple, ils
ne permettent pas de savoir s’il existe à la fois des solutions maximales avec
369
63. Étude qualitative d’une équation de Riccati
b < +∞ et des solutions avec b = +∞, et s’il existe même des solutions croissantes
avec b = +∞ (donc sans point critique ni point d’inflexion). Ces points sont plus
délicats à traiter, mais une discussion complète peut être achevée en répondant
aux questions 4, 5, 6, et 7 ci-après.
© On pourra résumer l’étude qualitative comme sur la Figure 2.18 : les courbes
intégrales sont issues de −∞ depuis une abscisse réelle et traversent la parabole
d’équation t = x2 au plus une fois ; elles sont strictement croissantes à l’extérieur
de celle-ci et décroissantes à l’intérieur.
x
x0 = 0
x0 > 0
x0 < 0
Questions.
1. Énoncer (et démontrer sommairement) le théorème de Rolle et sa variante
asymptotique.
2. Énoncer (et démontrer sommairement) le théorème dit « d’explosion » (aussi
appelé théorème des bouts, ou théorème de sortie de tout compact) invoqué pour
répondre aux questions c), d) et e).
3. Montrer que si w est une solution strictement positive de l’équation différentielle
370
Calcul différentiel, équations différentielles et EDP
371
64. Modèle de Lotka-Volterra
372
Calcul différentiel, équations différentielles et EDP
Correction.
La Figure 2.19 représente le champ de vecteurs associé au système (1) ainsi que
les quatre zones que nous définirons dans la réponse à la question b).
Zone 4 Zone 3
a
b
Zone 1 Zone 2
c x
d
La notion de point d’équilibre du système (1) est définie à la page 310. Par ailleurs,
on utilisera dans la correction ci-après la notion de sous-solution d’une équation
différentielle, dont la définition est donnée à la page 312.
a) Étude théorique du système.
(i) La fonction
F : R2 −→ R2
(u, v) 7−→ (au − buv, −cv + duv)
373
64. Modèle de Lotka-Volterra
système (1) pour une condition initiale donnée résultent du théorème de Cauchy-
Lipschitz. Notons (f, g) l’unique solution maximale de (1) vérifiant (f, g)(0) =
(x0 , y0 ), définie sur un intervalle I nommé intervalle de vie de la solution. On va
montrer que f et g sont positives et que l’intervalle de vie I contient R+ tout
entier. L’existence de x et y en découlera, et leur unicité sera alors une simple
conséquence de celle de (f, g).
On remarque tout d’abord que pour tout α ∈ R, la fonction t 7→ (αeat , 0) est une
solution de (1) définie sur R. Ceci implique que R∗+ × {0}, {0} × {0} et R∗− × {0}
sont des trajectoires du système (correspondant respectivement aux cas α > 0,
α = 0 et α < 0). Il en va de même pour les ensembles {0} × R∗+ et {0} × R∗− ,
qui sont les trajectoires respectives de t 7→ (0, αe−ct ) et t 7→ (0, −αe−ct ) pour
n’importe quel α > 0.
Si y0 = 0, alors (f, g) coïncide sur I avec la fonction t 7→ (x0 eat , 0) d’après la
propriété d’unicité issue du théorème de Cauchy-Lipschitz. Pour la même raison,
si x0 = 0 alors (f, g) coïncide sur I avec la fonction t 7→ (0, y0 e−ct ). Ces solutions
sont définies sur R tout entier, donc on a dans ce cas I = R, et évidemment f > 0
et g > 0.
Supposons à présent que x0 > 0 et y0 > 0. On a vu que tout point de l’axe
des abscisses ou des ordonnées se trouve sur la trajectoire d’une solution de
l’équation(1) définie sur R et prenant toutes ses valeurs sur cet axe. Comme
l’équation différentielle (1) est autonome, la trajectoire de (f, g) ne peut couper
l’axe des abscisses ni celui des ordonnées d’après le théorème de Cauchy-Lipschitz,
d’où f > 0 et g > 0 par le théorème des valeurs intermédiaires.
On veut maintenant montrer que R+ ⊂ I. Pour ce faire, on va majorer f et g
sur I ∩ R+ et en déduire qu’elles n’explosent pas en temps fini. Comme f et g
sont strictement positives, on a f 0 (t) < af (t) pour tout t ∈ I ∩ R+ (puisque
f 0 = af − bf g), donc f est une sous-solution de l’équation y 0 = ay. On a donc :
En revenant à l’équation (1), on obtient g 0 (t) < dx0 eat g(t) pour tout t dans
l’intersection I ∩ R+ , d’où, comme g > 0 :
g 0 (t)
∀t ∈ I ∩ R+ , < dx0 eat .
g(t)
En intégrant cette inégalité entre 0 et t pour tout t ∈ I ∩ R+ , on obtient
d
∀t ∈ I ∩ R+ , ln(g(t)) − ln(y0 ) < x0 (eat − 1),
a
et donc
d
∀t ∈ I ∩ R+ , g(t) < y0 exp x0 (eat − 1) .
a
Le terme de droite de cette inégalité est borné sur tout compact de R+ en tant
que fonction de t ; d’après le théorème d’explosion, I contient donc bien R+ tout
entier.
374
Calcul différentiel, équations différentielles et EDP
On trouve sans peine les deux points d’équilibre (0, 0) et dc , ab (le deuxième point
des quatre zones fermées représentées sur la Figure 2.19, et l’on suppose (sans
perte de généralité, comme on le verra dans la démonstration suivante) que (x0 , y0 )
se situe dans la zone 1. On va montrer successivement que :
(A) t1 := inf{t > 0 : (x, y)(t) est dans la zone 2} est bien défini,
(B) t2 := inf{t > t1 : (x, y)(t) est dans la zone 3} est bien défini,
(C) t3 := inf{t > t2 : (x, y)(t) est dans la zone 4} est bien défini,
(D) t4 := inf{t > t3 : (x, y)(t) est dans la zone 1} est bien défini,
(E) t5 := inf{t > t4 : (x, y)(t) est dans la zone 2} est bien défini,
(F ) (x, y)(t5 ) = (x, y)(t1 ),
ce qui permettra de conclure que (x, y) est (t5 − t1 )-périodique grâce au résultat
d’unicité du théorème de Cauchy-Lipschitz.
Si (x, y) était uniquement à valeurs dans la zone 1 sur I ∩ R+ , alors x et y seraient
bornées et strictement monotones donc convergeraient vers des limites respectives
x∞ et y∞ , telles que (x∞ , y∞ ) soit dans la zone 1. Mais alors (1) impliquerait
aussi la convergence de x0 et y 0 vers une limite, d’une part nécessairement nulle
pour que la convergence de x et y soit assurée, et d’autre part égale à F (x∞ , y∞ ).
c a
On aurait donc soit (x∞ , y∞ ) = (0, 0) soit (x∞ , y∞ ) = d , b , ce qui est impossible
compte tenu de la stricte monotonie supposée de x et y. La fonction (x, y) quitte
donc la zone 1 en temps fini, et un simple argument de monotonie permet de voir
qu’elle entre alors dans la zone 2, ce qui établit (A).
Dans la zone 2, x et y sont croissantes et y est bornée. Si (x, y) était à valeurs
dans la zone 2 pour tout t > t1 , l’équation (1) impliquerait alors que x est
375
64. Modèle de Lotka-Volterra
bornée (sans quoi x et y 0 tendraient vers +∞, ce qui contredit le fait que y est
bornée), et un raisonnement de convergence similaire à celui que nous venons
de présenter permettrait d’aboutir à une contradiction. On en déduit que (x, y)
quitte nécessairement la zone 2 pour la zone 3 en temps fini, d’où le point (B).
On prouve (C), (D) et (E) de la même façon.
Démontrons à présent (F ) : par continuité de x, on a x(t1 ) = x(t5 ) = dc d’après le
théorème des valeurs intermédiaires. Or on sait grâce à la question b)a)(i) que
H (x(t1 ), y(t1 )) = H (x(t5 ), y(t5 )), d’où
Mais on sait aussi que y(t1 ), y(t5 )∈ 0, ab et on montre aisément que la fonction
376
Calcul différentiel, équations différentielles et EDP
Commentaires.
© La Figure 2.19 peut être reproduite en annexe du plan et servir de support de
raisonnement pour les questions a) et b). On pourra ainsi grandement raccourcir
la correction de la question a)(i) en traçant les demi-droites qui sont des courbes
intégrales et que les solutions de (1) ne peuvent donc traverser.
© On peut utiliser une méthode alternative pour démontrer que les fonctions f
et g sont définies sur R+ tout entier dans la question a)(i). Cette méthode
consiste à établir par anticipation le résultat de la question a)(i). En définissant
la fonction H comme dans l’énoncé, on montre comme dans la question a)(i) que
la fonction t 7→ H(f (t), g(t)) est bien définie et constante sur I ∩ R+ . Il est par
ailleurs facile de montrer que
ce qui contredit le fait que t 7→ H(f (t), g(t)) est constante. On en déduit donc
que β = +∞, ce qui implique que I contient R+ tout entier.
© La fonction H définie dans l’énoncé permet d’étudier le comportement de
la solution (x, y) sans disposer de forme explicite pour cette solution. Dans la
deuxième méthode présentée pour traiter la question a)(i), on fait un usage crucial
du fait que H « tend vers l’infini en l’infini » (au sens de (R∗+ )2 ), qui explique que
(x, y) ne peut exploser en temps fini puisque ce n’est pas le cas de H(x, y). Ce
raisonnement est classique dans l’étude des systèmes dynamiques ; dans ce cadre,
une fonction jouant le rôle de H est appelée fonction de Liapounov.
© Il n’est pas inutile de s’interroger sur la démarche de modélisation adoptée.
La population des proies possède un taux de croissance autonome 18 a, et sa
décroissance instantanée due à la prédation est égale à −bxy. Ce dernier point
signifie que l’on suppose le nombre de rencontres entre proies et prédateurs
proportionnel à chacune des deux populations ; une telle modélisation peut par
exemple être justifiée par une hypothèse d’uniformité spatiale dans la répartition
des deux espèces. Par ailleurs, on suppose constant dans le temps le nombre
moyen b de proies décimées à chaque rencontre entre une proie et un prédateur.
La population des prédateurs, quant à elle, possède un taux de décroissance
autonome c ainsi qu’une croissance instantanée due à la prédation proportionnelle
18. En effet, en considérant le cas où y0 = 0 et donc y = 0, on voit que a est le taux de
croissance de x en l’absence de prédateurs.
377
64. Modèle de Lotka-Volterra
Questions.
1. Illustrer graphiquement le raisonnement permettant d’établir la positivité des
solutions maximales de (1) dans la question a)(i) et détailler la raison pour
laquelle la trajectoire de (f, g) ne peut couper l’axe des ordonnées si x0 > 0.
2. Sans utiliser de résultats concernant la notion de sous-solution, montrer que
toute fonction f définie sur un intervalle ouvert I contenant 0, dérivable sur I,
telle que f (0) > 0 et telle que f 0 < af vérifie f (t) 6 f (0)eat pour tout t ∈ I ∩ R+ .
3. Détailler l’usage fait du théorème d’explosion dans la question a)(i) pour
justifier que I contient R+ tout entier.
4. Détailler le raisonnement permettant de déduire l’unicité de (x, y) de celle de
la solution maximale (f, g) dans la question a)(i).
5. Détailler soigneusement l’utilisation faite du théorème d’explosion dans la
première méthode présentée dans la question a)(i).
378
Calcul différentiel, équations différentielles et EDP
6. Démontrer que
lim H(u, v) = +∞.
k(u,v)k→+∞
(u,v)∈(R∗+ )2
379
64. Modèle de Lotka-Volterra
y ẋ = 0
ẋ < 0, ẏ < 0
ẋ < 0, ẏ > 0
ẋ > 0, ẏ < 0
ẋ > 0, ẏ > 0
ẏ = 0 x
380
Calcul différentiel, équations différentielles et EDP
∂2y ∂2y
∀x ∈ [0, π], ∀t > 0, (x, t) = 9 (x, t), (E)
∂t2 ∂x2
ainsi que les conditions
Correction.
a) Raisonnons par analyse et synthèse. Supposons que y(x, t) soit une solution
de (E) et s’écrive sous la forme X(x)T (t) avec X et T de classe C 2 sur [0, π] et
sur R respectivement. L’équation (E) se reformule alors en
X(x)T 00 (t) = 9X 00 (x)T (t).
Supposons que X et T ne s’annulent pas. Il est alors possible de diviser pour
séparer les variables en écrivant
T 00 (t) X 00 (x)
= .
9T (t) X(x)
Les variables t et x sont indépendantes, de sorte que cette quantité est constante
relativement aux deux variables. Nous notons −λ cette quantité. On obtient donc
les deux équations différentielles linéaires
X 00 + λX = 0 et T 00 + 9λT = 0.
381
65. Équation des ondes pour une corde vibrante
Il est facile de vérifier que ces fonctions donnent effectivement des solutions de
l’équation (E), achevant la synthèse et justifiant que les fonctions ainsi obtenues
sont solutions de (E) pour tout λ ∈ R.
b) Pour une solution à variables séparables y(x, t) = X(x)T (t) avec X et T de
classe C 2 sur [0, π] et R respectivement, les conditions au bord (B) se reformulent
en
X(0)T (t) = 0 et X(π)T (t) = 0.
X(0) = 0 et X(π) = 0.
X(0) = a = 0 et X(π) = a + bπ = 0,
382
Calcul différentiel, équations différentielles et EDP
avec (cn )n∈N et (dn )n∈N des suites réelles telles que la série ci-avant converge et
vérifie les hypothèses du théorème de double dérivation terme à terme.
d) Effectuons une analyse du problème. Considérons une fonction y sous la
forme (4) et supposons que la série converge et vérifie les hypothèses du théorème
de double dérivation terme à terme. La première condition initiale s’écrit
+∞
X
y(x, 0) = cn sin(nx) = x(π − x).
n=1
d’où l’on déduit que tous les coefficients dn sont nuls (par unicité des coefficients
d’une fonction développable en série de Fourier). Finalement, une solution du
système initial de l’équation des ondes est donnée par
X 8
y(x, t) = sin(nx) cos(3nt). (5)
n∈2N+1
(nπ)3
Réciproquement, on vérifie que la série définie par (5) vérifie les hypothèses du
théorème de dérivation terme à terme. La fonction y en (5) est donc bien définie
et de classe C 2 à l’intérieur du domaine. De plus, les calculs précédents prouvent
qu’elle vérifie l’équation des ondes (E) et satisfait les conditions (B) et (I).
383
65. Équation des ondes pour une corde vibrante
Commentaires.
© L’équation des ondes considérée dans ce développement est la modélisation
du problème physique de la corde vibrante : une corde tendue entre deux points
d’attache produit un son lorsqu’elle subit une déformation. La quantité y(x, t)
est la position en ordonnée du point de la corde situé à l’abscisse x ∈ [0, π] au
temps t, décrivant donc le mouvement de la corde dans l’espace et au fil du temps,
voir Figure 2.21. Il est intéressant de garder en tête l’interprétation physique du
problème, notamment pour se souvenir des conditions suivantes :
• y(x, 0) = x(π − x), qui traduit la déformation initiale imposée à la corde ;
∂y
• ∂t (x, 0) = 0, qui traduit l’immobilité de la corde en t = 0 ;
• y(0, t) = y(π, t) = 0, pour tout t > 0, traduit le fait que les deux extrémités
de la corde demeurent fixées.
Lorsque la déformation initiale impose une forme parfaitement sinusoïdale, se
confondant avec les solutions trouvées lors de la séparation de variables, la
vibration conserve la même forme sinusoïdale, seule l’amplitude changeant. Ces
modes propres (voir commentaire suivant) sont les harmoniques en musique. Le
son produit par une corde vibrante est en général la superposition de telles
harmoniques, ainsi qu’on l’exprime formellement dans la question b).
y t=0
π
t = 12
π
t= 8
π
t= 6 x
π
5π
t= 24
π
t= 4
π
t= 3
384
Calcul différentiel, équations différentielles et EDP
y y
x x
π π
x
π
Figure 2.22 – Les premières harmoniques de (E), pour n ∈ {1, 2, 3}, et leur
évolution.
© La constante apparaissant dans l’équation (E) des ondes dépend des caractéris-
tiques physiques de la corde. De manière générale, l’équation prend la forme
∂2y 2
2∂ y
(x, t) = c (x, t).
∂t2 ∂x2
où c est une constante dépendant de L et d’autres caractéristiques physiques de
la corde (telles que son élasticité). Dans l’exemple considéré ici, la corde a une
longueur L = π et le carré de la vitesse de l’onde c2 = 9, de sorte à simplifier les
calculs dans la décomposition de Fourier réalisée en dernière étape.
© On peut se demander si l’équation des ondes considérée admet une unique
solution, auquel cas la solution obtenue dans ce développement est la solution au
problème posé. La réponse est oui, mais c’est un résultat non trivial : il s’agit du
caractère bien posé de l’équation des ondes. Contrairement au cas des équations
différentielles linéaires, où le théorème de Cauchy-Lipschitz donne l’existence et
l’unicité d’une solution à un problème de Cauchy, on ne dispose pas de résultats
généraux d’existence et d’unicité des solutions d’équations aux dérivées partielles.
On pourra se référer au Développement 66 pour une preuve du caractère bien posé
d’une équation aux dérivées partielles (l’équation de transport) et de nombreux
commentaires sur le sujet.
385
65. Équation des ondes pour une corde vibrante
n2 π 2
λ= , n ∈ Z.
L2
Ainsi, la connaissance des modes propres (on parle aussi du spectre de l’équation)
permet donc de déterminer la longueur de la corde. Les connaissances des caracté-
ristiques géométriques de la corde ou spectrales du son produit permettent donc
d’obtenir les mêmes informations.
En dimension deux, l’équation analogue modélise la vibration d’une surface,
typiquement celle d’un tambour. Toutefois, le cas du tambour est beaucoup
plus riche. En 1966, Kac pose sa célèbre question « Can one hear the shape of
a drum? » (peut-on entendre la forme d’un tambour ?), qui signifie : peut-on
déterminer la surface (géométriquement, autrement dit à isométrie près) à partir
de la connaissance de son spectre, i.e. des modes propres de l’équation des ondes ?
La réponse est négative à partir de la dimension deux : il existe des surfaces qui
sont isospectrales (donc non distinguables à partir du seul son qu’elles peuvent
produire) mais non isométriques. Il s’agit d’un résultat établi par Gordon, Webb
et Wolpert en 1992.
© Le principe de superposition est une étape importante de l’argument. Il repose
sur fait que l’opérateur différentiel sous-jacent
∂2 ∂2
− 9
∂t2 ∂x2
est linéaire et continu, que l’équation est homogène et que les conditions au bord
sont également données par des fonctionnelles linéaires continues. De plus, une
somme infinie localement uniformément convergente de solutions particulières peut
être dérivée terme à terme, de sorte qu’elle est également solution de l’équation
aux dérivées partielles.
Un autre exemple d’équation résoluble par les mêmes méthodes est l’équation de
la chaleur modélisant l’évolution spatiale et temporelle de la température u(x, t)
dans une barre adiabatique unidimensionnelle de longueur π. Ce problème est
modélisé par le système
∂2u
∂u
(x, t) = k (x, t) pour 0 6 x 6 π, t > 0, (E)
0
∂t ∂x2
∂u ∂u
(0, t) = 0 et (π, t) = 0 pour tout t > 0, (B)
∂x ∂x
u(x, 0) = x(π − x) pour tout x ∈ [0, π], (I)
386
Calcul différentiel, équations différentielles et EDP
chaleur initial est maximal au centre. On obtiendrait, par la même démarche que
celle suivie dans le développement,
π2 X 4 2
u(x, t) = − 2
cos (nx) e−k0 n t .
6 n∈2N∗
n
Questions.
1. Rappeler ce qu’est une fonction de classe C 2 sur [0, π].
2. Justifier que si f, g ∈ C 1 ([0, π]) sont telles que f (x) = g(t) pour tous x, t ∈ R,
alors ces deux fonctions sont constantes.
3. Rappeler pourquoi les solutions de l’équation différentielle y 00 + λy = 0 sont
celles données à la question a).
4. Calculer les coefficients de Fourier de la fonction x ∈ [0, π] 7→ x(π − x).
5. On suppose vérifiées les conditions énoncées à la question c). Montrer que
les séries de la forme (4) sont convergentes, que leur somme est de classe C 2 sur
]0, π[×]0, +∞[ à l’intérieur du domaine et qu’elles constituent en effet une solution
à l’équation de la corde vibrante.
Indication : utiliser le théorème de dérivation des sommes de séries de fonctions.
Pour montrer que la série de terme général cos(n)
n converge, penser à appliquer le
critère d’Abel.
6. Justifier le calcul des coefficients de Fourier de la question d) :
8
2 π
Z
si n est impair,
cn = x(π − x) sin(nx)dx = (nπ)3
π 0
0 sinon.
387
66. Caractère bien posé : équation de transport
∀τ ∈ [0, T ], ky|t=τ kL2 (]0,L[) 6 kukL2 (]0,T [) + ky0 kL2 (]0,L[) . (3)
388
Calcul différentiel, équations différentielles et EDP
Correction.
Dans ce développement, nous utilisons l’espace de Sobolev H 1 ainsi que la notion
de maximale monotonie et le théorème de Hille-Yosida qui sont rappelés en
commentaire.
a) Soit y une fonction de classe C 1 sur ]0, τ [×]0; L[ et continue sur [0, τ ] × [0, L],
solution forte de l’équation de transport. Soient τ ∈ [0, T ] et ϕ ∈ Tτ . Par l’équation
∂y ∂y
de transport, on a 0 = + . On multiplie cette équation par ϕ et on intègre
∂t ∂x
en espace puis en temps. Il vient
Z τ Z L
∂y ∂y
0= (t, x) +
(t, x) ϕ(t, x)dxdt
0 0 ∂t ∂x
Z LZ τ Z τZ L
∂y ∂y
= (t, x)ϕ(t, x)dtdx + (t, x)ϕ(t, x)dxdt.
0 0 ∂t 0 0 ∂x
389
66. Caractère bien posé : équation de transport
Notons que les fonctions ϕn ainsi définies sont bel et bien nulles en x = L.
Alors, par (2), avec u = 0 et y0 = 0, on a
Z τ Z L Z L
∂ϕn ∂ϕn
− (t, x) + (t, x) y(t, x)dxdt + y(τ, x)ϕn (τ, x)dx = 0.
0 0 ∂t ∂x 0
Autrement dit,
Z τZ L Z L
−fn0 (τ fn0 (τ
− + x − t) + + x − t) y(t, x)dxdt + y(τ, x)fn (x)dx = 0,
0 0 0
Z L
de sorte que y(τ, x)fn (x)dx = 0.
0
Par passage à la limite pour la norme L2 (]0, L[) il vient ky|t=τ kL2 (]0,L[) = 0, ce qui
prouve que y|t=τ = 0 presque partout par l’axiome de séparation de la norme L2 ,
et conclut la preuve de l’unicité de la solution faible au problème de Cauchy de
l’équation de transport.
c) (i) Notons pour commencer que l’opérateur linéaire A est bien défini par
définition de l’espace fonctionnel H 1 (]0, L[) qui est l’espace des fonctions L2 (]0, L[)
dont la dérivée au sens des distributions est elle aussi L2 (]0, L[). De plus, L2 (]0, L[)
est un espace de Hilbert.
On veut montrer que A est monotone, c’est-à-dire que pour toute f ∈ D(A), on a
hA(f ), f iL2 > 0.
Soit f ∈ D(A). On a
Z L Z L
hA(f ), f iL2 = A(f )(x)f (x)dx = f 0 (x)f (x)dx
0 0
L
1 2 1
= f (x) = f 2 (L)
2 x=0 2
>0
390
Calcul différentiel, équations différentielles et EDP
391
66. Caractère bien posé : équation de transport
∀τ ∈ [0, T ], kyn|t=τ kL2 (]0,L[) 6 ky0,n kL2 (]0,L[) + kun kL2 (]0,T [) . (5)
Montrons que (yn )n∈N est une suite de Cauchy. On prend n, m ∈ N. La fonc-
tion yn − ym est une solution faible de l’équation de transport avec les conditions
initiale y0,n − y0,m ∈ D(A) et au bord un − um ∈ C 2 ([0, T ]) nulle en 0. Donc, par
l’unicité déjà obtenue à la question b) et par la question précédente, pour tout
τ ∈ [0, T ], on a
kyn|t=τ − ym|t=τ kL2 (]0,L[) 6 ky0,n − y0,m kL2 (]0,L[) + kun − um kL2 (]0,T [) .
Soit τ ∈ [0, T ]. Par passage à la limite n, m → ∞, on obtient que (yn|t=τ )n∈N est
une suite de Cauchy dans l’espace complet L2 (]0, L[). On note y|t=τ ∈ L2 (]0, L[)
sa limite. L’inégalité de continuité (3) pour τ s’obtient alors par passage à la
limite dans l’équation (5).
On a ainsi défini y|t=τ pour tout τ ∈ [0, T ], ce qui définit une fonction y sur [0, T ].
Pour terminer la preuve, il reste à prouver que
• La fonction y est continue sur [0, T ] (à valeurs dans L2 (]0, L[)).
• La fonction y vérifie la formulation faible (2).
La borne supérieure de kyn|t=τ − ym|t=τ kL2 (]0,L[) pour τ ∈ [0, T ] existe et vérifie
sup kyn|t=τ − ym|t=τ kL2 (]0,L[) 6 ky0,n − y0,m kL2 (]0,L[) + kun − um kL2 (]0,T [) ,
τ ∈[0,T ]
donc, y est en fait la limite uniforme de la suite (yn )n∈N ∈ C 0 ([0, T ], L2 (]0, L[))N .
Comme la limite uniforme d’une suite de fonctions continues est continue, on en
déduit que y ∈ C 0 ([0, T ], L2 (]0, L[)).
De plus, on peut passer à la limite dans la formulation faible vérifiée par chaque yn
et obtenir la formulation faible (2) pour y.
En conclusion, l’équation de transport constitue un problème bien posé.
392
Calcul différentiel, équations différentielles et EDP
Commentaires.
On a choisi de présenter une méthode plus générale car elle peut s’appliquer
à d’autres équations aux dérivées partielles linéaires dont la solution ne serait
pas explicite. Le candidat pourra choisir d’utiliser cette solution explicite plutôt
que la méthode utilisée dans la correction pour répondre aux questions c) et d).
Notons que cette formulation explicite justifie le choix des fn puis de ϕn fait à la
question b).
© Dans la question c)(i), nous avons démontré que A est un opérateur maximal
monotone c’est-à-dire que c’est un opérateur sur un espace de Hilbert H vérifiant
les propriétés suivantes :
393
66. Caractère bien posé : équation de transport
dz
telle que z(0) = z0 et + A(z) = w où A(z) désigne A(z(t, ·)) pour
dt
tout t ∈ [0, +∞[.
u : t 7→ v(T − t) et y0 : x 7→ yT (L − x).
Soit y ∈ C 0 ([0, T ], L2 ([0, L])). Soit ψ : (t, x) ∈ [0, T ] × [0, L] 7→ (T − t, L − x). C’est
un C 1 -difféomorphisme involutif.
Montrons que y est une solution faible de (Pr ) si et seulement si y ◦ ψ est une
solution faible de (Pd ). Les calculs ci-après sont effectués au sens des distributions.
On a, par dérivation en chaîne,
∂(y ◦ ψ) ∂y ∂(y ◦ ψ) ∂y
=− ◦ψ et =− ◦ ψ.
∂t ∂t ∂x ∂x
394
Calcul différentiel, équations différentielles et EDP
Questions.
1. Vérifier que la solution explicite (6) convient, c’est-à-dire qu’elle est dans le
bon espace de fonctions et qu’elle vérifie la formulation faible (2). Donner un
exemple de conditions u et de y0 telles que cette solution soit une solution forte.
Donner un exemple de cas dans lequel cette solution ne peut pas être forte.
2. Justifier l’existence de la suite de fonctions (fn )n∈N considérée dans la ques-
tion b).
3. Dans la question c)(i), pour montrer la maximale monotonie de A, nous mettons
à profit l’existence d’une solution à l’équation différentielle linéaire d’ordre 1 à
coefficients constants avec second membre L2 . Justifier cette existence grâce à la
formule explicite de Duhamel.
4. Justifier l’existence de la suite de fonctions (ϕn )n∈N ainsi que les permutations
limite-intégrale et limite-dérivée effectuées dans la question c)(iii).
5. Justifier les arguments de densité utilisés dans la question d).
6. Quelle serait la formulation faible du problème rétrograde avec condition au
bord à droite étudié dans le dernier commentaire ?
7. Dans quels espaces de fonctions choisit-on les conditions au bord et initiale
pour le problème (Pd ) ? Vérifier que les fonctions u et y0 considérées au début du
dernier commentaire sont dans ces espaces.
8. Adapter la méthode vue à la fin des commentaires pour prouver le caractère
bien posé de l’équation de transport dont la condition initiale serait en t = T et
la condition au bord en x = 0 (c’est-à-dire à gauche).
9. Montrer que pour tout τ ∈ [0, T ], l’application Ψ : (u, y0 ) 7→ y|t=τ qui, à un
couple de conditions au bord et initiale, associe l’état de la solution faible y de
l’équation de transport à l’instant τ , est une application linéaire continue.
395
67. Dualité contrôlabilité-observabilité
∂y ∂y
+ =0 (E)
∂t ∂x
sur ]0, T [×]0, L[, que l’on munit de la condition initiale
où u ∈ L2 ([0, T ]).
(i) Soit y ∈ C 1 (]0, T [×]0, L[)∩ C 0 ([0, T ]×[0, L]) une solution de l’équation de
transport (E). Montrer que, pour tout τ ∈ [0, T ] et toute fonction-test ϕ
de classe C 1 sur ]0, τ [×]0, L[ continue sur [0, τ ] × [0, L] telle que ϕ|x=L = 0
(on dira que ϕ ∈ Tτ ), on a la formulation faible du problème de transport
muni des conditions (1) et (2) :
Z τ Z L
∂ϕ ∂ϕ
− (t, x) + (t, x) y(t, x)dxdt
0 0 ∂t ∂x
Z τ Z L
− u(t)ϕ(t, 0)dt + y(τ, x)ϕ(τ, x)dx = 0. (3)
0 0
396
Calcul différentiel, équations différentielles et EDP
20. Rappelons que l’on dit qu’une forme bilinéaire a sur un espace de Hilbert H est coercive
lorsqu’il existe une constante C > 0 telle que
21. Pour plus de détails et pour une preuve de ce caractère bien posé, le candidat pourra se
référer au Développement 66.
22. Dans cette définition, y est vue comme une fonction de [0, T ] à valeurs dans L2 (]0, L[).
C’est un abus de langage car y est une fonction de [0, T ]×]0, L[ dans R. On veut dire ici que
pour tout t ∈ ]0, T [, la fonction y(t, ·) : x 7→ y(t, x) est L2 sur ]0, L[ et de plus, t 7→ y(t, ·) est
continue sur [0, T ] à valeurs dans L2 (]0, L[) muni de sa norme canonique.
397
67. Dualité contrôlabilité-observabilité
Correction.
a) Tout d’abord, le fait que F est une application linéaire continue assure l’exis-
tence de son adjoint F ∗ ∈ L(H2 , H1 ) linéaire continu par le théorème de représen-
tation de Riesz.
On a H1 = Ker F ⊕ (Ker F)⊥ car Ker F est un fermé de H1 en tant qu’image
réciproque du fermé {0} par l’application continue F.
L’application S : (Ker F)⊥ → H2 est linéaire et continue car (Ker F)⊥ est un
sous-espace vectoriel de H1 et car F est linéaire continue. Soit x ∈ Ker S. On a
alors x ∈ (Ker F)⊥ et F(x) = S(x) = 0. On en déduit que
Donc, pour x 6= 0, il vient kxkH2 6 |||S −1 ||| · kF ∗ (x)kH1 , inégalité qui reste bien
sûr valide pour x = 0. Ainsi, (B) est prouvée.
(ii) On suppose que (B) est vraie. Si c = 0, on obtient que, pour tout x dans H2 ,
on a x = 0, donc H2 est réduit à {0} et (B) reste valide avec c = 1 > 0. On
suppose donc désormais que c > 0.
La bilinéarité de a provient du fait que F et F ∗ sont linéaires ainsi que de
la bilinéarité du produit scalaire sur H 2 . Par ailleurs, comme F et F ∗ sont
continues, a l’est aussi.
Pour tout x ∈ H2 , on a par définition de l’adjoint
398
Calcul différentiel, équations différentielles et EDP
1
a(x, x) = kF ∗ (x)k2H1 > kxk2H2 .
c2
Autrement dit, a est coercive.
On veut maintenant montrer que F est surjective. Soit x2 ∈ H2 ; on cherche à
prouver l’existence d’un x1 ∈ H1 tel que F(x1 ) = x2 .
D’après le théorème de Lax-Milgram (rappelé dans les commentaires suivant ce
développement), il existe un unique u ∈ H2 tel que l’on ait, pour tout v ∈ H2 ,
l’égalité a(v, u) = hv, x2 iH2 . Par définition de a et par linéarité à droite du produit
scalaire, pour tout v ∈ H2 , on a hv, F ◦ F ∗ (u) − x2 iH2 = 0. Autrement dit,
on a que F ◦ F ∗ (u) − x2 ∈ H2⊥ = {0}. On en déduit que x2 = F(x1 ), avec
x1 = F ∗ (u) ∈ H1 , si bien que x2 ∈ Im(F). Ainsi, l’application F est surjective, ce
qu’il fallait démontrer.
∂y ∂y
b) (i) Soit τ ∈ [0, T ]. Soit ϕ ∈ Tτ . Par l’équation de transport, 0 = + .
∂t ∂x
On multiplie cette équation par ϕ et on intègre en espace puis en temps pour
trouver :
Z τ Z L
∂y ∂y
0= (t, x) + (t, x) ϕ(t, x)dxdt
0 0 ∂t ∂x
Z LZ τ Z τZ L
∂y ∂y
= (t, x)ϕ(t, x)dtdx + (t, x)ϕ(t, x)dxdt.
0 0 ∂t 0 0 ∂x
399
67. Dualité contrôlabilité-observabilité
400
Calcul différentiel, équations différentielles et EDP
(iii) Supposons T > L. L’application ϕ telle que définie dans l’énoncé est continue
de [0, T ] à valeurs dans L2 (]0, L[) et vérifie la condition « initiale » ϕ|t=T = ϕT .
Pour tout (t, x) ∈ [0, T ] × [0, L], on a aussi au sens des distributions
∂ϕ
(t, x) = −ϕ0T (T − t + x)106x<L+t−T (x, t)
∂t
∂ϕ
et (t, x) = ϕ0T (T − t + x)106x<L+t−T (x, t),
∂x
de sorte que l’équation de transport est vérifiée sur [0, T ] × [0, L].
Ainsi, par la définition de FT∗ donnée à la question b)(ii),
Z T
kFT∗ (ϕT )k2L2 (]0,T [) = ϕ(t, 0)2 dt
0
Z T
= ϕT (T − t)2 106T −t<L (t)dt
0
Z L
= ϕT (x)2 dx
0
= kϕT k2L2 (]0,L[) car T > L.
On obtient alors en particulier kϕT kL2 (]0,L[) 6 kFT∗ (ϕT )kL2 (]0,T [) , qui est l’inéga-
lité (B) avec c = 1. Par la question a), ceci équivaut à la surjectivité de FT , ce
qu’il fallait démontrer.
Commentaires.
© Ce développement est plutôt difficile, en particulier à cause de sa longueur.
Néanmoins, les questions qui le composent sont de difficulté croissante. Le candidat
pourra, suivant la leçon concernée et ses préférences, se contenter de présenter
la question a) qui est relativement élémentaire, ce qui donnerait un développe-
ment de niveau FF. Dans ce cas, le candidat aura le loisir de présenter chaque
détail minutieusement. Il pourra aussi mentionner le résultat de la question b)
comme application à l’équivalence contrôlabilité-observabilité (voir interprétation
ci-après).
© On utilise dans la preuve du sens direct de la question a) le théorème d’iso-
morphisme de Banach. Il s’agit d’une conséquence du théorème de l’application
ouverte, dont l’énoncé est le suivant :
© Le crochet h·, ·iH peut être à la fois interprété comme le produit scalaire sur H 2
ou comme un crochet de dualité h·|·iH 0 ,H via le théorème de représentation de
Riesz, qui permet de choisir un point de vue ou l’autre en fonction des besoins.
En voici un énoncé :
401
67. Dualité contrôlabilité-observabilité
402
Calcul différentiel, équations différentielles et EDP
∃ ∀
« Il existe un contrôle u tel que... » « Pour toute solution, on a
l’inégalité d’observabilité... »
403
67. Dualité contrôlabilité-observabilité
Questions.
1. Démontrer l’existence et l’unicité de F ∗ .
2. Démontrer que F ∗ est linéaire et continu.
3. Justifier que si E est un sous-espace fermé d’un espace de Hilbert H, alors
H = E ⊕ E ⊥ . Donner un contre-exemple dans le cas d’un sous-espace qui n’est
pas fermé.
4. Montrer que si (A) est vraie alors F ∗ est injective. La réciproque est-elle vraie ?
5. Justifier l’existence de la norme triple d’une application linéaire continue.
6. Pourquoi a est-elle bilinéaire et continue ?
7. Retrouver le théorème d’isomorphisme de Banach à partir du théorème de
l’application ouverte.
404
Calcul différentiel, équations différentielles et EDP
405
Analyse classique et complexe
Pour tout n entier tel que n > 2, on note un l’aire d’un polygone régulier à 2n
côtés inscrit dans le cercle de centre O de cordonnées (0, 0) et de rayon 1 dans
le repère euclidien usuel.
a) Montrer que la suite (un )n>2 converge linéairement 23 vers π.
b) En déduire une méthode d’approximation de π.
π
A1
sin 4
O 1
A0
O 1
23. Rappelons que l’on dit d’une suite réelle (un )n∈N qu’elle converge linéairement vers sa
un+1 −l
limite l ∈ R s’il existe M ∈ [0, 1[ tel que limn→+∞ un −l
= M . Le terme « linéairement » fait
référence au fait que l’exposant de l’erreur |un − l| dans l’inégalité ci-avant est 1, par opposition
par exemple au cas de la convergence quadratique, caractérisée quant à elle par la relation
|un+1 −l|
limn→+∞ (un −l)2 = M 0 pour un M 0 > 0.
409
68. Une méthode archimédienne pour approcher π
Correction.
a) On remarque toutqd’abord que y un est bien défini pour tout n > 2 : si l’on
n−1 − 1 le point A comme ayant pour coordonnées
définit pour
tout
k ∈ 0, 2 k
kπ
polaires 1, 2n−1 dans le repère euclidien usuel, alors un représente l’aire du
polygone convexe dont les sommets sont les points Ak .
Par ailleurs, si n > 2 alors un est égal à 2n fois l’aire du triangle de sommets O, A0
et A1 (voir Figure 2.23). On a donc
π
1 · sin 2n−1
π
n n−1
un = 2 =2 sin . (1)
2 2n−1
On a donc
|π − un+1 | 1
lim = ,
n→+∞ |π − un | 4
ce qui montre que (un )n>2 converge linéairement vers π.
b) La formule (1) ne peut pas être utilisée directement pour calculer numéri-
quement un si l’on ne dispose pas d’une approximation précise des valeurs de la
fonction sin ainsi que de celle de π... ce qui est exactement l’objectif de notre
développement ! Comme u2 = 2 est connu, on souhaite donc expliciter une rela-
tion de récurrence entre les termes successifs de la suite (un )n>2 ne faisant pas
apparaître le nombre π. Si n > 2, on peut écrire
π π π
sin = 2 sin cos n (2)
2n−1 2n 2
or s
π π π
2
1− sin2 = cos = 2 cos − 1,
2n−1 2n−1 2n
en vertu de la formule cos(2x) = 2 cos2 (x) − 1 valable pour tout x ∈ R, d’où
v r
u
u 1 + 1 − sin2 n−1
u π
π
t 2
cos n =
2 2
410
Analyse classique et complexe
soit
π
π
sin 2n−1
sin =s .
2n r
π
2+2 1− sin2 2n−1
Ceci se réécrit
2−(n−1) un
2−n un+1 = r q ,
2+2 1−2 −2(n−1) 2
un
et donc √
2un
un+1 = r q .
1+ 1− 2−2(n−1) u2n
Commentaires.
© Voici les premiers termes de la suite (un )n>2 retournés par l’algorithme :
u2 = 2 u3 = 3.06146745892 u4 = 3.12144515226
u5 = 3.13654849055 u6 = 3.14033115695 u7 = 3.14127725093
u8 = 3.14151380114 u9 = 3.14157294037 u10 = 3.14158772528.
411
68. Une méthode archimédienne pour approcher π
Questions.
1. Justifier pourquoi les polygones réguliers à 2n côtés (avec n > 2) inscrits dans
le cercle de centre O et de rayon 1 ont tous la même aire.
2. Démontrer rigoureusement que pour tout entier n tel que n > 2, un vaut 2n
fois l’aire du triangle de sommets (0, 0), A0 et A1 .
3. À mesure que n grandit, à quelle vitesse croît le nombre de décimales de π
estimées correctement par un ?
4. Justifier que u2 = 2.
2π 3
5. Montrer que un est effectivement une approximation de π à 3·4n près, c’est-à-
2π 3
dire que |π − un | 6 3·4n pour tout n > 2.
6. Montrer que les suites (pn )n∈N et (Pn )n∈N définies en commentaire vérifient
π π
pn = 2n sin et Pn = 2n tan
2n 2n
412
Analyse classique et complexe
z0
z1
z2
z3
z4
z5
(ii) En déduire que les suites (min(yn ))n∈N et (max(yn ))n∈N sont adjacentes,
puis que la suite (yn )n∈N converge vers ( k1 , . . . , k1 ) ∈ Σk .
d) Conclure que la suite (zn )n∈N converge vers (g, . . . , g) ∈ Ck où
1
g= (z0 (1) + · · · + z0 (k))
k
est l’affixe de l’isobarycentre du polygone défini par z0 .
413
69. Convergence d’une suite de polygones
Correction.
a) En interprétant matriciellement la relation (?), en faisant attention au cas
particulier zn (k + 1) = zn (1), on obtient zn+1 = P zn pour tout n ∈ N, où
1/2 1/2 ···
0 0
.. ..
0 1/2 1/2 . .
P =
.. .. .. ..
∈ Mk (R).
. . . . 0
0 · · · 0 1/2 1/2
1/2 0 ··· 0 1/2
Les termes de cette somme étant tous positifs ou nuls, il suffit de trouver un
(k + 1)-uplet (i0 , . . . , ik ) pour lequel P (i0 , i1 ) = · · · = P (ik−1 , ik ) = 12 . Si i 6 j, on
peut par exemple considérer (i0 , . . . , ik ) = (i, . . . , i, i + 1, . . . , j). En revanche, dans
le cas i > j, on considère à la place (i0 , . . . , ik ) = (i, i + 1, . . . , k, 1, 2, . . . , j, . . . , j).
Avec ces choix, on obtient dans tous les cas P k (i, j) > α avec α = 2−k .
c) (i) On a yn+k = P k yn pour tout n ∈ N, et kj=1 P k (i, j) = 1 pour i ∈ J1, kK.
P
En considérant les indices j ∈ J1, kK tels que yn (j) = min yn et en observant que
chaque vecteur-ligne de la matrice P k appartient à Σk , on obtient, pour tous
entiers n ∈ N et i ∈ J1, kK,
X
yn+k (i) = P k (i, j)yn (j)
16j6k
X X
6 P k (i, j) min yn + 1 − P k (i, j) max yn
16j6k 16j6k
min yn =yn (j) min yn =yn (j)
X
= max yn − P k (i, j) (max yn − min yn )
16j6k
min yn =yn (j)
414
Analyse classique et complexe
et, puisque 1 − 2α < 1, la suite (wn )n∈N converge vers 0. De plus, comme
chaque composante de yn+1 est une combinaison convexe des composantes de yn ,
la suite (max(yn ))n∈N est décroissante et la suite (min(yn ))n∈N est croissante.
Par conséquent les suites (min(yn ))n∈N et (max(yn ))n∈N sont adjacentes. Elles
convergent donc vers une même limite ` ∈ R. Par le théorème d’encadrement,
on en déduit que (yn )n∈N converge vers (`, . . . , `). Enfin, puisque Σk est fermé et
stable par P , on a {yn } ⊂ Σk et (`, . . . , `) ∈ Σk , donc ` = k1 .
d) Soit (e1 , . . . , ek ) la base canonique de Ck . On a zn = P n z0 = kj=1 z0 (j)P n ej
P
Commentaires.
© Si l’on souhaite éviter la notion de limite supérieure pour montrer la convergence
de (wn )n∈N vers 0 à la question c)(ii), on peut à la place invoquer le lemme des
sous-suites. En effet, de l’inégalité 0 6 wn+k 6 (1 − 2α)wn on tire facilement
l’encadrement 0 6 wnk+j 6 (1 − 2α)n wj pour tous n ∈ N et 0 6 j < k. On
conclut en faisant tendre n vers +∞.
© La matrice P est une matrice stochastique : chacune de ses lignes correspond
à une loi de probabilité discrète. On peut l’interpréter comme la matrice de
transition de la marche aléatoire suivante dans le groupe Z/kZ :
1/2
1/2 1/2
1
1/2 k 2 1/2
1/2 1/2
415
69. Convergence d’une suite de polygones
Questions.
1. Démontrer l’affirmation de la question c) selon laquelle la suite (min yn )n∈N
(resp. (max yn )n∈N ) est croissante (resp. décroissante).
2. Démontrer succinctement le théorème des suites adjacentes.
3. Justifier que Σk est un compact de Ck stable par P .
4. Montrer que la suite (P n )n∈N converge vers une matrice dont tous les vecteurs-
lignes égalent µk . Interpréter cette convergence par rapport à la loi d’une particule
se déplaçant aléatoirement sur le graphe représenté en Figure 2.24.
5. Que se passe-t-il si l’on remplace (?) par une combinaison convexe telle que
zn+1 (j) = p zn (j) + (1 − p) zn (j + 1) pour tout j ∈ J1, kK , avec p ∈ [0, 1] ?
6. Soient Q ∈ Mk (R) une matrice stochastique et, pour tous i, j ∈ J1, kK, l’en-
semble N (i, j) = {n ∈ N : Qn (i, j) > 0}. On suppose que pour tous i, j ∈ J1, kK,
on a N (i, j) 6= ∅ (Q est irréductible) et que les éléments de N (i, i) sont premiers
entre eux dans leur ensemble (Q est apériodique).
i h Montrer que Q est régulière, au
1
sens où il existe un entier m ∈ N et α ∈ 0, 2 tels que Qm (i, j) > α pour tout
indices i, j ∈ J1, kK.
Indication : considérer a 6= b dans N (i, i) et montrer que tout entier n assez grand
peut s’écrire n = au + bv avec u, v ∈ N.
7. Soit (Xn )n∈N une chaîne de Markov sur J1, kK. On suppose (Xn )n∈N ergodique,
c’est-à-dire que sa matrice de transition Q est irréductible et apériodique. En
reprenant le développement ci-avant, montrer que (Xn )n∈N converge en loi vers
l’unique vecteur-probabilité µ ∈ Σk tel que µQ = µ (c’est-à-dire que Qn tend vers
une matrice dont toutes les lignes égalent µ). Montrer de plus que µ(j) > 0 pour
tout j ∈ J1, kK.
416
Analyse classique et complexe
417
70. Développement en fractions continues
Correction.
a) On procède par récurrence double sur n pour prouver la propriété voulue.
Dans le cas n 6 2, on pose (p0 , p1 , p2 ) = (0, 1, a0 ) et (q0 , q1 , q2 ) = (1, 0, 1). On a
alors
p1 ξ0 + p0 1 × ξ0 + 0
= = ξ0 = ξ,
q1 ξ 0 + q0 0 × ξ0 + 1
p2 ξ1 + p1 a 0 ξ1 + 1 1
= = a0 + = a0 + ξ0 − a0 = ξ.
q2 ξ 1 + q1 ξ1 ξ1
On a de plus
p1 q0 − p0 q1 = 1 et p2 q1 − p1 q2 = −1.
Ainsi, la propriété est vraie aux rangs 1 et 2.
Soit n > 2 un entier tel que ξn est défini, et supposons que p0 , . . . , pn et q0 , . . . , qn
soient définis. On veut alors déterminer deux entiers pn+1 et qn+1 de sorte que
pn+1 ξn + pn
ξ= .
qn+1 ξn + qn
Par définition de ξn , ceci se réécrit en
pn+1
ξn−1 −an−1 + pn (pn+1 − an−1 pn ) + pn ξn−1
qn+1 = .
ξn−1 −an−1 + qn (qn+1 − an−1 qn ) + qn ξn−1
Par hypothèse de récurrence, on a également
pn ξn−1 + pn−1
ξ= .
qn ξn−1 + qn−1
Ainsi, en posant pn+1 = pn−1 + an−1 pn et qn+1 = qn−1 + an−1 qn , on a bien
pn+1 ξn + pn
ξ= .
qn+1 ξn + qn
On a de plus
pn+1 qn − pn qn+1 = pn−1 qn − pn qn−1 + an−1 pn qn − an−1 pn qn = −(−1)n−1 = (−1)n ,
ce qui montre la propriété au rang n et achève la preuve par récurrence.
b) Si le développement de ξ est fini, alors il existe un entier n tel que ξn soit
entier. Par la question précédente,
pn+1 ξn + pn
ξ=
qn+1 ξn + qn
est une écriture de ξ comme quotient de deux entiers, donc ξ est rationnel.
Réciproquement, supposons qu’il existe n ∈ N tel que ξn = pq avec p ∧ q = 1
6 1. Alors ξn+1 = qr où r est le reste de la division euclidienne de p par q. En
et q =
particulier, quitte à simplifier la fraction qr (ce qui fait décroître la valeur de la
somme q + r), on peut supposer que q et r sont premiers entre eux et q + r < p + q.
Ainsi, si ξ = ξ0 est rationnel, alors tous les ξn (s’ils existent) sont rationnels, et la
suite des p + q est une séquence d’entiers strictement décroissante, qui est donc
finie. Finalement, on obtient bien que le développement de ξ est fini.
418
Analyse classique et complexe
pξk + p0
ξk = .
qξk + q 0
pk+1 ξk + pk qk ξ − p k
ξ= d’où ξk = .
qk+1 ξk + qk −qk+1 ξ + pk+1
Ainsi, le polynôme
qk X − p k
2
(−qk+1 X + pk+1 ) Q
−qk+1 X + pk+1
pn+1 X + pn
Qn (X) = (qn+1 X + qn )2 Q .
qn+1 X + qn
2 Q( pn+1 ), qui
Ce polynôme est à coefficients entiers et le coefficient de X 2 est qn+1 qn+1
est non nul car Q est irréductible sur Q. De plus, on a
∆ = α2 (ξ − ξ 0 )2 .
419
70. Développement en fractions continues
2
qn ξ 0 − p n
2
pn+1 qn ξ − p n
4
∆n = qn+1 Q −
qn+1 −qn+1 ξ + pn+1 −qn+1 ξ 0 + pn+1
2
qn ξ − p n qn ξ 0 − pn
= α2 (pn+1 − qn+1 ξ)2 (pn+1 − qn+1 ξ 0 )2 −
−qn+1 ξ + pn+1 −qn+1 ξ 0 + pn+1
= α2 ((qn ξ − pn )(pn+1 − qn+1 ξ 0 ) − (qn ξ 0 − pn )(pn+1 − qn+1 ξ))2
= α2 (qn pn+1 − pn qn+1 )2 (ξ − ξ 0 )2
=∆
où M = sup|x−ξ|<1 |Q0 (x)|. La suite (αn )n∈N est donc bornée. C’est aussi le cas
de (γn )n∈N car
pn
2
γn = Qn (0) = qn Q = αn−1 .
qn
Enfin, on a
βn2 = ∆n + 4αn γn = ∆ + 4αn αn−1 6 ∆ + 4M 2 ,
ce qui conclut la démonstration.
(iii) Le principe des tiroirs assure qu’il existe n1 < n2 < n3 tels que les polynômes
Qn1 , Qn2 et Qn3 sont égaux. Pour tout j ∈ {1, 2, 3}, ξnj est racine de Qnj , donc
il existe bien i < j tels que ξni = ξnj . Le développement de ξ est donc bien
périodique à partir du rang ni , et sa période est majorée par nj − ni .
Commentaires.
© Les fractions continues apparaissent dans différents domaines des mathéma-
tiques. Elles sont à la base de la notion d’approximation diophantienne : étant
donné un nombre irrationnel x et un réel ε > 0, peut-on calculer facilement un
rationnel dans l’intervalle [x − ε, x + ε]. Le lemme de Dirichlet assure que pour tout
entier q > 1, il existe un entier p tel que |x − pq | < q12 . Cependant, ce résultat n’est
pas constructif. Avec les notations de l’énoncé, la fraction pqnn est appelée « réduite »
420
Analyse classique et complexe
de ξ. Comme on le verra dans les questions, la suite des réduites converge vers ξ,
et on a
pn 1
ξ− 6 2. (2)
qn qn
Ainsi, les fractions continues permettent de construire explicitement des approxi-
mations d’irrationnels. De plus, leur construction est peu coûteuse.
© On peut améliorer la majoration √ (2) d’un facteur 2 en ne considérant qu’une
réduite sur deux, et d’un facteur 5 pour une réduite sur trois. En revanche, il
n’est pas possible d’améliorer l’exposant en général (par un théorème de Thue-
Siegel-Roth).
On peut d’autre part montrer que les réduites sont des « meilleures approxi-
mations », c’est-à-dire qu’elles sont plus proches de ξ que n’importe quel autre
rationnel de plus petit dénominateur. C’est en fait une équivalence : les meilleures
approximations d’un irrationnel sont ses réduites. En particulier, calculer des
réduites a longtemps été une technique commune d’approximation de racine
carrées.
© Les fractions continues apparaissent aussi naturellement dans l’étude des équa-
tions de Pell-Fermat x2 − dy 2 = ±1. En effet, en réécrivant cette équation sous la
forme
x √ x √ 1
− d + d = ± 2,
y y y
√
on obtient que les
√ solutions fournissent des réduites de d car elles vérifient la
majoration | xy − d| < 2y12 . On peut alors montrer que toutes les solutions d’une
√
telle équation sont
√ obtenues comme
√ les coefficients de 1 √ d d’une certaine
et
puissance de α + dβ dans Z[ d], où αβ est une réduite de d.
© Le développement en fraction continue se généralise au cadre d’approximation
de fonctions : c’est la notion d’approximant de Padé, qui permet d’approcher une
fonction (analytique) par des fractions rationnelles.
© Dans le cas rationnel, le calcul du développement en fraction continue (fini)
consiste à effectuer les mêmes opérations que l’algorithme d’Euclide. On peut
même retrouver les coefficients de Bézout à partir de la dernière réduite pqnn .
√
© Dans le cas des irrationnels quadratiques de la forme d, le théorème de
Legendre fournit un peu plus d’information que la simple périodicité : le déve-
loppement est périodique à partir du second terme. De plus, sa période est de la
forme a1 , a2 , . . . , a2 , a1 , 2a0 , soit presque un palindrome.
Questions.
1. Démontrer l’équation (1).
2. Dans la question b), justifier que qn+1 ξn + qn 6= 0.
3. Montrer que si ξk est rationnel pour un certain entier k alors ξ est rationnel.
4. Est-ce que la suite (qn )n∈N des dénominateurs des réduites d’un irrationnel ξ
est toujours non bornée ?
421
70. Développement en fractions continues
422
Analyse classique et complexe
Correction.
a) Rappelons que les points extrémaux de K sont les points ne pouvant s’écrire
comme combinaison linéaire non triviale de plusieurs points de K. Plus précisément
x ∈ E(K) si, et seulement si,
` = lim `n .
n→+∞
La convergence est de plus uniforme car K est compact donc borné, de sorte que
` − `n = − n1 k · k2 converge uniformément vers zéro.
Soit n ∈ N. La fonction `n = ` − n1 k · k2 est continue sur le compact K, elle admet
donc un minimum dans K. Ce minimum est atteint sur E(K) par stricte concavité
de `n . En effet, supposons que le minimum soit atteint en un point x ∈ / E(K). Par
423
71. Théorèmes de Choquet et de Birkhoff
et cela nécessiterait que l’un des `n (xi ) soit strictement inférieur à `n (x), contrai-
rement à l’hypothèse de minimalité. Ainsi, le minimum de `n est atteint en un
point extrémal.
Pour tout n ∈ N, notons xn ∈ E(K) un point minimisant `n . Par compacité
de E(K), on peut extraire de la suite (xn )n une sous-suite convergente, que l’on
note toujours de la même manière quitte à renommer les indices. Notons x ∈ E(K)
la limite de la suite extraite. Nous allons prouver que ce x minimise `. Pour
tout ε > 0, on a
Ainsi, la suite (`n (xn ))n converge vers `(x). Or les `n sont toujours inférieurs
à `, donc en passant à la limite dans l’inégalité `n (xn ) 6 `n (x0 ), valable pour
tout x0 ∈ K par minimalité de xn , on obtient que x ∈ E(K) est un minimiseur
de ` sur K.
b) Vérifions que les matrices de permutations sont extrémales. Supposons qu’une
matrice de permutation P s’écrive λA + (1 − λ)B avec A, B ∈ Bn et λ ∈]0, 1[. En
traduisant cette relation pour chaque coefficient on a, pour tous i, j ∈ J1, nK, l’un
des deux cas
424
Analyse classique et complexe
Ce choix de ε garantit que les aij ± ε sont dans ]0, 1[, pour tous i, j ∈ J1, nK tels
que aij ∈]0, 1[. On considère alors la matrice modifiée A+ obtenue à partir de A
en augmentant tous les air jr de ε, et en diminuant tous les air jr+1 de ε, pour
tous r ∈ J1, kK. Cela ne change pas le caractère bistochastique de la matrice ainsi
modifiée.
On a ainsi perturbé la matrice A en une matrice A+ sans sortir de Bn . Introduisons
également A− la matrice obtenue de manière similaire à A+ mais en remplaçant ε
par −ε. La matrice A− est toujours bistochastique pour les mêmes raisons que A+ .
On a alors
1
A = (A+ + A− ),
2
et la matrice A apparaît donc comme combinaison convexe non triviale de deux
matrices bistochastiques : elle n’est donc pas extrémale.
425
71. Théorèmes de Choquet et de Birkhoff
Commentaires.
© Ce développement contient deux théorèmes d’analyse convexe. Ces deux ré-
sultats sont indépendants et ne sont présentés conjointement que pour rendre
autocontenue l’application présentée dans les commentaires qui suivent, résol-
vant la question du transport optimal discret à poids entiers ou rationnels. Il
est possible de présenter ces deux théorèmes de manière cohérente en énonçant
que toute fonctionnelle linéaire continue sur les matrices bistochastiques atteint
son minimum en une matrice de permutation. Il s’agit d’une version abstraite
du résultat de transport optimal présenté ci-après, conséquence immédiate des
théorèmes de Choquet et Birkhoff.
© L’hypothèse que l’ensemble E(K) des points extrémaux de K est compact
n’est pas superflue pour la preuve présentée dans ce développement : des contre-
exemples existent. Toutefois le théorème de Choquet, ainsi que tous les résultats
présentés ici, demeurent sans cette hypothèse.
© La motivation originale de ce développement était la théorie du transport
optimal et son traitement dans le cas discret. Toutefois, dans le but de ne pas
alourdir le développement, notamment à cause de l’introduction du problème
du transport optimal, nous avons préféré reporter ici cette application dans ce
commentaire et les suivants. Le développement ainsi constitué pourrait être de
niveau FF. Le problème du transport optimal ainsi qu’introduit par Monge est
motivé par une question d’ingénierie militaire : comment minimiser l’effort pour
transporter le sable d’une dune vers un fossé à combler ? On peut modéliser la
distribution de sable initiale par une mesure µ de densité f et la distribution que
le sable doit épouser dans le fossé par une mesure ν de même masse totale :
µ T (x)
• •
x
ν
Le transport est modélisé par une application T qui décrit la position finale T (x)
du sable qui se trouvait originalement en x, et un transport optimal correspond
à un choix de T envoyant µ sur ν (le sens précis étant la condition sur le push
forward de mesures T #µ = ν) et minimisant le coût de ce transport, i.e. de la
fonctionnelle intégrale définie par
Z
C(T ) = f (x)c(x, T (x))dx, (1)
X
426
Analyse classique et complexe
La matrice (γij )ij , que l’on identifie à γ, doit être bistochastique pour garantir la
conservation de la masse, autrement dit
n
X n
X
1 = µ({xi }) = γij et 1 = ν({yj }) = γij .
j=1 i=1
427
71. Théorèmes de Choquet et de Birkhoff
Questions.
1. Montrer que, si l est une fonctionnelle linéaire sur un espace vectoriel normé,
alors ` − k · k2 est une fonction strictement concave.
2. Montrer que si l est une fonction strictement concave sur un compact K, alors
ses minimums sont des points extrémaux de K.
3. Montrer que les déformations de matrices bistochastiques considérées à la
question b) restent bien des matrices bistochastiques.
4. Montrer que l’enveloppe convexe d’un compact est compacte en dimension
finie. Qu’en est-il de la dimension infinie ?
Indication : utiliser le théorème de Carathéodory.
428
Analyse classique et complexe
a) Montrer qu’il existe pour tout i ∈ J1, nK une fonction de meilleure réponse
Y
bi : Sj −→ Si
j6=i
x̃i 7−→ argmax ux̃i i
où argmax ux̃i i est l’unique valeur maximisant ux̃i i . Montrer que cette fonction
est continue.
b) En admettant le théorème de Brouwer qui stipule que toute application
continue d’un compact convexe de Rm1 +···+mn dans lui-même admet un point
fixe, montrer que le jeu admet un équilibre de Nash.
c) Soit (fk )k∈N une suite de fonctions continues de S dans lui-même conver-
geant uniformément vers une fonction f : S → S, et soit (xk )k∈N une suite
de S convergeant vers un élément x ∈ S. Montrer que (fk (xk ))k∈N converge
vers f (x).
d) Généraliser le résultat de la question b) au cas où les fonctions d’utilité
partielles ux̃i i sont seulement supposées concaves (théorème de Nash).
429
72. Théorème de Nash
Correction.
a) Soient i ∈ J1, nK et x̃i = (x1 , . . . , xi−1 , xi+1 , . . . , xn ) ∈ j6=i Sj . L’ensemble Si
Q
est compact et ux̃i i est continue sur Si , donc ux̃i i admet bien un maximum sur Si .
Ce maximum est atteint en un unique point par stricte concavité de ux̃i : en effet,
si x, x0 ∈ Si sont tels que x 6= x0 et tels que ux̃i i (x) = ux̃i i (x0 ) = maxSi ux̃i i , alors
x + x0 1 x̃i
ux̃i i > ui (x) + ux̃i i (x0 ) = ux̃i i (x)
2 2
0
ce qui est absurde puisque x+x ∈ Si (rappelons que Si est convexe !). La fonction bi
Q2
est donc bien définie sur j6=i Sj .
Considérons une suite (x̃ki )k∈N
Q
Montrons à présent que bi est continue sur j6=i Sj .
Q
de j6=i Sj de terme général
x̃ki = xk1 , . . . , xki−1 , xki+1 , . . . , xkn
que la suite (bi (x̃ki ))k∈N converge vers bi (x̃i ). Cette suite étant à valeurs dans le
compact Si , il suffit pour cela de montrer qu’elle admet bi (x̃i ) pour unique valeur
d’adhérence. Soit z ∈ Si une valeur d’adhérence de (bi (x̃ki ))k∈N et φ : N → N une
extractrice telle que
φ(k)
lim bi x̃i = z.
k→+∞
On sait que pour tout k ∈ N et tout y ∈ Si ,
φ(k) φ(k) φ(k) φ(k)
ui x1 , . . . , xi−1 , bi x̃i , xi+1 , . . . , xφ(k)
n
φ(k) φ(k) φ(k)
> ui x1 , . . . , xi−1 , y, xi+1 , . . . , xφ(k)
n
430
Analyse classique et complexe
Pour tout i ∈ J1, nK et tout ε > 0, on pose ui,ε = ui + εΦ. Notons d’ores et déjà
que pour tout i ∈ J1, nK on a
puisque la fonction continue Φ est bornée sur le compact S, donc pour toute
suite strictement positive (vn )n∈N de limite nulle la suite de fonctions (ui,vn )n∈N
converge uniformément vers ui .
Pour tout ε > 0, les fonctions d’utilité partielles ux̃i,ε associées aux fonctions
d’utilité ui,ε sont strictement concaves, donc le jeu défini à partir des ui,ε admet
431
72. Théorème de Nash
1 1
u1, 1 x, x2 , . . . , xn
ψ(k) ψ(k) ψ(k)
1 1
6 u1, 1 x1 , . . . , xn (1)
ψ(k) ψ(k) ψ(k)
un entier j ∈J2, nK) dans le cas du jeu défini par les fonctions d’utilité ui,ψ(k)−1 .
Mais la suite (u1,ψ(k)−1 )k∈N∗ converge uniformément vers u1 , si bien que la question
précédente permet d’écrire
1 1
lim u1, 1 x, x2 , . . . , xn = u1 (x, x2 , . . . , xn )
k→+∞ ψ(k) ψ(k) ψ(k)
On obtient finalement
∀x ∈ S1 , u1 (x, x2 , . . . , xn ) 6 u1 (x1 , . . . , xn )
en passant à la limite dans (1). La stratégie x1 est donc la meilleure réponse du
joueur 1 aux stratégies (x2 , . . . , xn ). On peut reproduire le même raisonnement
pour les autres joueurs, ce qui montre que (x1 , . . . , xn ) est un équilibre de Nash
et clôt la preuve.
Commentaires.
© Ce développement est adapté d’un exercice présenté dans [Tes12].
© Le résultat présenté dans la question c) est un lemme de convergence diagonale
classique qu’il peut être utile de mentionner dans le plan de certaines leçons.
© On considère ici une situation classique en théorie des jeux : n joueurs participent
à un jeu séquentiel au cours duquel ils choisissent tour à tour des stratégies (ici
représentées par des vecteurs de réels) correspondant par exemple à la localisation
d’un pion sur un plateau, à un comportement binaire, à une quantité de biens
échangés... Les joueurs sont en interaction : chaque joueur i possède une fonction
d’utilité ui associant au n-uplet (x1 , . . . , xn ) des stratégies adoptées par tous les
joueurs un niveau de contentement individuel ui (x1 , . . . , xn ). À son tour, le joueur
i est invité à modifier sa stratégie xi pour maximiser son utilité compte tenu des
choix x̃i = (x1 , . . . , xi−1 , xi+1 , . . . , xn ) des autres joueurs, qui sont alors considérés
432
Analyse classique et complexe
comme fixés : il cherche donc à maximiser la valeur prise par la fonction d’utilité
partielle ux̃i i sur Si , c’est-à-dire à fournir une (ou la) meilleure réponse bi (x̃i ) aux
stratégies des autres joueurs. L’équilibre de Nash est alors une situation dans
laquelle les joueurs n’ont pas d’intérêt à modifier leur stratégie s’ils tiennent
les stratégies des autres joueurs pour fixées : chaque joueur fournit la meilleure
réponse possible aux stratégies adoptées par les autres.
© En l’absence d’hypothèse sur les Si et les ui , il n’existe pas nécessairement
d’équilibre de Nash pour un jeu donné. Considérons l’exemple de deux joueurs
dont l’un exerce sur l’autre une attirance non réciproque et qui doivent choisir où
passer leur soirée. Chacun peut choisir d’aller au théâtre ou de passer la soirée sur
la plage ; le joueur 1 préfèrera toujours passer la soirée sans le joueur 2, tandis que
le joueur 2 cherchera toujours à rejoindre le joueur 1. La matrice des paiements
(c’est-à-dire le tableau des utilités associées aux différents couples de stratégies)
de ce jeu est représentée dans la Figure 2.25. Il est intuitivement clair qu’au cours
du jeu séquentiel, le joueur 1 changera sans cesse de stratégie pour fuir le joueur 2,
tandis que celui-ci adoptera à chaque étape la stratégie adoptée par le joueur 1 au
tour précédent : il n’existe pas de point de stabilisation du système, c’est-à-dire
pas d’équilibre de Nash pour ce jeu. Une manière graphique de s’en convaincre est
de choisir une cellule de la matrice des paiements de la Figure 2.25 et de suivre les
changements de stratégie des deux joueurs à partir de cette cellule (qui équivalent
à un déplacement le long des lignes pour le joueur 1 et le long des colonnes pour
le joueur 2), ce qui permet de s’apercevoir du fait qu’aucun couple de stratégies
n’est stable. Ce raisonnement graphique n’est pas absolument nécessaire dans le
cas d’un jeu à deux stratégies, mais il s’avère très pratique pour des jeux plus
complexes à ensembles de stratégies finis.
Joueur 1
Théâtre Plage
Joueur 2
Théâtre 0; 5 4; 0
Plage 6; 0 0; 7
433
72. Théorème de Nash
Questions.
1. Rappeler pourquoi une suite à valeurs dans un compact converge si et seulement
si elle admet une unique valeur d’adhérence.
2. Justifier qu’un produit fini de compacts convexes est un compact convexe.
3. Montrer que la fonction Φ considérée dans la question d) est strictement
concave et que ux̃i,εi l’est pour tout i ∈ J1, nK, tout x̃i ∈ j6=i Si et tout ε > 0.
Q
Joueur 1
Se taire Dénoncer
Joueur 2
Se taire 2 ;2 1 ;10
Dénoncer 10 ;1 5 ;5
434
Analyse classique et complexe
On considère que l’utilité d’un joueur est une fonction strictement décroissante
de la peine dont il écope. Déterminer l’unique équilibre de Nash de ce jeu. Est-il
« socialement optimal », au sens où les deux joueurs ne pourraient pas atteindre
par la négociation un équilibre plus avantageux pour chacun ?
9. Un autre exemple classique en théorie des jeux est le jeu dit Bach ou Stravinsky
(aussi présenté sous la forme d’un jeu nommé guerre des sexes et opposant un
homme amateur de football à son épouse amatrice d’opéra...). Deux personnes
souhaitent se rendre à un concert ; l’une d’entre elles aime Bach, l’autre Stravinsky,
mais leur priorité est de passer la soirée ensemble. La matrice des paiements
pour ce jeu est donnée par la Figure 2.27. Déterminer les équilibres de Nash
correspondants.
Joueur 1
Bach Stravinsky
Joueur 2
Bach 5 ;3 0 ;0
Stravinsky 2 ;2 3 ;5
10. Déterminer les équilibres de Nash possibles pour le jeu décrit par la matrice
des paiements présentée dans la Figure 2.28.
Joueur 1
A B C D
A 5 ;3 0 ;0 5 ;1 1 ;1
Joueur 2
B 7 ;2 5 ;9 2 ;5 0 ;8
C 2 ;9 2 ;8 6, ;4 2 ;9
D -1 ;3 -10 ;2 2 ;2 -2 ;12
Chaque joueur i choisit cette fois une stratégie mixte πi ∈ Πi ; s’il conserve cette
stratégie mixte, il adopte à la fin du jeu une stratégie au hasard dans Si selon
435
72. Théorème de Nash
436
Analyse classique et complexe
γ 0 (t)
τ (t) =
kγ 0 (t)k
ainsi que la courbure ρ(t), le vecteur normal unitaire n(t) et le vecteur binor-
mal b(t) de Γ en γ(t) par
τ 0 (t)
ρ(t) = kτ 0 (t)k, n(t) = et b(t) = τ (t) ∧ n(t),
ρ(t)
pour une certaine fonction κ : [0, 1] → R. Cette fonction est nommée torsion
de la courbe Γ.
c) Calculer la courbure et la torsion de l’hélice circulaire dont une paramétri-
sation est donnée par :
t t βt
∀t ∈ [0, 1], γ(t) = α cos , α sin ,
r r r
où α, β ∈ R∗+ et r =
p
α2 + β 2 .
437
73. Formules de Frenet-Serret
Correction.
a) On remarque tout d’abord que τ , ρ, n et b sont des fonctions bien définies
sur le segment [0, 1] puisque γ 0 est dérivable et ne s’annule pas. Par ailleurs, pour
tout t ∈ [0, 1] le produit vectoriel b(t) des vecteurs τ (t) et n(t) leur est orthogonal
par définition. Pour tout t ∈ [0, 1], on a de plus
kb(t)k = kτ (t)k · kn(t)k · | sin(α)|,
où α ∈ [0, π[ est l’angle géométrique (c’est-à-dire non orienté) entre les vecteurs τ (t)
et n(t) dans le plan de R3 qu’ils engendrent, or kτ (t)k = kn(t)k = 1 donc b(t) est
de norme 1 si et seulement si τ (t) et n(t) sont orthogonaux. Il nous reste donc
à montrer que pour tout t ∈ [0, 1], les vecteurs τ (t) et n(t) sont orthogonaux,
c’est-à-dire que τ (t) et τ 0 (t) sont orthogonaux. Pour cela, on écrit simplement que
kτ k2 = hτ, τ i est une fonction constante (égale à 1), ce qui donne, par dérivation,
∀t ∈ [0, 1], hτ 0 (t), τ (t)i + hτ (t), τ 0 (t)i = 0
et donc
∀t ∈ [0, 1], hτ 0 (t), τ (t)i = 0.
Ainsi, pour tout t ∈ [0, 1], le vecteur τ (t) est orthogonal à τ 0 (t), et donc à n(t), ce
qui permet de conclure que (τ (t), n(t), b(t)) est une base orthonormée directe.
b) Démontrons successivement les trois formules attendues.
• On remarque en premier lieu que n (et donc b) est dérivable puisque γ est
trois fois dérivable. Par ailleurs, on a τ 0 (t) = ρ(t)n(t) pour tout t ∈ [0, 1] par
définition de n, ce qui établit la première formule de Frenet-Serret.
• Soit à présent t ∈ [0, 1]. On montre comme dans la question précédente que
les vecteurs n0 (t) et n(t) sont orthogonaux puisque n est à valeurs dans la
sphère unité de Rn . Le vecteur n0 (t) est donc dans le plan orthogonal n(t)⊥
de n(t), or τ (t) et b(t) forment une base orthonormale de n(t)⊥ d’après la
question précédente, donc on peut écrire la décomposition de n0 (t) dans cette
base sous la forme
n0 (t) = hn0 (t), τ (t)iτ (t) + hn0 (t), b(t)ib(t). (1)
Évaluons le premier produit scalaire apparaissant dans cette expression.
Comme hn(s), τ (s)i = 0 pour tout s ∈ [0, 1], on obtient en dérivant cette
relation et en l’évaluant en t :
d
hn0 (t), τ (t)i + hn(t), τ 0 (t)i = hn(s), τ (s)i = 0.
ds s=t
En utilisant la définition de n(t), on trouve alors
1 1
hn0 (t), τ (t)i = −hn(t), τ 0 (t)i = − hτ 0 (t), τ 0 (t)i = − kτ 0 (t)k2 = −ρ(t).
ρ(t) ρ(t)
La relation (1) donne alors
n0 (t) = −ρ(t)τ (t) + κ(t)b(t)
en posant κ(t) = hn0 (t), b(t)i, d’où la deuxième formule de Frenet-Serret.
438
Analyse classique et complexe
• Soit une fois encore t ∈ [0, 1]. Pour obtenir la troisième formule, dérivons la
relation b(s) = τ (s) ∧ n(s) en s = t : on obtient
b0 (t) = τ (t) ∧ − ρ(t)τ (t) + κ(t)b(t) = −ρ(t) τ (t) ∧ τ (t) + κ(t) τ (t) ∧ b(t)
puisque (τ (t), b(t), −n(t)) forme une base orthonormée directe de R3 , ce qui
clôt la preuve.
c) Pour tout t ∈ [0, 1], on a
α t α t β
γ 0 (t) = − sin , cos , ,
r r r r r
d’où
α2 t t β2 α2 + β 2
0 2
kγ (t)k = 2 sin2 + cos 2
+ = =1
r r r r2 r2
et donc kγ 0 (t)k = 1. On en déduit que si t ∈ [0, 1], par définition de τ on a
τ (t) = γ 0 (t), soit
α t α t
0
τ (t) = − 2 cos , − 2 sin ,0 .
r r r r
α t t
ρ(t) = 2 et n(t) = − cos , − sin ,0 .
r r r
β t β t α
b(t) = sin , − cos ,−
r r r r r
et donc
β t t β β
b0 (t) = 2
cos , sin , 0 = 2 n(t) d’où κ(t) = .
r r r r r2
Le paramètre α est donc un paramètre de courbure, tandis que le paramètre β
est un paramètre de torsion.
439
73. Formules de Frenet-Serret
Commentaires.
© Une illustration graphique de la propriété démontrée dans la question a) s’im-
pose. La Figure 2.29 représente un trièdre de Frenet associé au point γ(t) de Γ.
En suivant à l’œil l’évolution de τ le long de Γ dans la direction indiquée par τ ,
on se convainc facilement du fait que la dérivée de τ en t est bien colinéaire
à n(t). Le coefficient ρ(t), ici très faible, représente quant à lui la propension
qu’a τ , c’est-à-dire la « direction locale de la courbe Γ », à évoluer rapidement au
voisinage de t, ce qui justifie le terme de courbure employé. Il est d’ailleurs aisé de
voir que si ρ ≡ 0 alors Γ est un segment de droite !
Questions.
1. Redémontrer les formules donnant les différentielles du produit scalaire et du
produit vectoriel sur (R3 )2 .
2. Justifier que la base (τ (t), b(t), −n(t)) de R3 est bien orthonormée et directe.
3. Montrer que la torsion de Γ est nulle si et seulement si Γ est contenue dans un
plan affine de R3 .
4. Si t ∈ [0, 1], rappeler la définition du plan osculateur de Γ au point γ(t) en
fonction de γ(t), τ (t) et n(t). Expliquer en quoi la torsion peut être interprétée
comme une mesure de la propension qu’a Γ à s’éloigner de ce plan osculateur,
puis comparer les notions de courbure et de torsion.
Indication : on pourra s’aider de la deuxième formule de Frenet-Serret.
5. Interpréter le rôle des paramètres α et β dans le calcul de la courbure et de la
torsion de l’hélice circulaire compte tenu des questions précédentes.
Indication : on pourra représenter l’hélice circulaire pour différentes valeurs de α
et β puis s’interroger sur l’allure de la courbe lorsque α ou β tend vers 0.
6. Que devient le résultat de la question c) si l’on choisit
γ(t) = (α cos(t), α cos(t), βt)
pour nouveau paramétrage (d’une portion) de l’hélice circulaire ?
7. Montrer que le trièdre de Frenet est invariant par tout reparamétrage de la
courbe préservant l’orientation.
440
Analyse classique et complexe
Correction.
a) Par le théorème fondamental de l’analyse on peut écrire, pour tous x, y ∈ Rn ,
Z 1
f (y) = f (x) + h∇f (x + t(y − x)), y − xidt
0
Z 1
= f (x) + h∇f (x + t(y − x)) − ∇f (x) + ∇f (x), y − xidt
0
Z 1
= f (x) + h∇f (x), y − xi + h∇f (x + t(y − x)) − ∇f (x), y − xidt.
0
441
74. Méthode de descente de gradient
Or, 12 tk∇f (xk )k2 est toujours strictement positive à moins que ∇f (xk ) = 0, de
sorte que la suite est strictement décroissante sauf éventuellement si elle stationne
en un point critique xk . Dans tous les cas, elle converge comme suite décroissante
et minorée.
Par continuité, la suite (xk )k∈N doit converger vers un point fixe de la fonction itérée
dans la méthode, à savoir x 7→ x − t∇f (x), donc vers un point tel que ∇f (x) = 0,
autrement dit un point critique de f . Puisque f est strictement convexe, le seul
point critique éventuel x∗ est le minimum de f . Ainsi, (xk )k∈N converge vers x∗ .
b) Il reste à contrôler la vitesse de convergence. Supposons comme dans la question
précédente que t 6 1/L. Par convexité de f on a, pour tout x ∈ Rn ,
442
Analyse classique et complexe
1
f (y) − f (x∗ ) 6 kx − x∗ k2 + 2t∇f (x) · (x − x∗ ) − t2 k∇f (x)k2 − kx − x∗ k2
2t
1
6 (kx − x∗ k2 − kx − t∇f (x) − x∗ k2 ),
2t
où l’on a utilisé, pour la dernière inégalité, le développement du carré scalaire
Rappelons de plus que l’on a fait le choix y = x − t∇f (x), de sorte que l’inégalité
ci-avant se reformule en
1
f (y) − f (x∗ ) 6 (kx − x∗ k2 − ky − x∗ k2 ).
2t
On obtient alors par récurrence, avec x = xi pour un i > 0 et donc y = xi+1 , que
1
f (xi+1 ) − f (x∗ ) 6 (kxi − x∗ k2 − kxi+1 − x∗ k2 ).
2t
En sommant cette inégalité sur i ∈ J1, kK il vient, pour tout k > 0,
k k
1
(f (xi ) − f (x∗ )) 6 kxi−1 − x∗ k2 − kxi − x∗ k2
X X
i=1 i=1
2t
1
= kx0 − x∗ k2 − kxk − x∗ k2
2t
1
6 kx0 − x∗ k.
2t
Puisque f est décroissante sur chaque itération par la question précédente, on
peut donc écrire
k
1X
f (xk ) − f (x∗ ) = (f (xk ) − f (x∗ ))
k i=1
k
1X 1
6 (f (xi ) − f (x∗ )) 6 kx0 − x∗ k2 .
k i=1 2tk
443
74. Méthode de descente de gradient
Commentaires.
© La méthode de gradient est une méthode d’optimisation convexe très efficace
lorsqu’elle est utilisable. Elle est naturelle : pour minimiser la fonction, il suffit de
suivre la direction donnée par la plus grande pente descendante pendant un temps t,
puis itérer le processus en espérant converger vers un minimum. L’algorithme est
simple à implémenter, et chaque itération se réduit au calcul d’un gradient en un
point. Il est particulièrement rapide dans le cas de fonctions strictement convexes
ou lipschitziennes, comme dans ce développement. Toutefois, les problèmes réels
sont rarement modélisés par des fonctions strictement convexes et, surtout, cette
méthode ne peut en rien s’appliquer aux fonctions non différentiables.
© Ce développement permet de conclure à une convergence de la méthode de
descente de gradient avec une vitesse en O(1/k) lorsque k tend vers +∞. Ce
résultat demeure pour les fonctions seulement supposées convexes. Il est en fait
possible de montrer que la méthode de descente de gradient converge beaucoup
plus rapidement lorsque la fonction est strictement convexe, précisément en O(λk )
pour un certain 0 < λ < 1.
© Ainsi que constaté lors de la preuve, la méthode de gradient peut diverger
pour un pas t trop grand. Lorsque t est trop petit, l’algorithme peut être en
pratique beaucoup trop lent pour être utilisable. Il existe des algorithmes plus fins
permettant de choisir un t dépendant de k, par exemple la méthode de gradient à
pas optimal. Enfin, la méthode du gradient conjugué est un algorithme convergeant
vers la solution en un nombre fini d’étapes, au prix de l’utilisation du coûteux
procédé d’orthonormalisation de Gram-Schmidt.
© Un résultat de Nesterov énonce qu’en considérant des fonctions convexes diffé-
rentiables, on ne peut faire mieux qu’une convergence en O(1/k 2 ). Si l’on étend
la question aux fonctions qui sont lipschitziennes mais qui ne sont plus nécessaire-
√
ment différentiables, alors il existe un algorithme qui converge en O(1/ k), et
cette vitesse de convergence est optimale d’après un résultat de Carmon en 2017.
Questions.
1. Détailler l’utilisation du théorème fondamental de l’analyse faite dans la ques-
tion a).
2. Rappeler pourquoi un point critique d’une fonction convexe est nécessairement
un minimum. Est-il unique ?
3. Montrer que si ∇f est L-lipschitzienne, alors D2 f (y) − LIn est semidéfinie
négative pour tout élément y ∈ Rn .
444
Analyse classique et complexe
24. La définition d’une matrice à diagonale strictement dominante est donnée à la page 451.
445
75. Méthode de Gauss-Seidel
Correction.
a) (i) Notons |||·||| la norme subordonnée à la norme k · k∞ .
Supposons que ρ(T ) < 1. Vérifions qu’alors |||T ||| < 1. C’est immédiat si T = 0 ;
on suppose désormais T 6= 0. Quitte à mettre T sous forme normale de Jordan
(voir Développement 80), on peut la supposer diagonale par blocs, avec des blocs
de la forme
λ 1
.. ..
. .
J = ∈ Mm (C)
..
. 1
λ
pour un certain m ∈ J1, nK et une valeur propre λ ∈ C de T . Pour k supérieur à
la taille m de ce bloc, on obtient par récurrence
k k−1 k k−2 k k−m+1
λk
1 λ 2 λ ··· m−1 λ
k k−1 k k−m+2
0 λk 1 λ ··· m−2 λ
k
J = .. .. .. ..
.
. . . .
.. .. k k−1
. λk
. 1 λ
0 ··· ··· 0 λk
Comme on a supposé que ρ(T ) < 1, on a |λ| < 1 pour toute valeur propre λ de T .
En particulier, les blocs J k de la forme ci-avant convergent vers 0 lorsque k tend
vers +∞. En changeant les matrices de base, on en déduit que la suite (T k )k∈N
converge également vers 0 lorsque k tend vers +∞.
Réciproquement, supposons que ρ(T ) > 1. Il est aisé de vérifier que la suite (T k )k∈N
ne converge pas vers la matrice nulle lorsque k → +∞. En effet, il suffit de
considérer l’image par T k d’un vecteur propre X ∈ Cn \ {0} associé à une valeur
propre λ de module ρ(T ) > 1 : la suite (T k X)k∈N est alors égale à (λk X)k∈N qui
ne converge pas vers 0.
Ainsi, la suite (T k )k∈N converge vers la matrice nulle si et seulement si ρ(T ) < 1.
T k est convergente.
P
(ii) Supposons que ρ(T ) < 1. Montrons que la série
Puisque la norme d’opérateur |||·||| est sous-multiplicative, on a |||T k ||| 6 |||T |||k
pour tout k ∈ N. Par comparaison aux séries géométriques, on obtient donc que
la série |||T |||k est convergente, autrement dit que la série T k est absolument
P P
446
Analyse classique et complexe
et puisque (T r X0 )r∈N converge vers 0 par la question a)(i), la suite (Xr )r∈N
est convergente. On note X∞ sa limite. De plus, l’application U 7→ T U + C est
continue ; on peut donc passer à la limite dans la relation Xr+1 = T Xr + C valable
pour tout r > 0, ce qui donne
X∞ = T X∞ + C.
De plus, puisque ρ(T ) < 1, la question a)(ii) garantit que In − T est inversible,
de sorte que X∞ = (In − T )−1 C est l’unique solution au système X = T X + C.
Ainsi, si ρ(T ) < 1, la méthode (75) converge bien vers l’unique solution de
l’équation X = T X + C.
• Réciproquement, supposons que la méthode converge pour toute valeur initiale
vers une solution de X = T X + C et que cette solution est unique. Nous allons
prouver que pour tout Z ∈ Rn la suite (T k Z)k∈N tend vers 0 ∈ Rn .
Notons X ∈ Rn l’unique solution de X = T X + C et prenons Z ∈ Rn arbitraire.
Posons X0 = X − Z. Par définition on a la relation de récurrence Xk = T Xk−1 + C
pour tout k > 1, ainsi que la relation X = T X + C par hypothèse. On a donc,
par une récurrence immédiate,
∀k ∈ N, X − Xk = T (X − Xk−1 ) = · · · = T k (X − X0 ) = T k Z.
447
75. Méthode de Gauss-Seidel
Rappelons que l’on a par définition −U = (aij δj>i )i,j et D − L = (aij δj6i )i,j . La
relation (2) s’écrit donc, en considérant le i-ème coefficient de U ξ = λ(D − L)ξ,
X X
− ai0 j ξj = λ a i0 j ξj . (3)
j>i0 j6i0
X X
ai0 j ξj > |ai0 i0 | − |ai0 j |,
j6i0 j<i0
et cette dernière quantité est strictement positive car on a supposé que A est à
diagonale strictement dominante. L’équation (3) permet alors d’écrire
X X X
ai0 j ξj |ai0 j | · |ξj | |ai0 j |
j>i0 j>i0 j>i0
|λ| = 6 X 6 X ,
X |ai0 i0 | − |ai0 j | · |ξj | |ai0 i0 | − |ai0 j |
a i0 j ξj j<i0 j<i0
j6i0
Commentaires.
© La preuve de la question a)(i) utilise de manière centrale la forme normale
de Jordan. Cet argument est à mettre en parallèle avec la démonstration d’un
résultat très proche dans le Développement 56, où les sous-espaces caractéristiques
sont utilisés de façon cruciale : il s’agit essentiellement de la même preuve.
© L’idée sous-jacente aux méthodes itératives permettant de résoudre le système
linéaire AX = B est de réécrire ce système en faisant apparaître les solutions
comme points fixes d’un opérateur affine, i.e. de la forme X 7→ T X + C. Ainsi,
sous la condition ρ(T ) < 1, la solution peut alors être approchée par la méthode
itérative (
X0 ∈ Rn
Xk+1 = T Xk + C, pour tout k > 0.
© Cette technique n’est pas sans rappeler les méthodes itératives de type lip-
schitzien. En effet, on peut dans un premier temps ignorer la constante C en
considérant l’application linéaire sous-jacente : on a alors une majoration de la
forme kT Xk+1 − T Xk k 6 ρ(T )kXk+1 − Xk k, si bien que la condition ρ(T ) < 1
implique que T est contractante et la méthode converge vers l’unique point fixe
de T .
448
Analyse classique et complexe
449
75. Méthode de Gauss-Seidel
Questions.
1. Écrire en détail la réduction de la question a)(i) au cas des blocs de Jordan.
2. Pourquoi la condition |λ| < 1 implique-t-elle que le bloc J k défini dans la
question a)(i) converge vers la matrice nulle lorsque k tend vers +∞ ?
3. La condition ρ(T ) < 1 est-elle nécessaire pour que In − T soit inversible ?
4. Montrer que la convergence absolue implique la convergence si et seulement si
l’espace considéré est complet.
5. Montrer que AX = B si et seulement si
X = (D − L)−1 U X + (D − L)−1 B.
450
Analyse classique et complexe
a) Une méthode converge si, pour tous x, b ∈ Cn , (xn )n∈N converge vers A−1 b.
n
(i) Montrer que, pour tout n ∈ N, on a xn − A−1 b = M −1 N (x0 − A−1 b).
(ii) En déduire que la méthode (xn )n∈N est convergente si ρ(M −1 N ) < 1.
b) Montrer le théorème de Gershgorin :
451
76. Méthode de relaxation
Correction.
a) (i) Notons que (M − N )A−1 b = b par définition de l’inverse et puisqu’on a
la décomposition A = M − N . On a donc, en multipliant par M −1 à gauche,
A−1 b = M −1 b + M −1 N A−1 b.
Soit i ∈ J1, nK tel que |xi | = maxj |xj | > 0. On déduit alors
n
X
(λ − aii )xi = aij xj ,
j=1
j6=i
Soit λ une valeur propre non nulle de M −1 N = (ωM )−1 (ωN ). C’est en particulier
une racine du polynôme caractéristique
452
Analyse classique et complexe
|λ + ω − 1| < ω|λ|,
Commentaires.
© La méthode de relaxation est l’une des méthodes itératives de base d’approxima-
tion des solutions d’un système linéaire. En effet, considérons le système linéaire
générique donné sous la forme
Ax = b, A ∈ Mn (C), b ∈ Cn .
x = M −1 (N x + b).
453
76. Méthode de relaxation
Cette équation fait apparaître les solutions x comme des points fixes, motivant
l’utilisation d’une méthode itérative, introduisant comme dans l’énoncé la suite
(
x0 = M −1 (N x + b),
xn+1 = M −1 (N xn + b), ∀n ∈ N.
Questions.
1. Prouver la réciproque de la question a).
2. Montrer que si ρ(M ) < 1, alors M n tend vers zéro lorsque n → +∞.
3. Justifier que le théorème de Gershgorin permet de déduire (2).
4. Montrer qu’une matrice à diagonale strictement dominante est inversible.
454
Analyse classique et complexe
ai bi
αi = ∈ RN , βi = ∈ R,
kai k kai k
455
77. Méthode de Kaczmarz
Correction.
a) Soit x ∈ RN . Comme u est unitaire, le projeté orthogonal de x sur la droite
vectorielle Vect (u) est hu, xi u. De ce fait, le projeté orthogonal de x sur l’hyperplan
vectoriel Vect (u)⊥ est
t t
x − hu, xi u = x − ux u = x − u ux = IN − ut u x,
εn+1 = Mi εn ,
Ainsi, la suite (kεn k)n∈N est décroissante et minorée par 0, donc converge vers un
réel ` > 0.
d) On sait déjà que |||T ||| 6 |||MN ||| · |||MN −1 ||| · · · |||M1 ||| = 1. Supposons qu’il
existe un vecteur x ∈ RN tel que kT xk = kxk. Il s’agit de montrer que x = 0.
Pour tout i ∈ J1, N K, on a
d’où
kMi (Mi−1 · · · M1 x)k = kxk . (∗)
Montrons alors par récurrence sur i ∈ J1, N K que
x ∈ Vect (αi )⊥ et Mi · · · M1 x = x.
456
Analyse classique et complexe
x = Mi x = Mi (Mi−1 · · · M1 x),
Commentaires.
© Il convient de compléter la présentation du développement par la Figure 2.30
ci-après.
H2
x2 x0
• •
x4 H1
a1 • •
x1
• •
• • x3
x̄ ••
•
a2
Sur ce dessin, les vecteurs a1 , a2 ∈ R2 sont les transposées des lignes d’une
matrice inversible A ∈ GL2 (R). Leurs orthogonaux donnent la direction des
457
77. Méthode de Kaczmarz
kεn+1 k
6 kMi k < 1.
kεn k
La suite (xn )n∈N converge donc au pire linéairement vers x̄, mais sa vitesse exacte
de convergence est toutefois difficile à évaluer.
Par ailleurs, la suite (xn )n∈N est déterminée par la relation de récurrence
458
Analyse classique et complexe
Questions.
1. Soient x ∈ RN et u ∈ RN \ {0} unitaire. Justifier les affirmations suivantes for-
mulées à la question a) : le projeté orthogonal de x sur la droite vectorielle Vect (u)
est hu, xi u, puis le projeté orthogonal de x sur l’hyperplan vectoriel Vect (u)⊥ est
x − hu, x, ui = IN − ut u x.
459
77. Méthode de Kaczmarz
6. Soit S une matrice réelle symétrique définie positive. Montrer qu’il existe une
matrice A ∈ GLN (R) telle que S = At A. La matrice A est-elle unique ?
7. On reprend à nouveau les notations du développement. On considère le système
linéaire At Az = b. Soit (zn )n∈N la suite des itérés de la méthode de Gauss-Seidel ap-
pliquée à ce système pour z0 = (t A)−1 x0 (voir Développement 75). Pour i ∈ J1, nK,
(i)
on note zn la i-ème composante de zn , et on définit ζr ∈ RN de la manière
suivante pour tout r ∈ N :
ζ0 = z0 ,
t (1) (2) (i) (i+1) (N )
ζ
jN +i = zj+1 , zj+1 , . . . , zj+1 , zj , . . . , zj pour tous j > 0 et i ∈ J1, N K .
La suite (ζr )r∈N est donc la suite des itérés de la méthode de Gauss-Seidel actualisés
composante par composante.
(i) Soit r = jN + i > 1. Montrer que t αi t Aζr = βi , autrement dit que ζr ∈ Hi .
Indication : écrire la relation qui lie zj à zj+1 par la méthode de Gauss-Seidel,
et examiner leur i-ème composante.
(ii) Montrer que pour tout r = jN + i > 1, t Aζr est le projeté orthogonal
de t Aζr−1 sur Hi .
Indication : on pourra examiner le produit scalaire donné par
t Aζ − t Aζ t
r r−1 , Aζr − x , pour x ∈ Hi .
(iii) Montrer que pour tout r ∈ N, xr = t Aζr .
(iv) En déduire une preuve de la convergence de la méthode de Gauss-Seidel
appliquée à une matrice réelle symétrique définie positive.
460
Analyse classique et complexe
Une fonction locale est un couple (f, D) où D est un disque ouvert non vide
et f est une fonction holomorphe sur D. Soit γ : [0, 1] → C une courbe. Un
prolongement analytique (voir Figure 2.31) de (f, D) le long de γ est une
famille de fonctions locales (ft , Dt )t∈[0,1] telle que
a) (f0 , D0 ) = (f, D),
b) pour tout t ∈ [0, 1], γ(t) est le centre de Dt ,
c) pour tout t ∈ [0, 1], il existe ε > 0 tel que pour tout t0 ∈ [0, 1] vérifiant
|t − t0 | < ε, γ(t0 ) ∈ Dt ∩ Dt0 et ft ≡ ft0 sur cette intersection.
γ(t)
• • •
γ(0) Dt0 γ(1)
Dt •
γ(t0 )
Dt ∩ Dt0
Soit (f, D) une fonction locale et γ un chemin tel que γ(0) soit le centre de D.
Considérons (f1 , D1 ) et (fe1 , D
e 1 ) les éléments terminaux de deux prolongements
analytiques de (f, D) le long de γ.
Montrer que f1 et fe1 sont égales sur D1 ∩ D
e 1.
Correction.
Introduisons l’ensemble
n o
S = t0 ∈ [0, 1] : ∀t ∈ [0, t0 ], ft ≡ fet sur Dt ∩ D
et .
L’ensemble S n’est pas vide car il contient 0 par définition. Puisque le segment [0, 1]
est connexe, il suffit de prouver que S est ouvert et fermé pour conclure que l’on
a S = [0, 1].
461
78. Prolongement analytique suivant une courbe
Det ∩ D e 0 et
∞ t
fet∞ ≡ fet0 sur D
et ∩ D
∞
e 0.
t
Soit j ∈ N suffisamment grand tel que |tj − t∞ | < min(ε, εe). En particulier, il
vient
Puisque tj ∈ S, on a également
qui n’est pas vide. En particulier, ft∞ ≡ fet∞ sur cette intersection. Par le principe
des zéros isolés ft∞ et fet∞ coïncident donc sur Dt∞ ∩ D e t , autrement dit t∞ ∈ S.
∞
Ainsi, S est fermé.
• Prouvons que S est ouvert.
Soit T le complémentaire de S dans [0, 1]. Prouvons que T est fermé. Soit (tj )j∈N
une suite de T convergeant vers une limite notée t∞ . Pour j ∈ N, puisque tj ∈/ S,
il existe sj ∈ [0, 1] tel que sj 6 tj et
Quitte à extraire une sous-suite de (sj )j∈N , on peut supposer qu’elle converge vers
une limite notée s∞ ∈ [0, 1]. On a alors s∞ 6 t∞ car pour tout j > 1 on a sj 6 tj .
Il suffit donc de prouver que
462
Analyse classique et complexe
avec cette intersection qui est non vide pour les mêmes raisons que (2). Cela est
contraire à l’hypothèse (3). Ainsi, t∞ ∈ T et donc T est fermé, autrement dit S
est ouvert.
On conclut par connexité que S = [0, 1] et en particulier que 1 ∈ S. Ainsi, par
définition de S, on déduit que f1 et fe1 coïncident sur D1 ∩ D
e 1.
Commentaires.
© Le problème de l’existence d’un prolongement analytique pour une fonction
holomorphe donnée est un problème fondamental dans de nombreux domaines
des mathématiques, de la géométrie à la théorie des nombres. Autour d’un point
où une fonction est holomorphe, elle admet un prolongement analytique qui est
unique par le principe des zéros isolés. Cet argument peut permettre d’obtenir,
de proche en proche, un prolongement analytique sur des domaines plus grands
que le domaine initial. Le résultat prouvé ici garantit qu’en suivant un chemin
donné, une telle extension est unique si elle existe.
© La question se complique lorsque plusieurs chemins sont possibles. Si une
fonction est holomorphe au voisinage d’un point x0 et admet un prolongement
holomorphe de proche en proche le long de deux chemins γ et γ 0 qui se terminent
en un point x1 , rien ne garantit que les deux prolongements obtenus coïncident au
voisinage de x1 . Ainsi, la racine carrée admet deux prolongements holomorphes
en suivant les deux demi-cercles reliant 1 à −1, mais ces deux prolongements ne
coïncident pas au voisinage de −1.
© Ces questions sont le début de la théorie de la monodromie. L’un des premiers
résultats de cette théorie, qui se prouve avec les mêmes idées que le développement
présenté ici, est le suivant.
Soit Ω ⊂ C un ouvert connexe. Soit (f, D) une fonction locale où D ⊆ Ω
et x0 le centre de D. Supposons que f admette un prolongement
analytique le long de toute courbe de Ω commençant en x0 . Alors
si γ et γ 0 sont deux courbes commençant en x0 , terminant en x1 ∈ Ω
et homotopes dans Ω (autrement dit, qui peuvent être continûment
déformées l’une en l’autre tout en restant dans Ω), alors les deux
prolongements analytiques le long de γ et γ 0 coïncident.
Ainsi, même si le chemin suivi pour le prolongement est différent, la fonction
locale au point final est toujours la même tant qu’il n’y a pas de « trou » dans
le domaine de définition qui est entouré par les deux chemins (c’est le sens de
l’hypothèse d’homotopie) : on dit que le groupe de monodromie de la surface est
trivial, c’est par exemple le cas de la sphère ou du plan... mais pas du tore !
Questions.
1. Que dire du domaine d’holomorphie de z 7→ n>0 z n ?
P
2. Soit D = D(2, 1) et f (z) = ln |z| + iarg(z) où −π/6 < arg(z) < π/6. Montrer
que f admet deux prolongements analytiques différents jusqu’à −1.
Remarque : on peut prouver que toutes les branches du logarithme complexe
peuvent être obtenues par prolongement le long d’une courbe à partir de D(2, 1).
463
79. Domaines d’holomorphie à une variable
1 1
Aj = z ∈ U : < δ(z) 6 j .
4j+1 4
Notons Cj l’ensemble des carrés Cj (k, l) avec k, l ∈ Z. Notons que les carrés
fermés Cj (k, l), pour k, l ∈ Z, forment un recouvrement du plan complexe.
Considérons zj (k, l) le centre du carré Cj (k, l). Voir Figure 2.33.
a) Soient j > 2 et k, l ∈ Z tels que C j (k, l) ∩ Aj 6= ∅. Montrer que
1
zj (k, l) ∈ U et δ(zj (k, l)) 6 .
4j−1
Considérons l’ensemble Dj des zj (k, l) tels que C j (k, l) ∩ Aj 6= ∅, avec k, l ∈ Z.
Puisque c’est un ensemble dénombrable, il en va de même de D = ∪j>2 Dj .
b) Prouver qu’il n’existe pas de point d’accumulation de D dans U .
c) Prouver que tout point de ∂U est un point d’accumulation de D.
d) Conclure que U est un domaine d’holomorphie, autrement dit :
464
Analyse classique et complexe
Correction.
a) Supposons que C j (k, l) ∩ Aj 6= ∅ et considérons un point z dans cette inter-
section. Par définition de Aj on √ a δ(z) > 4−(j+1) . Puisque zj (k, l) est√le centre du
carré Cj (k, l) qui est de rayon 22 · 8−j , on a aussi d(z, zj (k, l)) 6 22 8−j < 8−j .
Alors le centre zj (k, l) est dans U car, par l’inégalité triangulaire et puisque j > 2,
1 1
δ(zj (k, l)) = d(zj (k, l), C\U ) > δ(z) − d(z, zj (k, l)) > − > 0.
4j+1 8j
Par ailleurs, par définition de Aj on a également δ(z) 6 4−j . Ainsi, par inégalité
triangulaire on a également
1 1 1
δ(zj (k, l)) 6 d(z, zj (k, l)) + δ(z) 6 √ j
+ j 6 j−1 .
2·8 4 4
b) Supposons qu’il y ait un point d’accumulation de D dans U . Dans ce cas,
quel que soit J ∈ N∗ , il existerait deux points distincts z et z 0 de D tels que
|z − z 0 | < 16−J . Ces points ne peuvent pas être dans un Dj avec j < J, car ils
seraient alors centres ou sommets de deux carrés distincts 26 de côtés 8−J , et leur
26. Noter que, pour tout j > 1, les Scentres des carrés de Cj sont parmi les sommets des carrés
de Cj+1 , de sorte que les éléments de j<J Dj sont tous parmi les centres et sommets des carrés
de CJ par une récurrence
√
immédiate. En particulier, ils sont distants d’au moins un demi-diamètre
de carré, soit 22 8−J
465
79. Domaines d’holomorphie à une variable
√
2 −J
distance serait au moins 2 8 > 16−J , ce qui n’est pas. On en conclut que
z, z 0 ∈
[
Dj . (1)
j>J
On aurait alors δ(z) < 41−J et δ(z 0 ) < 41−J par définition de Dj et par la
question a). Ainsi, si a est un point d’accumulation de D, alors il ne peut être
dans aucun Dj puisqu’il existe des points z 0 de D arbitrairement proches de a et,
par ce qui précède, (1) serait donc vérifiée pour tout J ∈ N∗ . Ainsi, tout point
d’accumulation a de D vérifie δ(a) = z, autrement dit est dans ∂U .
c) Soit j > 2. Soit z0 ∈ ∂U , et soit 0 < ε < 1/4. Par définition de la frontière,
on a U ∩ B(z0 , ε) 6= ∅, où B(z0 , ε) est la boule de centre z0 et de rayon ε > 0,
donc il existe z ∈ U ∩ B(z0 , ε), de sorte que δ(z) < ε. Soit j > 2 l’entier tel
que z ∈ Aj , autrement dit qui vérifie δ(z) ∈ ]4−(j+1) , 4−j ]. Puisque les C j (k, l)
recouvrent Aj , il existe k, l ∈ Z tels que z ∈ C j (k, l). Le centre zj (k, l) de ce carré
est alors dans Dj , et de plus par l’inégalité triangulaire on a
1
d(zj (k, l), z0 ) 6 d(zj (k, l), z) + d(z, z0 ) 6 + ε < δ(z) + ε < 2ε.
8j
Ainsi, le disque B(z0 , 2ε) contient un point de D pour tout ε > 0, ce qui prouve
que z est un point d’accumulation de D.
d) Par le théorème du produit de Weierstrass, puisque D est dénombrable et
sans point d’accumulation dans U par la question b), il existe une fonction f
holomorphe sur U dont l’ensemble des zéros est exactement D.
Supposons qu’il existe un prolongement holomorphe de f sur un voisinage du
point z ∈ ∂U , que l’on note encore f . Par la question précédente, z ∈ ∂U est un
point d’accumulation d’éléments de D, donc un point d’accumulation des zéros de
f . Par le principe des zéros isolés, puisque U est connexe, la fonction f est nulle,
ce qui n’est pas le cas puisque l’ensemble des zéros de f sur U est D ( U .
Ainsi f ne peut être prolongée analytiquement au voisinage d’aucun point de ∂U .
Commentaires.
© La preuve de ce résultat est la formalisation d’un argument géométrique assez
facile, et il est important de ne pas se laisser noyer dans le formalisme mais de s’ap-
puyer régulièrement sur des dessins pour comprendre et motiver les constructions
et les arguments. Nous ne prouvons trop conseiller de présenter cette preuve à
l’oral, avec comme seul appui des dessins des différentes quantités considérées dans
le plan complexe. Cela sera un exercice utile comme pont entre vision géométrique
et formalisme, et un entraînement pour répondre à des questions naturelles du
jury qui se justifient clairement sur un dessin de la situation.
© On appelle domaine d’holomorphie l’ensemble maximal d’existence d’une fonc-
tion holomorphe, i.e. un domaine où la fonction est holomorphe sans qu’elle
n’admette de prolongement analytique sur un domaine strictement plus grand.
Puisque toute fonction holomorphe sur un domaine U est analytique au voisinage
466
Analyse classique et complexe
Questions.
1. Préciser pourquoi δ(z) > 0 est équivalent à z ∈ U .
2. Dans la correction de la question a), justifier que
467
79. Domaines d’holomorphie à une variable
468
Analyse classique et complexe
b) Montrer que les Pk sont les matrices dans la base canonique de Cn des
projections associées à la décomposition
r
M
Mn,1 (C) = Ek ,
k=1
27. Une fonction à valeurs dans Mn (C) est analytique si elle l’est composante par composante.
Tous les résultats classiques de la théorie des fonctions holomorphes d’une variable complexe,
notamment le théorème de Cauchy, se transposent à ce cadre.
28. Les intégrales de matrices sont définies composante par composante : pour un chemin γ
dans C et une fonction f : C → Mn (C), on définit la matrice γ f dont les composantes sont,
R
469
80. Forme normale de Jordan et résidus
d) En déduire la décomposition
r
X
A= (λk Pk + Nk ) , (1)
k=1
Dans l’écriture ci-avant, les éléments omis représentent des zéros. La matrice B
est la forme normale de Jordan de A.
Correction.
a) (i) La formule de la comatrice donne, pour λ ∈
/ Sp(A), la relation explicite
t com(λI − A)j,k
n
R(λ)j,k = , (2)
det(λIn − A)
pour tous j, k ∈ J1, nK. Les coefficients de la comatrice sont des déterminants
de sous-matrices de A − λIn , de sorte que ce sont des polynômes en λ et donc
des fonctions holomorphes. Les seuls pôles possibles des R(·)j,k sont les valeurs
de λ annulant det(λIn − A), autrement dit les valeurs propres de A. Ainsi, R est
analytique sur DA .
(ii) Soient λ, λ0 ∈ DA . Puisque A et λIn − A commutent, A et R(λ) commutent.
De plus, par définition, R(λ)(λIn − A) = In et (λ0 In − A)R(λ0 ) = In , de sorte que
470
Analyse classique et complexe
support compact γk et γj ,
R(λ) − R(λ0 )
Z Z Z Z
0 0
2
(2iπ) Pk Pj = R(λ)R(λ )dλdλ = dλdλ0
γk γj γk γj λ0 − λ
!
dλ0 dλ
Z Z Z Z
0
= R(λ) dλ − R(λ ) dλ0 .
γk γj λ0 − λ γj γk
0
λ −λ
pour tout λ ∈ γk ([0, 1]) et λ0 ∈ γj ([0, 1]), de sorte que la quantité λ−λ0 ne s’annule
pas. Ainsi, les intégrales intérieures sont des intégrales de fonctions holomorphes
sur des contours fermés n’entourant aucun de leurs pôles (sinon on aurait l’inégalité
|λk − λj | 6 η, ce qui n’est pas le cas par définition de η), et sont donc nulles par
le théorème de Cauchy.
Supposons à présent k = j. Introduisons le contour
γ̃k : [0, 1] −→ C
1
t 7−→ λk + 2 η exp(2iπt),
dont l’image est contenue dans le disque ouvert délimité par γk . Par holomorphie
de R, on a
1 1
Z Z
Pk = R(λ)dλ = R(λ0 )dλ0 ,
2iπ γk 2iπ γ̃k
de sorte que
1
Z Z
Pk2 = R(λ)R(λ0 )dλdλ0
(2iπ)2 γk γ̃k
1 dλ0 1 dλ
Z Z Z Z
0
= R(λ) 0−λ
dλ − R(λ ) 0−λ
dλ0 . (3)
(2iπ)2 γk γ̃k λ (2iπ) 2
γ̃k γk λ
Pour λ ∈ γk ([0, 1]) et λ0 ∈ γ̃k ([0, 1]), le contour γ̃k n’entoure pas λ, de sorte que
la première intégrale intérieure est nulle par holomorphie. Le contour γk fait une
fois le tour de λ0 dans le sens direct, donc son indice est 1, de sorte que la seconde
intégrale intérieure vaut −2iπ par le théorème des résidus. Ainsi, l’équation (3)
donne Pk2 = Pk comme souhaité.
(ii) Pour ρ > 0, introduisons le contour γρ : t ∈ [0, 1] 7→ ρ exp(2iπt). Puisque A
admet un nombre fini de valeurs propres, le contour γρ fait le tour de chaque
valeur propre une et une seule fois dans le sens direct pour ρ assez grand. Soit un
tel ρ. Il vient alors par holomorphie
r r Z
1 X 1
X Z
Pk = R(λ)dλ = R(λ)dλ
k=1
2iπ k=1 γk 2iπ γρ
1 1
Z
= R(λ)(λIn − A) + R(λ)A dλ
2iπ γρ λ
In dλ A R(λ)
Z Z
= + dλ,
2iπ γρ λ 2iπ γρ λ
471
80. Forme normale de Jordan et résidus
Lorsque ρ tend vers l’infini, la seconde intégrale tend donc vers zéro, donnant le
résultat voulu.
c) (i) Avec l’identité (1) entre résolvantes on a, pour k 6= j et en appliquant le
théorème de Fubini,
Z Z
2
(2iπ) Nk Pj = (λ − λk )R(λ)R(λ0 )dλdλ0
γk γj
R(λ) − R(λ0 )
Z Z
= (λ − λk ) dλdλ0
γk γj λ0 − λ
λ − λk λ − λk
Z Z Z Z
= R(λ)dλdλ0 − R(λ0 )dλdλ0
γk γj λ0 − λ γk γj λ0 − λ
!
dλ0 λ − λk
Z Z Z Z
0
= R(λ)(λ − λk ) dλ − R(λ ) dλ dλ0 ,
γj γk λ0 − λ γk γj λ0 − λ
et par holomorphie, comme dans la question b)(i), les deux intégrales de contour
intérieures sont nulles, donc Nk Pj = 0.
Si j = k, le même calcul que dans la question b)(i), en ajoutant les facteurs λ − λk
dans les intégrandes, prouve que Nk Pk = Nk .
Par ailleurs, l’application ci-avant du théorème de Fubini prouve que l’on a l’égalité
Nk Pj = Pj Nk pour tous k, j ∈ J1, rK.
(ii) De la même manière on a, pour k 6= j,
Z Z
(2iπ)2 Nk Nj = (λ − λk )(λ0 − λj )R(λ)R(λ0 )dλdλ0
γk γj
(λ − λk )(λ0 − λj )
Z Z
= R(λ)dλdλ0
γk γj λ0 − λ
(λ − λk )(λ0 − λj )
Z Z
− R(λ0 )dλdλ0
γk γj λ0 − λ
λ0 − λj 0
Z Z
= R(λ)(λ − λk ) 0
dλ dλ
γj γk λ − λ
!
λ − λk
Z Z
0 0
− R(λ )(λ − λj ) dλ dλ0 ,
γk γj λ0 − λ
472
Analyse classique et complexe
La première intégrale est nulle par calcul direct et la seconde est exactement 2iπNk
par définition, comme voulu.
(iv) Soit k ∈ J1, rK. La formule de la comatrice montre que λ 7→ (λ − λk )αk R(λ)
admet un prolongement analytique en λk . En effet, en écrivant
t com(A− λIn )
(λ − λk )αk R(λ) = (λ − λk )αk ,
det(A − λIn )
on constate que le pôle d’ordre αk de R en λk , dû au zéro d’ordre αk du poly-
nôme caractéristique det(A − XIn ) en λk , est exactement compensé par le terme
(λ − λk )αk .
Rappelons que les matrices Pk et A commutent et que Pk est un projecteur. De
ce fait et du résultat de la question précédente on tire que pour tout m > 1,
Puisque l’intégrande est holomorphe dans le disque délimité par γk pour m > αk ,
on en tire que la matrice Nk est nilpotente et que son indice de nilpotence est au
plus égal à αk .
d) Par les résultats des points b)(ii) et c)(iii), on obtient
r
X r
X r
X r
X r
X
A = In A = Pk A = λk Pk + Pk (A − λk In ) = λ k Pk + Nk .
k=1 k=1 k=1 k=1 k=1
473
80. Forme normale de Jordan et résidus
P
Puisque k Pk = In , les sous-espaces Ek sont supplémentaires dans E. Comme Nj
et Pk commutent pour tous j, k ∈ J1, rK d’après la question c)(i), les sous-
espaces Ek sont stables par l’action naturelle des Nj . L’action de A sur l’espace Ek
est donnée par b)(i) et c)(i). Plus précisément, pour k ∈ J1, rK on a :
∀v ∈ Ek , Av = λk v + Nk v.
Soit v un vecteur de Ek tel que Nkαk −1 v 6= 0 ; un tel vecteur existe par la ques-
tion c)(iv). Il est classique de vérifier qu’alors le système (Nkαk −1 v, . . . , Nk2 v, Nk v, v)
forme une famille libre, engendrant un sous-espace F stable par Nk . Dans cette
base, Nk admet pour matrice
0 1
.. ..
. .
∈ Mαk (C).
..
. 1
0
Commentaires.
© Le développement peut paraître long à cause des nombreux détails de calculs
qui y figurent, ce qui justifie son niveau de difficulté FFF. Il est important
de faire des choix pour synthétiser les trois étapes principales de la preuve :
établir l’identité entre résolvantes, vérifier les propriétés des Pk et Nk , et enfin
traduire ces dernières en termes de décomposition de Jordan. Les candidats moins
à l’aise pourraient présenter avec beaucoup de détails les questions a) et b)
seulement, qui sont très riches. On pourrait aussi penser à limiter la question c) à
la démonstration du point (iv) en expliquant que les autres points qui composent
cette question ne posent pas de difficulté et reposent sur les mêmes manipulations
que ceux de la question b), de sorte à pouvoir passer davantage de temps sur la
démonstration de la décomposition de Jordan. Il est envisageable de présenter les
seules questions a) et b)(i) en tant qu’illustrations élémentaires du théorème des
résidus ; on obtiendrait ainsi un développement de niveau F, toutefois seulement
adapté aux leçons sur l’holomorphie.
© Ce développement propose une approche élégante et originale d’un résultat très
classique de réduction des endomorphismes : l’existence de la forme normale de
Jordan. Il s’agit d’un raffinement du résultat de trigonalisabilité des matrices com-
plexes. La preuve proposée ici construit explicitement les matrices des projections
et les matrices nilpotentes au moyen d’intégrales de contour. Les outils essentiels
de ce développement sont le théorème des résidus pour les fonctions méromorphes
ainsi que les propriétés élémentaires des endomorphismes : caractérisation des
projections, nilpotence, stabilité déduite de la commutativité, etc.
474
Analyse classique et complexe
Questions.
1. Montrer que si A et B commutent et si B est inversible, alors A et B −1
commutent.
2. Justifier que le contour γ̃k : t ∈ [0, 1] 7→ λk + 12 η exp(2iπt) a son support
contenu dans le disque ouvert délimité par γk : t ∈ [0, 1] 7→ λk + η exp(2iπt).
3. Si N est nilpotente d’indice α et si v est un vecteur tel que N α−1 v =
6 0, montrer
que (v, N v, N 2 v, . . . , N α−1 v) forme une famille libre.
4. Justifier précisément la démonstration par récurrence sur la dimension évoquée
dans la dernière question pour obtenir la décomposition de Jordan : pourquoi
existe-t-il un supplémentaire de l’espace engendré par (Nkαk −1 v, . . . , Nk2 v, Nk v, v)
stable par Nk et Pk ?
5. Montrer que A ∈ Mn (C) est nilpotente si, et seulement si, Tr(Ak ) = 0 pour
tout k > 1.
475
80. Forme normale de Jordan et résidus
6. Rappeler pourquoi une matrice est trigonalisable si, et seulement si, son poly-
nôme caractéristique est scindé.
7. Montrer que l’indice de nilpotence de la matrice Nk est exactement αk .
8. Dans le cas de matrices réelles, montrer qu’il existe une décomposition de
Jordan par blocs analogue à celle dans le cas complexe, où les éléments diagonaux
peuvent être soit des matrices scalaires soit des matrices carrées de taille 2.
9. Comment obtenir la forme normale de Jordan de la matrice
3 1 −1
1 3 −1 ?
2 2 0
13. Trouver une matrice A ∈ Mn (C) admettant une valeur propre λ avec une
multiplicité algébrique r et une multiplicité géométrique s < r.
14. Rappeler pourquoi, si deux endomorphismes commutent, les images et noyaux
de l’un sont stables par l’autre.
15. Soient λ ∈ C et A ∈ Mn (C). Montrer que les suites (Ik )k∈N et (Kk )k∈N
définies par Ik = Im(A − λIn )k et Kk = Ker(A − λIn )k sont monotones (pour
l’inclusion) et stationnaires à partir d’un certain rang.
16. Déduire de l’existence de la forme normale de Jordan d’une matrice celle de
sa décomposition de Dunford additive A = D + N , où D est diagonalisable, N
est nilpotente et DN = N D. Montrer que D et N sont alors uniques et sont des
polynômes en A.
476
Analyse classique et complexe
az + b
a b = (cz + d)k f (z).
∀z ∈ H, ∀ c d ∈ SL2 (Z), f (1)
cz + d
L’équation fonctionnelle (1) implique que f est déterminée par son image sur
le domaine fondamental D = {z ∈ H : |z| > 1, Re(z) ∈ [−1, 1]}, permettant
dorénavant de voir f comme fonction sur D.
Soient Mk l’espace vectoriel des formes modulaires de poids k et f ∈ Mk \{0}.
a) Expression intégrale du nombre de zéros.
Soit X > 0. Considérons le contour représenté sur la Figure 2.34, où le
chemin β est porté par la droite {Im(z) = X} et les δx sont des arcs de cercles
autour de x de rayon ε > 0. On note j = exp(2iπ/3) et ̃ = −j 2 . On note DX,ε
le domaine fermé entouré et on suppose que f n’a aucun zéro sur le contour.
(i) Justifier que les zéros de f sont dans DX,ε pour X assez grand et ε assez
petit. Montrer que ces zéros sont en nombre fini.
(ii) Relier l’intégrale de f 0 /f sur ce contour et les zéros de f .
b) Formule des ordres.
Pour tout p ∈ H ∪ {+∞}, on note vp (f ) l’ordre de f en p, i.e. l’entier v tel
que la fonction z 7→ f (z)(z − p)−v est holomorphe en p.
(i) Montrer que
f0 f0
Z Z
+ = 0.
α f α̃ f
(ii) Montrer que, lorsque ε tend vers zéro,
f0 f0 kπ
Z Z
+ −→ .
γ f γ̃ f 6
f0 1 f0 1 f0 1
Z Z Z
−→ − vi (f ), −→ − vj (f ) et −→ − ṽ (f ).
δi f 2 δj f 6 δ̃ f 6
477
81. Espace des formes modulaires
1 1 X k
vi (f ) + vj (f ) + vp (f ) = . (1)
2 3 p ∈D∪{+∞}
12
f (p)=0
p6=i,j,̃
α α̃
DX,ε
δi
δj δ̃
j γ i γ̃ ̃
-1 -1/2 0 1/2 1
Une bonne partie du développement repose sur le calcul d’intégrales sur des por-
tions de contour (236, 239). Ce développement s’intègre naturellement aux leçons
d’analyse complexe (245) comme archétype d’application du théorème des résidus.
Il propose d’étudier un espace formé par des fonctions (201) qui constituent l’ana-
logue des fonctions périodiques en dimension supérieure dans le plan hyperbolique.
Il mobilise enfin certaines méthodes de détermination des dimensions d’espaces
vectoriels (151) : les conditions définissant l’espace apparaissent alors comme
des contraintes qui bornent sa dimension, et il suffit pour conclure de trouver
suffisamment d’éléments libres pour en obtenir une base.
478
Analyse classique et complexe
Correction.
Rappelons tout d’abord la définition de l’holomorphie de f à l’infini. La relation (1)
implique, avec c = 0 et a = b = d = 1, que f (z + 1) = f (z), c’est-à-dire que la fonc-
tion f est 1-périodique. Il existe donc une fonction g telle que f (z) = g(exp(2iπz))
pour tout z ∈ H. Le changement de variable z 7→ exp(2iπz) envoie H sur le disque
épointé D(0, 1)\{0}, domaine sur lequel g est donc définie et holomorphe. Dire
que f est holomorphe à l’infini signifie que g admet un prolongement holomorphe
en 0, encore noté g. On dit que la valeur de f à l’infini est la valeur de g en zéro.
Les notions de zéro et de multiplicité pour f à l’infini sont par définition celles
concernant g en 0.
a) (i) La fonction f est holomorphe et non nulle, donc ses zéros dans D sont
isolés par le principe des zéros isolés. En particulier, pour ε > 0 assez petit elle
n’a pas de zéro dans les disques D(i, ε), D(j, ε) et D(̃, ε), hormis éventuellement
aux points i, j et ̃ respectivement.
La fonction g est holomorphe et non nulle, donc ses zéros sont isolés. En particulier,
pour η < 1 assez petit, g n’a pas de zéro tel que 0 < |q| < η. Cela signifie, puisque
q = exp(2iπz), que f n’a aucun zéro z ∈ D de partie imaginaire strictement
supérieure à −(2π)−1 ln(η) qui est une constante positive. Ainsi, pour X supérieur
à cette constante, les zéros de f sont contenus dans DX,ε , sauf éventuellement i,
j, ̃ et l’infini.
Les zéros de f forment un ensemble discret. Puisque le domaine DX,ε est un
compact de D, f n’y admet qu’un nombre fini de zéros.
(ii) Rappelons que le contour noté ∂DX,ε est orienté comme sur le schéma. Le
contour est d’indice 1 par rapport aux zéros. Le théorème des résidus donne donc
1 f 0 (z)
Z X
dz = vp (f ). (2)
2iπ ∂DX,ε f (z) p ∈D X,ε
f (p)=0
b) (i) La relation (1) implique que f (z +1) = f (z) et f 0 (z +1) = f 0 (z) pour tout
z ∈ H. Puisque α̃ − 1 est égal à α parcouru dans le sens opposé, le changement
de variable z 7→ z + 1 donne
f0 f 0 (z + 1) f 0 (z + 1) f0
Z Z Z Z
= dz = − dz = − .
α̃ f α̃−1 f (z + 1) α f (z + 1) α f
f0 f0 f0 f0
Z Z Z Z
+ =− + = 0.
α̃ f α f α f α f
(ii) La relation (1) implique que f (−1/z) = z k f (z) pour tout z dans H et donc
que la dérivée satisfait z −2 f 0 (−1/z) = kz k−1 f (z)+z k f 0 (z). Puisque le changement
de variable z 7→ −1/z envoie γ̃ sur γ parcouru dans le sens opposé, il vient par
479
81. Espace des formes modulaires
changement de variable puis par le théorème d’intégration sur les petits arcs :
f0 f0 f0 f 0 (−1/z) −2
Z Z Z Z
+ = − z dz
γ̃ f γ f γ̃ f γ̃ f (−1/z)
f0 kz k−1 f (z) + z k f 0 (z)
Z Z
= − dz
γ̃ f γ̃ z k f (z)
dz π
Z
=k −−−→ k.
γ̃ z ε→0 6
(iv) Pour les intégrales sur les arcs autour des points i, j et ̃, on utilise le
théorème des petits arcs. Tous les arcs de cercles sont parcourus dans le sens
indirect. Les écarts angulaires des arcs de cercles centrés en j et en ̃ tendent
vers 2π/6 lorsque ε tend vers zéro, donc
1 f0 1 1 f0 1
Z Z
−→ − vj (f ) et −→ − ṽ (f ).
2iπ δj f ε→0 6 2iπ δ̃ f ε→0 6
(v) Rappelons que les zéros de f sont dans l’intérieur de DX,ε par la ques-
tion a)(i), hormis éventuellement i, j, ̃ et le point à l’infini. En sommant les
contributions précédentes, notant que vj (f ) = ṽ (f ) par invariance de f par le
changement de variable z 7→ z + 1, (2) implique
1 1 X k
vi (f ) + vj (f ) + vp (f ) = .
2 3 p ∈D∪{+∞}
12
f (p)=0
p6=i,j,̃
c) Notons qu’il n’existe pas de forme modulaire non triviale de poids impair,
puisque la relation de modularité donne, avec le choix a = d = −1 et b = c = 0,
que f (z) = −f (z) pour tout z ∈ H.
• Supposons k = 0. Supposons que a ∈ C soit une valeur atteinte par f , i.e. que
la fonction f − a admet un zéro. C’est toujours une forme modulaire de poids nul.
Si f − a n’est pas la fonction nulle, la formule des ordres donne alors
1 1 X k
0 < vi (f ) + vj (f ) + vp (f ) = = 0,
2 3 p ∈D
12
f (p)=0
p6=i,j,̃
480
Analyse classique et complexe
Commentaires.
© Ce développement s’intéresse à un espace de fonctions très important dans les
mathématiques actuelles et peu illustré dans le cadre de l’agrégation : les formes
modulaires, omniprésentes en théorie des nombres et dans de nombreux domaines
connexes. Ce sont des fonctions holomorphes ayant de fortes propriétés de symétrie,
et ces contraintes font qu’elles forment des espaces de petites dimensions, ce que
l’exercice propose d’établir.
© La preuve exploite les résultats classiques de théorie des fonctions analytiques
qui doivent apparaître dans le plan des leçons d’analyse complexe : théorème des
résidus, principe des zéros isolés, et théorème d’intégration sur les petits arcs. Ce
dernier est un peu moins classique mais fort utile. En voici l’énoncé :
1 f0 θ
Z
−→ vp (f ).
2iπ ` f ε→0 2π
Ce résultat est utile mais non nécessairement inclus dans toutes les leçons d’analyse
complexe ; il est donc naturel qu’un examinateur consciencieux en demande des
éclaircissements. Notons que si le cercle est entier, i.e. si θ = 2π, on retrouve bien
le résultat donné par le théorème des résidus, sans même faire tendre ε vers zéro :
il suffit qu’il soit assez petit pour que f n’ait pas d’autre zéro dans le disque. La
preuve de la formule d’intégration sur les petits angles se déroule comme suit.
Pour p ∈ C, il existe un voisinage de p dans lequel f s’écrit f (z) = (z − p)k g(z)
avec g holomorphe et g(p) 6= 0. En paramétrant l’arc de cercle ` par `(t) = p + εeit
481
81. Espace des formes modulaires
En particulier, c’est un bon exercice de vérifier que les cas des dimensions 6, 8 et 10
se traitent avec le même argument que pour la question c). À partir de la dimension
12, il existe des formes modulaires dont la limite est nulle en l’infini (ce sont des
formes cuspidales). En notant ∆ l’une de celles de poids 12 (traditionnellement, la
forme modulaire de Ramanujan), on peut alors prouver que Mk = C∆ ⊕ Mk−12 ,
pour tout k > 0 pair, permettant de conclure la preuve de la formule ci-avant
(voir questions).
© Soit k ∈ 2N. Nous pouvons exhiber une forme modulaire de poids k. En
effet, une démarche naturelle pour obtenir une fonction SL2 (Z)-invariante est de
moyenner une fonction sur SL2 (Z). Ce faisant, en choisissant la fonction Im(z)k
pour tout k > 4, on obtient essentiellement
(mz + n)−k .
X
Ek (z) =
(m,n)∈Z2
(m,n)6=(0,0)
est une forme modulaire de poids 2, avec une limitation dans l’équation (1) :
elle n’est pas invariante pour toutes les matrices de SL2 (Z) mais seulement pour
482
Analyse classique et complexe
Questions.
1. Montrer que les ordres vp (f ) sont finis.
2. Rappeler pourquoi f est entièrement déterminée par son image sur D.
3. Sans intégration sur les petits arcs, calculer ` dz
R
z lorsque ` est un arc de cercle.
Indication : on pourra paramétrer l’arc de cercle en coordonnées polaires.
4. Donner une valeur explicite pour le η considéré à la question b)(iii).
5. Montrer que les zéros de f avec multiplicités sont les pôles de f 0 /f avec résidus.
6. Si f est une forme modulaire et a ∈ C, f − a est-elle une forme modulaire ?
7. Quelle est la valeur de dim Mk lorsque k < 0 ? lorsque k = 5 ?
8. Supposons que f ait un zéro sur le contour. Comment adapter la preuve ?
9. Pourrait-on conclure si les fonctions étaient supposées méromorphes ?
10. Montrer qu’une fonction vérifiant f (z + 1) = f (z) et f (−1/z) = f (z) pour
tout z ∈ H vérifie également l’équation (1).
11. En admettant l’existence d’une forme modulaire ∆ de poids 12 dont la limite
est nulle en l’infini, montrer que Mk = C∆ ⊕ Mk−12 .
12. Justifier la convergence de la série d’Eisenstein Ek (z), considérée dans les
commentaires, pour tout k > 4. Quelle est sa limite lorsque z tend vers l’infini
selon l’axe des ordonnées ?
483
Intégration et approximation
de fonctions
Z +∞ iu
e
a) Montrer que l’intégrale définie par I = √ du converge, puis que
Z +∞ 0 u
2
l’intégrale J = e2iπs ds converge.
−∞
b) Soit f : R → C la fonction 1-périodique vérifiant :
2
∀x ∈ [0, 1[ , f (x) = e2iπx .
Leçons concernées : 209, 228, 230, 235, 236, 239, 241, 245, 246
Correction.
a) Démontrons la convergence de l’intégrale I. La fonction u 7→ eiu u−1/2 étant
continue sur ]0, +∞[, il s’agit de démontrer la convergence des intégrales
Z 1 iu Z +∞ iu
e e
I1 = √ du et I2 = √ du.
0 u 1 u
487
82. Calcul des intégrales de Fresnel
1
Comme u 7→ √ est intégrable sur ]0, 1], la majoration
u
eiu 1
√ 6√
u u
eiA eiu
Or √ tend vers 0 lorsque A tend vers l’infini, et la fonction u 7→ 3/2 , bornée
i A u
par u 7→ u−3/2 sur [1, +∞[, y est intégrable, si bien que les termes de l’égalité (1)
admettent une limite finie lorsque A tend vers l’infini, c’est-à-dire que l’intégrale I2
converge. On en déduit la convergence de l’intégrale I.
Démontrons à présent la convergence de l’intégrale J. Le changement de variable
défini par Ru = 2πs2 est un C 1 -difféomorphisme de ]0, +∞[ sur ]0, +∞[, donc
2
l’intégrale 0+∞ e2iπs ds est de même nature que
eiu
Z +∞
1
√ √ du = √ I,
0 2 2π u 2 2π
2
qui converge. Ainsi, 0+∞ e2iπs ds converge et donc, par parité de la fonction
R
2
x 7→ e2iπs , J converge également.
b) La fonction f est continue sur R et de classe C 1 par morceaux, donc la série
de Fourier de f converge normalement vers f sur R.
Calculons maintenant les coefficients de Fourier de f . Pour tout n ∈ Z, on a :
Z 1
2
cn (f ) := e2iπx e−2iπnx dx
0
Z 1
2 −nx)
= e2iπ(x dx
0
Z 1 2 n2
2iπ (x− n
2)
− 4
= e dx
0
Z 1
n2 n 2
= e−iπ 2 e2iπ(x− 2 ) dx.
0
n
Le changement de variable affine s = x − 2 dans la dernière intégrale donne alors
2
Z − n +1
−iπ n2 2 2
cn (f ) = e e2iπs ds,
−n
2
488
Intégration et approximation de fonctions
+∞ +∞ Z −k+1
X X 2
c2k (f ) = e2iπs ds = J.
k=−∞ k=−∞ −k
+∞
X
∀x ∈ R, f (x) = cn (f )e2iπnx .
n=−∞
+∞ +∞
1
X X
f (0) = cn (f ) et f = cn (f )(−1)n .
n=−∞
2 n=−∞
On en déduit que
+∞ 1
X 1 +∞
X f (0) + f 2
J= c2k (f ) = cn (f )(1 + (−1)n ) = ,
k=−∞
2 n=−∞ 2
soit Z +∞
2 1+i
e2iπs ds = .
−∞ 2
En identifiant les parties réelles et imaginaires dans l’égalité ci-avant et en utilisant
la parité des fonctions t 7→ sin(t2 ) et t 7→ cos(t2 ), on trouve
Z +∞ Z +∞
1 1
sin 2πs2 ds = cos 2πs2 ds = .
et
0 4 0 4
√
Il suffit pour conclure d’utiliser le changement de variable linéaire t = 2πs, qui
conserve la nature des intégrales et permet d’écrire
Z +∞ r Z +∞ r
2 1 π 2 1 π
sin t dt = et cos t dt = .
0 2 2 0 2 2
489
82. Calcul des intégrales de Fresnel
Commentaires.
© On peut calculer les intégrales de Fresnel en étudiant une intégrale à paramètre,
comme nous le détaillons ci-après. Cette méthode permet d’illustrer les leçons
235, 236 et 239.
2 2
e−(u +i)t
Pour tout t ∈ R+ , la fonction u 7→ u2 +i
est intégrable sur R+ puisqu’elle est
continue en 0 et puisque
2 2
e−(u +i)t 1
6√ (2)
u2 + i u4 +1
lim f (t) = 0.
t→+∞
2 2
e−(u +i)t
2. Soient a, b ∈ R tels que 0 < a < b. Si u ∈ R+ , la fonction t 7→ u2 +i
est
2 2
de classe C1 sur ]a, b[ et sa dérivée en t ∈ ]a, b[ est −2te−(u +i)t , mais
2 +i)t2 2 a2
−2te−(u 6 2be−u
2 a2
et u 7→ 2be−u est intégrable sur R+ , donc la fonction f est bien de classe C 1
sur ]a, b[ et
Z +∞
0 −it2 2 t2
f (t) = −2te e−u du (3)
0
pour tout t ∈ ]a, b[. Comme a et b sont quelconques, f est bien de classe C 1
sur R∗+ , et sa dérivée sur cet intervalle est donnée par (3).
490
Intégration et approximation de fonctions
soit
√ 2
f 0 (t) = − πe−it (4)
puisque
Z +∞
2
Z +∞
2 √
2 e−s ds = e−s ds = π
0 −∞
√ Z +∞ 2
Z +∞
− π e−it du = f 0 (t)dt
0 0
= 0 − f (0)
Z +∞
1
=− du
0 u2 +i
soit
√ Z +∞
−it2
Z +∞
1
π e du = du.
0 0 u2 + i
Or on a
1 u2 − i
=
u2 + i u4 + 1
pour tout u > 0, donc
Z +∞ +∞
1 1
Z
2
e−it du = √ 2
du
0 π 0 u +i
u2
Z +∞ Z +∞
1 i 1
=√ 4
du − √ 4
du.
π 0 u +1 π 0 u +1
u2
Z +∞ Z +∞
1
cos(t2 )du = √ du (5)
0 π 0 u4 + 1
et Z +∞ Z +∞
1 1
− sin(t2 )du = − √ du,
0 π 0 u4 +1
soit Z +∞ Z +∞
1 1
sin(t2 )du = √ du. (6)
0 π 0 u4 +1
491
82. Calcul des intégrales de Fresnel
4. On note
u2
Z +∞ Z +∞
1
A= du et B= du.
0 u4 + 1 0 u4 + 1
1
Le changement de variable v = u assure que
u2
Z +∞ Z +∞
1
A= du = dv = B.
0 u4 + 1 0 v4 + 1
u2 + 1 1 1 1
4
= √ + √
u +1 2 u2 − 2u + 1 u2 + 2u + 1
1 h √ √ i+∞ π
A + B = √ arctan( 2u − 1) + arctan( 2u + 1) =√ .
2 0 2
π
On a donc A = B = √ , et les égalités (5) et (6) donnent alors
2 2
Z +∞ Z +∞ r
2 2 1 π
cos(t )du = sin(t )du = .
0 0 2 2
© Une autre méthode pour calculer les intégrales de Fresnel passe par le calcul de
l’intégrale d’une fonction holomorphe sur un contour. On la présente ci-après sous
une forme susceptible de constituer un développement pour les leçons 236 et 245.
Soit R > 0. On considère le lacet dans C formé par la juxtaposition du segment
menant de 0 à R, de l’arc de cercle de centre 0 allant de R à √12 (1 + i)R et du
segment de √1 (1 + i)R à 0. Ce lacet est représenté sur la figure 2.35.
2
π
4
0 R
2
Figure 2.35 – Contour utilisé pour l’intégration de la fonction z 7→ e−z .
492
Intégration et approximation de fonctions
2
La fonction z 7→ e−z étant holomorphe sur C, le théorème intégral de Cauchy
assure que son intégrale sur le lacet considéré est nulle, c’est-à-dire que
Z R π Z R π
2
− ei 4 t
Z
−t2 4
−R2 e2it i π4
e dt + iReit e dt − e e dt = 0,
0 0 0
soit Z R Z π Z R
2 4 2 e2it π 2
e−t dt + iReit e−R dt − ei 4 e−it dt = 0.
0 0 0
On a donc
π
Z R Z R Z !
−it2 −i π4 −t2 4
it −R2 e2it
e dt = e e dt + iRe e dt . (7)
0 0 0
Or pour tout t ∈ 0, π4 ,
2 e2it 2
iReit e−R 6 Re−R cos(2t)
et
2
2t 6 cos(2t) 1−
π
car cos est concave sur 0, π2 , si bien que
Z π Z π
4 2 e2it 4 2
iReit e−R dt 6 Re−R cos(2t)
dt
0 0
Z π
4 2 (1− 2 2t)
6 Re−R π dt
0
π
4R2
Z
4
−R2 t
= Re e π dt
0
π
π 4R2 t
2 4
= Re−R e π
4R2 0
π −R2 R2
= e e −1
4R
π 2
= 1 − e−R
4R
et donc Z π
4 2 e2it
iReit e−R dt −−−−−→ 0.
0 R→+∞
493
82. Calcul des intégrales de Fresnel
soit Z +∞
1−i π
r
−it2
e dt = .
0 2 2
On trouve alors les valeurs des intégrales de Fresnel en considérant les parties
réelle et imaginaire des termes de cette égalité.
© Le changement de variable effectué à la fin de la question a) permet d’obtenir
1
la relation J = √ I. Or I est elle-même calculable grâce à une méthode donnée
2π
dans l’exercice 4 de la page 164 de [Gou20] et consistant à exprimer une intégrale
à paramètre comme la solution d’une équation différentielle.
© La convergence de I peut être vue comme une conséquence de la règle d’Abel
pour les intégrales impropres, dont voici l’énoncé :
est convergente.
© On trouvera dans l’exercice 5 page 342 de [Gou20] une autre méthode de calcul
des intégrales de Fresnel, utilisant les coordonnées polaires et la convergence en
moyenne de Cesàro.
Questions.
1. Justifier que le changement de variable u = 2πs2 utilisé dans la première
question est bien un difféomorphisme de classe C 1 de ]0, +∞[.
2. Justifier que f est continue et de classe C 1 par morceaux.
3. Rappeler pourquoi la série de Fourier d’une fonction 1-périodique continue de
classe C 1 par morceaux est normalement convergente.
4. Justifier que si ϕ est un C 1 -difféomorphisme de ]0, +∞[, alors les intégrales
Z +∞ Z +∞
f (ϕ(t))ϕ0 (t)dt et f (t)dt
0 0
494
Intégration et approximation de fonctions
9. Grâce à une intégrale de contour, montrer que si β ∈ C est tel que Re(β) ∈ [0, 1[
alors
Z +∞
2 π Γ β+1
2
tβ e−it dt = e−i 4 (β+1) ,
0 2
où Γ est la fonction gamma d’Euler.
10. Démontrer la règle d’Abel pour les intégrales énoncée en commentaire, et
détailler son application à la convergence de I.
Indication : on pourra utiliser le critère de Cauchy pour démontrer la règle d’Abel.
Rx
11. Donner un développement asymptotique de la fonction x 7→ 0 sin(t2 ) dt et
de la fonction x 7→ 0x cos(t2 ) dt lorsque x tend vers +∞.
R
495
83. Racine carrée de la primitivation
I(f ) : ]0, 1] −→ R r Z 1
x f (ux)
x 7−→ I(f )(x) = √ du.
π 0 1−u
a) Montrer que si f ∈ C([0, 1], R), alors I(f ) est bien définie, est continue et
admet un prolongement par continuité en 0, encore noté I(f ) ∈ C([0, 1], R).
b) Montrer que I est une racine carrée de la primitivation, au sens où
Z x
∀x ∈ [0, 1], ∀f ∈ C([0, 1], R), I(I(f ))(x) = f (t) dt.
0
Correction.
f (ux)
a) Soit f ∈ C([0, 1], R). Pour tout x ∈ ]0, 1] , la fonction u 7→ √
1−u
est continue
kf k∞
sur [0, 1] et dominée par la fonction u 7→ √ ,
qui est continue, intégrable sur
1−u
l’intervalle [0, 1[ et indépendante de x. Le théorème de continuité des intégrales à
paramètres implique donc que la fonction
ϕ : [0, 1] −→ R
Z 1
f (ux)
x 7−→ √ du
0 1−u
est continue sur [0, 1]. La fonction I(f ) est donc continue sur ]0, 1].
Comme ϕ est continue en 0, ϕ est bornée au voisinage de 0, d’où
r
x
I(f )(x) = ϕ(x) −−−→ 0.
π x→0
496
Intégration et approximation de fonctions
La fonction I(f ) peut donc être prolongée par continuité en 0 par I(f )(0) = 0.
b) L’application
I : C([0, 1], R) −→ C([0, 1], R)
f 7−→ I(f )
est linéaire. De plus, elle est continue pour la norme k · k∞ : en effet, pour toute
fonction f ∈ C([0, 1], R) et pour tout x ∈ [0, 1], on a par l’inégalité triangulaire
Z 1
1 kf k
|I(f )(x)| 6 √ √ ∞ du.
π 0 1−u
La composée I ◦I est donc elle aussi linéaire et continue, de même que l’application
x 1 P (ux)
r Z
∀x ∈ [0, 1], I(P )(x) = √ du
π 0 1−u
(ux)k
r Z 1
x
= √ du
π 0 1−u
1 k+ 1 1 uk
Z
=√ x 2 √ du
π 0 1−u
1 1
= √ bk xk+ 2 ,
π
uk
Z 1
où l’on a posé bk = √ du. On peut alors donner l’expression de I(I(P )) :
0 1−u
r Z 1
x I(P )(ux)
∀x ∈ [0, 1], I(I(P ))(x) = √ du
π 0 1−u
1
1 1 uk+ 2 Z
= bk xk+1 √ du
π 0 1−u
1
= bk ck xk+1 , (1)
π
497
83. Racine carrée de la primitivation
Z 1 k+ 1
u 2
où l’on a posé ck = √ du. Or on a
0 1−u
Z 1 Z 1
k −1/2 k+ 21 −1/2
bk ck = u (1 − u) du u (1 − u) du
0 0
1 3 1
= B k + 1, B k+ , ,
2 2 2
où B est la fonction bêta définie sur {z ∈ C : Re(z) > 0}2 par
Z 1
B(α, β) = tα−1 (1 − t)β−1 dt. (2)
0
xk+1
Z x
I(I(P ))(x) = = tk dt = F (P )(x)
k+1 0
Commentaires.
© On montre dans cet exercice que l’opération de primitivation possède une
racine carrée au sens de la composition. Il est intéressant de noter qu’il n’en est
pas de même pour l’opérateur de dérivation D ∈ L(C ∞ ([0, 1], R)). En effet, si
l’application T ∈ L(C ∞ ([0, 1], R)) est telle que T ◦ T = D, alors T et D commutent
et donc, en identifiant le polynôme aX + b et la fonction polynomiale associée sur
le segment [0, 1], D(T (aX + b)) = T (D(aX + b)) = T (a) pour tous a, b ∈ R, si
bien que la fonction T (aX + b) est de dérivée constante et est donc dans R1 [X].
Dans ce cas, l’application T induit donc un endomorphisme sur R1 [X], dont le
carré est la dérivation sur R1 [X]. Il suffit alors de remarquer que la matrice de la
dérivation dans la base canonique de R1 [X] n’est pas un carré pour obtenir une
contradiction !
498
Intégration et approximation de fonctions
© La relation
Γ(α)Γ(β)
∀α, β ∈ {z ∈ C : Re(z) > 0}2 , B(α, β) =
Γ(α + β)
Soit à présent f ∈ C 0 ([0, 1], R). On a montré dans la question a) que I(f ), après
prolongement par continuité, est continue sur [0, 1]. La fonction I(I(f )) existe
donc. Soit à présent x ∈ ]0, 1]. Alors :
1 x I(f )(t)
Z
I(I(f ))(x) = √ √ dt
π 0 x−t
Z x Z t
1 1 1 f (u)
=√ √ √ √ du dt
π 0 x−t π 0 t−u
1 x t f (u)
Z Z
= √ √ du dt.
π 0 0 x−t t−u
499
83. Racine carrée de la primitivation
Hx : Tx −→ R
f (u)
(u, t) 7−→ √ √
x−t t−u
est continue sur Tx . Par ailleurs, on a la majoration :
kf k∞
∀(u, t) ∈ R2 , |Hx (u, t)| 6 √ √ .
x−t t−u
1 x x f (u)
Z Z
I(I(f ))(x) = √ √ dt du
π 0 u x−t t−u
Z x Z x
1 1
= f (u) √ √ dt du. (3)
π 0 u x−t t−u
Z x
1
Si u ∈ ]0, x[, l’intégrale √ √ dt peut se calculer à l’aide du change-
u x−t t−u
ment de variable affine
x−u x+u
t= z+
2 2
avec z ∈ ] − 1, 1[. On a alors
x−u
dt = dz
2
x−u
x−t = (1 − z)
2
x−u
t−u =
(1 + z)
2
et donc
Z x Z 1 x−u Z 1
1 2 qdz dz
√ √ dt = q = √ .
u x−t t−u −1 x−u
(1 − z) x−u (1 + z) −1 1 − z2
2 2
500
Intégration et approximation de fonctions
Enfin :
Z 1 Z r
dz dz
√ = lim √ = lim [arcsin(z)]r−r = π.
−1 1 − z 2 r→1− −r 1 − z 2 r→1−
On déduit donc de (3) que
Z x
I(I(f ))(x) = f (u) du.
0
Questions.
1. Que vaut ϕ(0) ?
2. Justifier que l’application f 7→ I(f ) de C([0, 1], R) dans lui-même est linéaire.
3. Justifier que F est continue.
4. Quelle est la norme d’opérateur de I (c’est-à-dire sa norme subordonnée à la
norme k · k∞ sur C([0, 1], R)) ?
5. Montrer que le prolongement par continuité I(f ) n’est pas dérivable en 0
lorsque f (0) 6= 0. Lorsque f (0) = 0, montrer que I(f ) peut être dérivable ou non,
selon les cas.
6. Lorsque f ∈ C 1 ([0, 1], R), justifier que I(f ) est dérivable sur ]0, 1] et calculer sa
dérivée.
7. Montrer que la quantité B(α, β) donnée par (2) est bien définie pour tous
complexes α, β ∈ C tels que Re(α) > 0 et Re(β) > 0.
√
8. Justifier que Γ 21 = π.
9. Justifier que la matrice dans la base canonique de R1 [X] de l’opérateur de
dérivation n’est pas un carré.
10. Montrer que le changement de variable t = xy, u = x(1 − y) utilisé en com-
mentaire pour démontrer la relation entre les fonctions bêta et gamma correspond
bien à un C 1 -difféomorphisme de déterminant jacobien égal à x.
Z x√
x − t0 0
11. Justifier la convergence de l’intégrale √ dt lorsque x ∈ ]0, 1].
0 t0
501
84. Méthode de la phase stationnaire
(i) Supposons qu’il existe c, C > 0 tels que |φ0 | > c et |φ00 | 6 C sur S. On
note |S| la longueur de S. Montrer que, pour tout λ > 0,
1 1 C
|IS,φ (λ)| = O + |S| , lorsque λ → +∞.
λ c c2
(ii) Supposons que |φ0 | > c et φ0 monotone. Montrer que, pour tout λ > 0,
1
|IS,φ (λ)| = O , lorsque λ → +∞.
cλ
(iii) Supposons que |φ(k) | > c pour un k > 1. Montrer que, pour tout λ > 0,
!
1
|IS,φ (λ)| = O , lorsque λ → +∞.
(cλ)1/k
Supposons que φ0 ne s’annule pas sur supp(f ). Montrer que pour tout N > 0,
|If,φ (λ)| = O λ−N , lorsque λ → +∞.
502
Intégration et approximation de fonctions
Correction.
a) (i) Notons que la dérivée de x 7→ eiλφ(x) est x 7→ iλφ0 (x)eiλφ(x) , et que φ0 ne
s’annule pas sur S. Par intégration par parties on a donc, pour tout λ > 0,
1
Z
0 iλφ(x)
IS,φ (λ) = · iλφ (x)e dx
S iλφ0 (x)
" #
eiλφ(x) φ00 (x) iλφ(x)
Z
= + e dx. (1)
iλφ0 (x) S S iλφ0 (x)2
2 C
Z
|IS,φ (λ)| 6 + 2
dx
λc S λc
1 2 C
6 + |S| .
λ c c2
(ii) Notons S = [a, b], où a 6 b. L’intégration par parties (1) peut être affinée
dans ce cas où φ0 est monotone. Notons que l’intégrale apparaissant dans le
membre de droite de (1) est dominée par
1 φ00 (x)
Z
dx.
λ S φ0 (x)2
φ(k) (x) = φ(k) (x) − φ(k) (a) = φ(k+1) (θ) (x − a) > c(x − a).
car φ(k) (a) = 0 puisque a est au bord du support de φ. Ainsi, |φ(k) (x)| est donc
plus grand que α dès que |x − a| > αc .
503
84. Méthode de la phase stationnaire
Sur le complémentaire U = S\U , qui est de taille dominée par α/c par ce qui
précède, on peut majorer l’exponentielle par 1 dans l’intégrale, donc
α
Z Z
iλφ(x)
e dx 6 dx 6 .
U U c
On obtient exactement la borne voulue lorsque les deux facteurs dominants sont
égaux, autrement dit quand αc = 1
1/k , ce qui arrive pour
(αλ)
c
α= .
(λc)1/(k+1)
Ainsi, la propriété est vraie au rang k + 1. Cela achève la preuve par récurrence.
b) En notant [a, b] le support de f , une intégration par parties donne
1
If,φ (λ) = − I 0 0 (λ).
iλ (f /φ ) ,φ
1
|If,φ (λ)| = O |Ig,φ (λ)| . (3)
λ
504
Intégration et approximation de fonctions
Commentaires.
© Ce résultat est une généralisation beaucoup plus précise d’un résultat classique,
le lemme de Riemann-Lebesgue, qui énonce la convergence vers zéro dans le cas
d’une phase constante non nulle :
Pour f ∈ C 0 (R) et φ un réel non nul,
505
84. Méthode de la phase stationnaire
On constate donc que la fonction de Bessel complexe In (λ) est de la forme If,φ (λ)
avec φ(t) = − sin(πt) et f (t) = einπt . En particulier, le seul point de [0, 1] où la
phase est de dérivée nulle est t = 12 . On a alors, pour tout ε > 0, par les questions
précédentes puisque |φ0 | > c hors de U = [ 12 − ε, 12 + ε],
Z Z
In (λ) = einπt eiλφ(t) dt + einπt eiλφ(t) dt
U U
1
Z
−iλ inπt iλ(φ(t)−φ( 12 ))
=e e e dt + O
U λ
1
Z 2
00 1 1
= e−iλ einπ/2 eiλφ ( 2 )(t− 2 ) dt + O . (4)
U λ
Puisque l’intégrande de cette dernière intégrale est une fonction oscillante dont la
dérivée ne s’annule qu’en t = 1/2, on utilise une fois de plus la question a) pour
approcher cette dernière intégrale par l’intégrale sur tout R, c’est-à-dire
1
Z 2
Z 2
00 1 1 00 1 1
eiλφ ( 2 )(t− 2 ) dt = eiλφ ( 2 )(t− 2 ) dt + O . (5)
U R λ
On obtient ainsi r
2 −i(λ− nπ − π ) 1
In (λ) = e 2 4 + O ,
πλ λ
et donc r
2 nπ π 1
Jn (λ) = cos λ − − +O .
πλ 2 4 λ
La formalisation précise des arguments de ce développement asymptotique, passant
moins de temps ou intégrant les intégrations par parties au sein du calcul, peut
faire office de développement de niveau FF.
506
Intégration et approximation de fonctions
√ in f (2n) (0)
cn = eiπ/4 π .
n!
Par densité des fonctions en escalier dans l’espace des fonctions continues, nous
nous réduisons à montrer que ce résultat est vrai lorsque f est la fonction
constante 1 au voisinage de l’origine. D’un côté, l’intégrale de Gauss s’écrit
r
π −iπ/4
Z
(iλ−ε)x2
lim e dx = e .
ε→0 R λ
507
84. Méthode de la phase stationnaire
© Il est intéressant de noter que dans le cas d’une intégrale régularisée par une
fonction à support compact, traité dans la deuxième question, la situation est
beaucoup plus aisée puisque les intégrations par parties ne font plus figurer de
termes de bord. C’est une motivation en pratique pour lisser les intégrales par
des fonctions lisses à support compact, de sorte que l’intégrale étudiée est plus
facile mais toutefois assez proche de la quantité initiale : cette démarche est
l’antichambre de la théorie des régularisations d’intégrales.
Questions.
1
1. Dans la question a)(i), peut-on améliorer la vitesse de décroissance en λ ?
Indication : considérer φ(x) = x.
1
2. Montrer que si φ est monotone et de signe constant, alors φ est monotone.
3. Justifier l’approximation de l’exponentielle donnant (4).
4. Justifier l’approximation (5).
508
Intégration et approximation de fonctions
b) Soit f ∈ C(R) ∩ L1 (R) telle que fb est analytique sur C et vérifie (1).
(i) Montrer que f est de classe C ∞ sur R.
(ii) Montrer que f est à support dans [−M, M ].
Correction.
a) Notons K = [−M, M ] le support de f .
(i) Par définition de la transformée de Fourier on a, pour tout ξ ∈ R,
Z Z
fb(ξ) = f (x)e−2iπxξ dx = f (x)e−2iπxξ dx.
R K
509
85. Théorème de Paley-Wiener
de sorte que, utilisant le fait que f est nulle hors de K = [−M, M ] on en déduit
que, pour tout ξ ∈ C∗ ,
Z
fb(ξ) 6 f (k)
(x) dx |2πξ|−k e2πM |Im(ξ)| .
K
Remarquons que x 7→ e2iπxξ fb(ξ) est de classe C ∞ pour tout ξ ∈ R et, pour tout
entier k ∈ N, sa dérivée k-ième est de plus dominée par ξ k |fb(ξ)| par le théorème de
dérivation sous l’intégrale. Le théorème de continuité des intégrales à paramètres
de Lebesgue garantit donc que f est de classe C ∞ sur R.
(ii) Soient R > 0 et µ 6= 0. On considère le chemin
R − iµ R + iµ
• •
• •
−R 0 R
510
Intégration et approximation de fonctions
Puisque fb est holomorphe sur C par hypothèse, son intégrale le long de γ est
nulle par le théorème des résidus. Les intégrales sur les deux bords verticaux sont
majorées par, pour tout k > 2,
Z ±R+iµ Z ±R+iµ
dξ
fb(ξ)e2iπξx dξ 6 ck e2πµ(M −x)
±R ±R ξk
Z µ
dt
6 ck e2πµ(M −x)
0 (R + t2 )k/2
2
Z µ
dt µ
6 ck e2πµ(M −x) =O .
0 (R2 )k/2 Rk
En particulier, ces deux intégrales tendent vers zéro lorsque R → +∞. Il vient
donc, pour tout x ∈ R,
Z R Z R
lim fb(ξ)e2iπξx dξ = lim fb(ξ + iµ)e2iπ(ξ+iµ)x dξ.
R→+∞ −R R→+∞ −R
Commentaires.
© Les théorèmes de Paley-Wiener sont une classe de théorèmes qui énoncent des
relations entre l’analycité d’une fonction et la croissance de sa transformée de
Fourier. Le développement présenté ici est énoncé dans le cas d’une fonction d’une
variable, et est un raffinement dû à Schwartz qui relie précisément la borne sur la
croissance de la transformée de Fourier et la taille du support de la fonction :
Soit f ∈ C(R) ∩ L1 (R). Alors f est de classe C ∞ et à support
dans [−M, M ] si, et seulement si, fb se prolonge analytiquement sur C
et il existe, pour tout k ∈ N, un ck > 0 tel que, pour tout ξ ∈ C∗ ,
ck 2πM |Im(ξ)|
fb(ξ) 6 e .
|ξ|k
511
85. Théorème de Paley-Wiener
Notons que la transformée de Fourier est connue pour être décroissante le long
de l’axe réel (c’est le lemme de Riemann-Lebesgue). Toutefois, si tant est qu’elle
se prolonge, on ne peut pas espérer qu’elle décroisse dans toutes les directions
du plan complexe. En effet, elle serait alors bornée sur tout le plan, et donc
constante par le théorème de Liouville. Le résultat ci-avant est donc une borne sur
l’explosion (nécessaire) de la transformée de Fourier le long de l’axe imaginaire.
© Faisons quelques commentaires heuristiques sur le théorème de Paley-Wiener :
une fonction et sa transformée de Fourier ne peuvent pas être toutes deux concen-
trées autour de l’origine. En effet, plus la fonction est concentrée autour de
l’origine, autrement dit plus son support est réduit, moins sa transformée de
Fourier décroît vite. Les bornes obtenues dans ce développement sont atteintes
pour des exemples particuliers, de sorte que le résultat est optimal. On obtient
ainsi une barrière théorique, qui peut être formulée précisément sous la forme du
principe de Heisenberg, demandant une optimisation fine en pratique entre f et fb.
Voir par exemple le Développement 89 où le théorème de Minkowski est prouvé
grâce à la formule de Poisson, nécessitant un bon contrôle de f et de sa transformée
de Fourier, ou encore le Développement 1, où le principe de Heisenberg est aussi
formulé comme un compromis à faire entre une fonction et sa transformée de
Fourier (dans le cas des groupes abéliens finis).
© Les conditions requises dans le théorème prouvé dans ce développement sont
très fortes : les fonctions sont analytiques ou à support compact. En relâchant
ces hypothèses, on obtient d’autres conditions « duales ». Ainsi, il est possible de
caractériser le type de décroissance exponentielle d’une fonction par la prolon-
geabilité de sa transformée de Fourier sur une bande horizontale autour de l’axe
réel :
Soit f ∈ C(R) ∩ L1 (R). Alors il existe une constante A > 0 telle
que f (x) est dominée par exp(−2πA|x|) lorsque |x| tend vers l’in-
fini si, et seulement si, fb se prolonge analytiquement sur la bande
horizontale |Im(ξ)| < A.
Ainsi, dans la limite heuristique A → +∞, on retrouve qu’une fonction dont la
transformée de Fourier est prolongeable à tout le plan complexe doit être « nulle
à l’infini ». En effet, le résultat de ce développement montre qu’elle doit être à
support compact.
© Le théorème de Paley-Wiener admet des versions à plusieurs variables ainsi
que pour les espaces fonctionnels. C’est un outil puissant de contrôle en analyse
harmonique, où il est souvent plus aisé de travailler sur les transformées de Fourier
que sur les fonctions elles-mêmes. Des résultats analogues existent pour d’autres
types de transformées intégrales, ainsi la transformée de Laplace ou celle de Mellin.
Notamment, de tels théorèmes permettent de contrôler le support des solutions
aux équations différentielles ou aux dérivées partielles.
© Pour de nombreux commentaires sur la transformation de Fourier et les théo-
rèmes de Paley-Wiener, notamment du point de vue des distributions, le lecteur
pourra se référer à [Can09] d’où ce développement a été adapté.
512
Intégration et approximation de fonctions
Questions.
1. Montrer la relation entre fb(ξ) et fb(k) (ξ).
2. Justifier que fb(k) (ξ) est dominée par ξ k |fb(ξ)|.
3. Supposons que f et fb sont à supports compacts. Montrer que f = 0.
4. Calculer la transformée de Fourier de x 7→ |x|−α pour 0 < α < 1.
5. Soit f ∈ C(R). Montrer que fb tend vers zéro en +∞.
6. Montrer le théorème alternatif de Paley-Wiener cité en commentaire.
Indication : puisque la transformée de Fourier est analytique sur la bande hori-
zontale |Im(x)| < A, il est possible de translater librement dans cette bande le
contour d’intégration dans la formule d’inversion de Fourier.
7. Montrer que l’application linéaire f 7→ fb est continue de L1 (R) dans C0 (R).
513
86. Théorème de Plancherel
et en déduire que G
ca = Ga .
c
G1
K := .
kG1 kL1 (R)
1 x
Pour tout ε > 0, on définit la fonction Kε par Kε (x) := εK ε pour
tout x ∈ R. Montrer que pour toute f ∈ S(R) on a
Z
f (x)Kε (x) dx −−−→ f (0).
R ε→0
Leçons concernées : 201, 205, 207, 208, 209, 236, 239, 250
514
Intégration et approximation de fonctions
Correction.
a) Soit a > 0. On va montrer que la fonction G ca , définie par une intégrale à
1
paramètre, est une fonction de classe C sur R vérifiant une équation différentielle
2
très simple. Soit g : R2 → C la fonction définie par g(x, ξ) = e−ax e−2iπxξ pour
tout (x, ξ) ∈ R2 , de sorte que
Z
∀ξ ∈ R, G
ca (ξ) = g(x, ξ) dx.
R
ca 0 (ξ) = iπ
Z
2
∀ξ ∈ R, G (−2ax)e−ax e−2iπxξ dx.
a R
2
Remarquons que pour tout ξ ∈ R, les fonctions x 7→ (−2ax)e−ax e−2iπxξ ainsi que
2
x 7→ e−ax (−2iπξ)e−2iπxξ sont intégrables sur R et tendent vers 0 en ±∞. On
peut donc effectuer une intégration par parties sur R, et on trouve
0 2π 2 ξ c
∀ξ ∈ R, ca (ξ) = −
G Ga (ξ).
a
Ainsi, G
ca est une solution de l’équation différentielle linéaire homogène
2π 2 ξ
y0 + y = 0,
a
dont les solutions sont bien connues. On obtient
π 2 ξ2
∀ξ ∈ R, G ca (0)e−
ca (ξ) = G a .
515
86. Théorème de Plancherel
√
De plus, en utilisant le changement de variable affine u = ax et la valeur de
l’intégrale de Gauss, on obtient
r
1 π
Z Z
−ax2 −u2
G
ca (0) = e dx = √ e du = .
R a R a
Ainsi, pour tout ξ ∈ R, on a
r r
π − π 2 ξ2 π
G
ca (ξ) = e a = G 2 (ξ). (1)
a a π /a
L’espace de Schwartz étant stable par la transformation de Fourier, on sait que
ca ∈ S(R). En appliquant (1) une fois à Ga , puis une seconde fois à G 0 , où
G a
a0 = π 2 /a, on trouve, pour tout ν ∈ R,
r r r r
π \ π d π π
G
ca (ν) = G 2 (ν) = Ga0 (ν) = G 2 0 (ν)
c
a π /a a a a0 π /a
r s
π π
= G 2 2 (ν) = Ga (ν).
a π 2 /a π /(π /a)
Ainsi, d’après la question a), pour toute f ∈ S(R) et tout a > 0 on obtient
Z Z Z Z
f (x)Ga (x) dx = f (x)G
ca (x) dx = fb(x)G
ca (x) dx = fb (x)Ga (x) dx,
c b
R R R R
516
Intégration et approximation de fonctions
En conséquence, on a Z
f (x)Kε (x) dx −−−→ f (0),
R ε→0
1 G1 xε
1
Kε (x) = = √ G1/ε2 (x),
ε kG1 kL1 (R) ε π
f (y) = τy f (0) = τd
y f (0)
d
Z
= τd
y f (ξ) dξ
R
Z Z
= f (y + x)e−2iπxξ dx dξ
R R
Z Z
= f (u)e−2iπ(u−y)ξ du dξ
R R
Z Z Z
= f (u)e−2iπuξ du e2iπyξ dξ = fb(ξ)e2iπyξ dξ = fb (−y),
b
R R R
517
86. Théorème de Plancherel
Or il est aisé de vérifier que pour toute g ∈ S(R) et tout x ∈ R, gb (x) = gb (−x),
b
donc en appliquant ceci à g = fb , on trouve fb (−x) = fb (x). Par la question c),
b
Z Z Z
|fb (x)|2 dx.
b
fb (x)f (x) dx = fb (x)fb (x) dx =
R R R
Par continuité de la transformation de Fourier sur L2 (R), la suite (fck )k∈N converge
vers fb dans L2 (R), donc
kfck kL2 (R) −−−−→ kfbkL2 (R) .
k→+∞
Or d’après la question e) on a, pour tout k ∈ N, kfck kL2 (R) = kfk kL2 (R) , on peut
donc passer à la limite et obtenir kf kL2 (R) = kfbkL2 (R) , comme voulu.
Commentaires.
© Malgré la longueur de ce développement, qui explique l’attribution du niveau
de difficulté FFF, celui-ci est en réalité assez élémentaire. En effet, il suffit
essentiellement de calculer la transformée de Fourier d’une fonction gaussienne
(question a)) et de remarquer que la transformation de Fourier est en quelque
sorte « autoadjointe » pour la forme bilinéaire
Z
2
∀f, g ∈ L (R), hf, gi := f (x)g(x) dx,
R
au sens où
∀f, g ∈ L2 (R), hfb, gi = hf, gbi,
(ce qui est montré à la question b)) pour conclure. Faisons remarquer qu’ainsi
définie, cette forme bilinéaire ne constitue pas un produit hermitien sur les fonc-
tions L2 (R) à valeurs complexes (il faudrait conjuguer l’une des deux fonctions),
raison pour laquelle nous n’avons pas introduit cette notation dans le développe-
ment. De manière informelle, le développement peut se résumer en cinq étapes :
518
Intégration et approximation de fonctions
1. Montrer que G a = Ga .
d
d
2. Montrer que hfb, gi = hf, gbi, i.e. établir l’aspect « autoadjoint » de la trans-
formation de Fourier pour h·, ·i.
3. En déduire l’égalité distributionnelle hf, Ga i = hfb , Ga i.
b
s’étend également à L2 (Rn ) et est une isométrie. Nous avons choisi de ne pas le
faire ici car la preuve est exactement la même, bien que l’écriture soit plus lourde.
Le candidat peut très bien présenter la version multidimensionnelle du théorème
dans le plan, et/ou effectuer le développement directement sur Rn .
b tout x ∈ R, ne signifie
© Remarquons que l’identité f (x) = fb (−x), valable pour
b
ni plus ni moins que la transformée de Fourier inverse g d’une fonction g ∈ S(R)
est donnée par b Z
g : x 7−→ gb(−x) = g(ξ)e2iπxξ dξ, (3)
R
b b
i.e. que l’on a g = gb = gb.
© La famille de fonctions (Kε )ε>0 définie à la question c) est ce qu’on ap-
pelle souvent une approximation de l’identité. On dit qu’une famille de fonc-
tions (ηε )ε ∈ ]0,1[ ⊂ L1 (Rn ) est une approximation de l’identité si
(i) kηε kL1 (R) est uniformément bornée.
Z
(ii) ∀ε ∈ ]0, 1[, ηε (x) dx = 1.
Rn
(iii) Quel que soit r > 0, on a
Z
|ηε (x)| dx −−−→ 0.
Rn \B(0,r) ε→0
519
86. Théorème de Plancherel
d’une part parce que l’intégrale n’est pas nécessairement définie, d’autre part
parce que rien ne garantit que l’égalité soit vérifiée, même quand l’intégrale a
un sens. Néanmoins, par densité de S(R) dans L1 (R), on peut montrer que pour
toute f ∈ L1 (R) ∩ L2 (R), la transformée de Fourier de f est bien donnée par (4).
Questions.
1. Rappeler une méthode de calcul de l’intégrale de Gauss.
2. Rappeler la définition de S(R) et montrer que S(R) est stable par transforma-
tion de Fourier. Z
3. Justifier que pour tout ε > 0, Kε (x) dx = 1.
R
4. Montrer que Cc∞ (R) est dense dans Lp (R), et en déduire que S(R) est dense
dans Lp (R) quel que soit 1 6 p < +∞. Qu’en est-il pour p = +∞ ?
5. Soit (ηε )ε∈ ]0,1[ une approximation de l’identité. Montrer que
(i) Si f ∈ L∞ (Rn ) est continue sur le voisinage d’un compact K de Rn , alors la
convolée ηε ? f converge uniformément vers f sur K.
(ii) Si f ∈ Lp (Rn ), pour un p ∈ [1, +∞[ ,balors ηε ? f converge vers f dans Lp (Rn ).
6. Pour toute f ∈ L1 (R), on définit fb et f comme
b dans (4) et (3). Montrer que si
f ∈ L1 (R) et fb ∈ L1 (R), alors on a f (x) = fb (x) pour presque tout x ∈ R.
Indication : montrer que le résultat de la question b) est également vrai si f et fb
520
Intégration et approximation de fonctions
521
87. Prolongement de la fonction ζ de Riemann
Introduisons, pour s ∈ C tel que Re(s) > 1 et z ∈ C tel que Re(z) > 0,
+∞
1 2
e−πn z .
X X
ζ(s) = et θ(z) =
n=1
ns n∈Z
2
a) Pour tout z ∈ C, introduisons la fonction fz : x ∈ R 7→ e−πx z .
(i) Montrer que, pour tout z ∈ C, on a
Z +∞
2
e−π(u+z) du = 1.
−∞
2 /z
(ii) Montrer que pour tous 29 Re(z) > 0 et t ∈ R, on a fcz (t) = z −1/2 e−πt .
(iii) Déduire que pour tout Re(z) > 0, on a θ(z) = z −1/2 θ(1/z).
b) Introduisons la fonction zêta complété définie par, pour tout Re(s) > 1,
522
Intégration et approximation de fonctions
tions (207). L’utilisation de fonctions définies par les intégrales dépendant d’un
paramètre, notamment la fonction Γ d’Euler, justifie la présence de ce développe-
ment pour illustrer les leçons associées (236, 239). Le prolongement méromorphe
exploite les idées de la théorie des fonctions d’une variable complexe qui en font un
développement pertinent pour illustrer la leçon sur les fonctions holomorphes (245).
L’essentiel de l’argument se réduit à la formule de Poisson et au calcul d’une
transformée de Fourier astucieuse, montrant un domaine d’application moins
connu de la transformation de Fourier et de l’analyse harmonique (250), pourtant
très présente en théorie des nombres.
Correction.
a) (i) Introduisons la fonction définie par, pour tout z ∈ C,
Z +∞
2
F (z) = e−π(u+z) du.
−∞
Nous allons prouver que F est une fonction analytique sur C en appliquant le
théorème d’analycité des intégrales à paramètres. Il suffit de le prouver localement,
sur une boule B(0, R) pour un R > 0. Vérifions les hypothèses du théorème :
2
• la fonction (u, z) 7→ e−π(u+z) est mesurable sur R × B(0, R) ;
2
• pour tout u ∈ R, la fonction z 7→ e−π(u+z) est analytique sur B(0, R) ;
• pour tout z ∈ B(0, R) et u ∈ R, on a la domination
2 2 +2πuRe(z)+πRe(z 2 ))
e−π(u+z) = e−(πu
2 +2πRu+πR2
6 e−πu
2 +2πR2
= e−π(u−R) ,
523
87. Prolongement de la fonction ζ de Riemann
2
Z +∞ √ 2
fcz (t) = z −1/2 e−πt /z e−π(u+it/ z)
du. (3)
−∞
Par la question précédente, l’intégrale est de valeur 1 de sorte que l’on obtient,
pour tous z ∈ C et t ∈ R,
2 /z
fcz (t) = z −1/2 e−πt = z −1/2 f1/z (t). (4)
524
Intégration et approximation de fonctions
On obtient alors le résultat voulu en multipliant l’identité obtenue par s(s − 1).
(iii) Il reste à prouver que les intégrales F (s) de f (t, s) = ω(t)(ts/2−1 +t(1−s)/2−1 )
sur ]1, +∞[ sont des fonctions analytiques sur C. En effet, le membre de droite
de la relation obtenue à la question précédente permet alors de définir ξ(s) pour
tout s ∈ C.
Soit A > 0. Pour prouver que la fonction est analytique sur C, il suffit de prouver
qu’elle est analytique sur DA = {s ∈ C : |Re(s)| < A}. Pour cela on applique
le théorème d’holomorphie sous le symbole d’intégration sur DA , dont on vérifie
maintenant les hypothèses :
• la fonction f est mesurable sur ]1, +∞[×DA , puisque ω est une fonction
mesurable comme somme de fonctions mesurables ;
525
87. Prolongement de la fonction ζ de Riemann
e−πnt 6 2e−πt ,
X
0 6 ω(t) 6 (6)
n>1
ainsi que
La fonction ζ ne s’annule pas pour Re(s) > 1, par exemple grâce à son expression
en tant que produit eulérien. De plus, la fonction Γ ne s’annule pas sur C. Ainsi,
on a ξ(s) 6= 0 sur Re(s) > 1. L’équation fonctionnelle ξ(s) = ξ(1 − s) permet
d’en déduire qu’il en va de même, symétriquement, pour Re(s) < 0. Ainsi, ξ ne
s’annule pas hors de la bande critique définie par 0 6 Re(s) 6 1.
Ces propriétés de ξ permettent d’en déduire des informations sur les pôles et zéros
de ζ sur Re(s) 6 0. En effet on a, pour tout s ∈ C\{0, 1},
ξ(s)π s/2
ζ(s) = .
s(s − 1)Γ(s/2)
526
Intégration et approximation de fonctions
Commentaires.
© Le développement est très riche et technique, notamment en y adjoignant les
commentaires ci-après, mais il est facilement modulable : le résultat central est le
prolongement analytique de ζ, il est donc tout à fait possible de gagner du temps
en mentionnant moins de détails sur les zéros de la fonction ζ et s’arrêter à la
question b). De même, il est également possible d’insister plus fortement sur les
calculs d’intégrales de la question a), ou leur analogue dans le domaine complexe
présenté ci-après, permettant de mettre l’accent sur les résultats d’holomorphie
et d’intégration à paramètres. Cela constitue déjà un raisonnable développement
de niveau F. Il est aussi possible de passer plus rapidement sur les justifications
de manipulations d’intégrales ou l’application du théorème d’holomorphie sous le
symbole d’intégration, de sorte à se concentrer sur les permutations de sommes et
d’intégrales ou sur les propriétés des fonctions ζ et Γ.
© Il est possible de déduire de l’équation fonctionnelle de ξ la célèbre équation
fonctionnelle de ζ. En effet par définition de ξ on a, pour tout s ∈
/ {0, 1},
ξ(s)π s/2
ζ(s) = .
s(s − 1)Γ(s/2)
527
87. Prolongement de la fonction ζ de Riemann
528
Intégration et approximation de fonctions
2
La dernière égalité est justifiée par le fait suivant : puisque u 7→ e−πzu est
holomorphe sur C et rapidement décroissant lorsque Im(u) → ±∞, ses intégrales
sur toutes les droites horizontales sont égales.
Considérons une détermination de l’argument d’un complexe bien définie pour tout
Re(z) > 0. Par le changement de variable x = ρe−iarg(z)/2 on a, pour Re(z) > 0,
Z Z
2 2 e−iarg(z)
e−πzx dx = e−iarg(z)/2 e−πzρ dρ
iarg(z)/2 R
R Ze Z
−iarg(z)/2 −πzρ2 e−iarg(z) −iarg(z)/2 2
=e e dρ = e e−π|z|ρ dρ,
R R
2
où l’on a utilisé la valeur de l’intégrale de Gauss R e−πx dx = 1. On retrouve ainsi,
R
de manière un peu plus naturelle— dans le sens où elle n’utilise (en apparence)
que des changements de variables — la transformée de Fourier de la gaussienne.
© Par-delà les justifications qualitatives dans le commentaire qui précède, il est
important d’être à l’aise avec les changements de chemins d’intégration, et d’être
capable de les expliquer si un examinateur demande de le faire. La procédure est
systématique :
• tronquer les chemins considérés ;
• former le contour fermé obtenu en reliant le chemin tronqué ;
• justifier la nullité de l’intégrale sur ce contour avec un argument d’holomor-
phie (ou la valeur de l’intégrale, dans le cas de fonctions méromorphes, en
invoquant le théorème des résidus) ;
• se délivrer de la troncature en passant à la limite tout en justifiant les
convergences. On pourra se référer au Développement 81 sur l’espace des
formes modulaires, qui repose sur le calcul d’une intégrale de contour.
© Parmi les fonctions célèbres des mathématiques, la fonction zêta de Riemann ζ
tient assurément une place de choix. La fonction zêta est initialement définie
comme une série de Dirichlet ne convergeant que sur le demi-plan Re(s) > 1.
Toutefois, une propriété fondamentale pour les applications en théorie des nombres
est l’existence d’un prolongement analytique à tout C, sauf en un pôle simple
en s = 1. Les valeurs importantes pour la théorie des nombres sont justement à
529
87. Prolongement de la fonction ζ de Riemann
Questions.
1. Montrer que si une fonction analytique F sur C est constamment égale à 1
sur R, alors elle est constamment égale à 1 sur tout C.
2. Justifier précisément le changement de variables (complexe) effectué en (3).
3. Prouver la formule sommatoire de Poisson.
4. Montrer que la fonction ω est continue.
5. Justifier les inégalités (6).
2
6. Expliquer pourquoi l’intégrale de u 7→ e−πzu , Re(z) > 0, est constante sur
toutes les droites horizontales.
7. Le prolongement obtenu pour ζ est-il unique ?
8. Prouver que θ0 (1) = −θ(1)/4.
9. Pourquoi Γ admet-elle des pôles aux entiers négatifs ?
10. Pourquoi la fonction Γ ne s’annule-t-elle pas ?
11. Montrer, pour c > 1 et x > 0 que
Z c+i∞ +∞
1 2
ζ(s)Γ(s/2)(πx)−s/2 ds = 2 e−πn x .
X
2iπ c−i∞ n=1
530
Intégration et approximation de fonctions
Pour une fonction f ∈ C(R, R) qui est 2π-périodique, introduisons ses co-
efficients de Fourier (cn (f ))n∈Z et ses sommes partielles de Fourier définies
par
n
X
Sn (f )(x) = ck (f )eikx , x ∈ R.
k=−n
1 n−1
X
Kn (x) = Dp (x), x ∈ R.
n p=0
nx
sin2
1
Kn (x) = · 2 .
n x
sin2
2
1 n−1
X
Sk (f ) −→ f lorsque n → +∞,
n k=0
Leçons concernées : 207, 209, 215, 222, 235, 239, 241, 246
531
88. Théorème de Fejér-Cesàro
Correction.
Z π n
Z π X
(Dn ? f )(x) = f (y)Dn (x − y)dy = f (y)eik(x−y) dy
−π −π k=−n
n Z π
−iky
X
= f (y)e dy eikx
k=−n −π
Xn
= ck (f )eikx = Sn (f ).
k=−n
532
Intégration et approximation de fonctions
sin2 (nx/2)
Z π Z π
1 π−δ
Kn = dx 6 .
δ n δ sin2 (x/2) mn
Ainsi, puisque la quantité de droite tend vers zéro lorsque n tend vers +∞, il
existe un n0 ∈ N à partir duquel cette quantité est inférieure à ε/2. De plus, par
parité de Kn sur ] − π, π[, cette borne est également valable sur [−π, −δ]. On
obtient donc Z
K 6 ε,
x∈[−π,π] n
|x|>δ
1 n−1
X
Kn ? f = Sk (f ).
n k=0
533
88. Théorème de Fejér-Cesàro
Puisque la fonction f est continue sur le compact [−π, π], elle est bornée. Intro-
duisons la borne M = sup[−π,π] |f |. De plus, par continuité sur un compact, la
fonction f est uniformément continue par le théorème de Heine. Autrement dit,
pour toute quantité ε > 0, il existe δ > 0 tel que :
Commentaires.
534
Intégration et approximation de fonctions
Soit (Kn )n∈N une suite de fonctions continues vérifiant les propriétés
(A) Positive : Kn > 0 pour tout n > 0 ;
(B) Normalisée : Kn est d’intégrale 1 sur R, pour tout n > 0 ;
(C) Concentrée en zéro : pour tous ε, δ > 0, il existe n0 ∈ N tel que
Z
∀n > n0 , x∈R
Kn 6 ε.
|x|>δ
© Les noyaux de Dirichlet considérés dans la première question ne sont pas des
noyaux régularisants, notamment parce qu’ils ne sont pas positifs. En particulier,
on ne peut pas en déduire la convergence des sommes partielles de la série de
Fourier de f vers f . Pour une fonction quelconque, cette convergence est rarement
uniforme. Quitte à lisser un peu le comportement des sommes de Fourier, en
considérant leur moyenne de Cesàro, on obtient toutefois la convergence uniforme
comme prouvé dans ce développement.
© Le théorème d’approximation de Weierstrass énonce que toute fonction continue
peut être approchée uniformément par des polynômes sur un compact. Celui-ci
peut également s’obtenir comme conséquence du théorème des noyaux régularisants
énoncé ci-avant, ainsi que présenté dans les questions ci-après.
© Les convolutions par des noyaux réguliers ont un effet régularisant (voir ques-
tions), de sorte que le théorème prouvé ici dans le cas particulier des noyaux de
Fejér est un outil très vaste d’approximation par des fonctions régulières (sommes
535
88. Théorème de Fejér-Cesàro
Questions.
1. Montrer la relation d’orthogonalité utilisée dans le développement.
2. Montrer que la convolution a un effet régularisant : pour tout n > 0, pour
toute fonction f ∈ L2 (R) et tout fonction g ∈ Ccn (R), montrer que f ? g ∈ Ccn (R).
3. Théorème d’approximation polynomiale de Weierstrass.
Considérons une fonction continue sur [0, 1], nulle en 0 et en 1. Introduisons le
noyau de Landau défini par, pour tout n > 0 et certaines constantes cn > 0,
(
cn (1 − x2 )n si − 1 6 x 6 1,
Kn (x) =
0 si x > 0.
(i) Montrer que la suite (Kn )n∈N est une suite de noyaux réguliers pour un bon
choix de constantes cn > 0.
(ii) Pour tout n > 0, montrer que Kn ? f est un polynôme.
(iii) En déduire le théorème d’approximation de Weierstrass.
536
Intégration et approximation de fonctions
1 +∞
r|n| einθ ,
X
Pr (θ) = P (r, θ) = 0 6 r < 1, θ ∈ R.
2π n=−∞
1 1 − r2
Pr (θ) = · .
2π 1 − 2r cos θ + r2
1 1
2
6 .
1 − 2r cos θ + r 1 − 2r cos δ + r2
D(f ? g) = (Df ) ? g.
(iv) Montrer que ∆P (r, θ) = 0, i.e. que le noyau P (r, θ) est harmonique.
Indication : on pourra utiliser le laplacien en coordonnées polaires :
∂2 1 ∂ 1 ∂2
∆= + + .
∂r2 r ∂r r2 ∂θ2
(v) Si f est une fonction harmonique et r > 0, montrer que Pr ? f est harmonique.
(vi) En déduire que , si f est une fonction infiniment différentiable et harmonique
sur le bord du disque unité, alors on peut trouver une fonction F harmonique
à l’intérieur du disque unité, et prenant les valeurs données par f sur le bord.
Indication : considérer la fonction Pr ? f (θ) = (P ? f )(r, θ).
5. Le noyau de la chaleur.
Pour tous t > 0 et x ∈ R, introduisons le noyau
1 −x2 /4t
Kt (x) = K(t, x) = √ e .
4πt
(i) Vérifier que (Kt )t>0 est une famille de noyaux réguliers.
Indication : pour la propriété (C), on pourra utiliser
√ les changements de
variables donnés par y 2 = x2 /4t puis x = 2y t pour prouver que pour
tout ε > 0, si t est suffisamment petit on a
Z +∞
1 2 /4t
√ e−x dx 6 ε.
4t δ
537
88. Théorème de Fejér-Cesàro
∂2K ∂K
(t, x) = (t, x).
∂x2 ∂t
(iii) En déduire que, si f est une fonction continue bornée sur R (le profil de
chaleur au temps t = 0), alors il existe une solution de l’équation de la chaleur
F (x, t) qui vérifie F (x, 0) = f (x).
Indication : considérer la régularisation F (x, t) = (Kt ? f )(x).
Remarque : pour un bon choix de norme (à savoir, une norme de Sobolev),
cette expression explicite de F en fonction de f permet de conclure que F
est continue par rapport à sa condition initiale f . Si l’on peut prouver en
plus l’unicité d’une telle solution, on dit que le problème est « bien posé »,
voir Développement 66.
538
Intégration et approximation de fonctions
Soit n > 1. Considérons une partie A de Rn qui est convexe, fermée et symé-
trique par rapport à zéro 30 .
a) Rappeler la formule sommatoire de Poisson dans Rn .
Introduisons B = 12 A et ε > 0.
(iii) h
b est à décroissance rapide.
30. Un ensemble A est symétrique par rapport à zéro si, pour tout x ∈ A, on a −x ∈ A.
539
89. Théorème de Minkowski pour les réseaux
Correction.
a) Soit f continue sur Rn telle que sa transformée de Fourier fb soit également
continue. De plus, on suppose que f et fb sont toutes deux dominées par (1+k·k)−k
à l’infini pour tout k ∈ N. Alors la formule de Poisson s’écrit
X X
f (x) = fb(x).
x∈Zn x∈Zn
En particulier, pour que l’intégrande soit non nul il faut que x − u soit dans B(0, ε)
pour certains u ∈ B, autrement dit il faut que x ∈ B + B(0, ε). De plus, pour tout
x ∈ Rn , le changement de variables u 7→ x − u mène à
Z Z Z
g(x) = f (x − u)du = f (u)du 6 f (u)du = 1,
B x−B Rn
g 6 1B+B(0,ε) .
540
Intégration et approximation de fonctions
h 6 1A+B(0,2ε) vol(B).
541
89. Théorème de Minkowski pour les réseaux
d) Supposons que vol(A) > 2n . Rappelons que vol(B) = 2−n vol(A), donc en
particulier vol(B) > 1. Puisque la transformée de Fourier h
b est positive,
X
h(0)
b 6 h(x).
b
x∈Zn
Puisque h 6 1 et h est supportée sur A + B(0, 2ε) par la question c)(i), la formule
sommatoire de Poisson appliquée à h donne
X X
h(x)
b = h(x) 6 |(A + B(0, 2ε)) ∩ Zn | vol(B).
x∈Zn x∈Zn
Par ailleurs,
Z 2
h(0)
b = gb(0)2 = g(u)du = vol(B)2 ,
Rn
donc il vient
|(A + B(0, 2ε)) ∩ Zn | > vol(B)2 > 1.
Ainsi, A + B(0, 2ε) contient au moins un point non nul du réseau Zn , pour tout
ε > 0. Pour tout m > 0, en choisissant ε = 2−m , ce qui précède garantit l’existence
d’un point xm ∈ A + B(0, 2−m ) ∩ Zn \{0}. Quitte à prendre l’intersection de
A avec une boule, on peut supposer que A est borné donc compact. Chaque xm ,
pour m > m0 , appartient à A + B(0, 1) qui est compact, on peut donc en extraire
une sous-suite convergente vers une limite notée x. La limite x appartient à
chaque A + B(0, 2−m ) donc appartient à leur intersection, qui est l’adhérence de A.
Comme A est fermé, on obtient x ∈ A.
Par ailleurs, (xm ) est une suite de l’ensemble discret Zn \{0}, elle stationne donc
à partir d’un certain rang en un vecteur d’entiers non nul. Ainsi, on en déduit
que x ∈ (A ∩ Zn )\{0}.
Commentaires.
© Le théorème de Minkowski est un résultat classique de géométrie des nombres.
Il s’agit de prouver qu’un ensemble suffisamment grand et satisfaisant de bonnes
propriétés de symétrie rencontre le réseau des entiers Zn de manière non triviale.
La preuve proposée pour ce développement utilise des arguments d’analyse har-
monique. Formellement, le théorème découle de l’application de la formule de
Poisson à la fonction indicatrice 1A de A. En effet, ignorant les problèmes de
régularité et supposant que la transformée de Fourier 1b A est positive, la formule
de Poisson donnerait
X X
|A ∩ Zn | = 1A (x) = 1cA (x) > 1cA (0) = vol(A),
x∈Zn x∈Zn
542
Intégration et approximation de fonctions
543
89. Théorème de Minkowski pour les réseaux
Questions.
1. Démontrer la formule de Poisson.
2. Le théorème de Minkowski est-il encore valide pour d’autres réseaux que Zn ?
3. Justifier l’argument de la question c)(iii) : si g est indéfiniment dérivable et à
support compact, alors sa transformée de Fourier décroît asymptotiquement plus
vite que tout polynôme.
4. La borne est-elle optimale dans l’énoncé du théorème de Minkowski ? Autrement
dit, existe-t-il des convexes fermés symétriques par rapport à zéro et de volume
égal à 2n − ε ne contenant aucun point non trivial du réseau, pour tout ε > 0 ?
5. Expliquer comment obtenir la fonction f considérée au début de la ques-
tion b)(i) ?
6. En quoi la convolution a-t-elle un effet régularisant ?
7. Le point 0 est-il forcément dans A ?
8. Expliquer en quoi l’hypothèse de symétrie est importante. Donner un contre-
exemple au théorème lorsque A n’est pas symétrique par rapport à 0.
9. Si A est un convexe non borné, que dire de son volume ?
10. Pour une partie A quelconque de Rn , y a-t-il une relation entre A + A et 2A ?
11. Si deux ensembles X et Y sont fermés, X + Y est-il également fermé ?
12. Pourquoi les changements de variables u 7→ −u réalisés dans le développement
ne font-ils pas apparaître de signes − ?
544
Intégration et approximation de fonctions
+∞
lorsque x → 1− .
X
an xn −→ 0 (1)
n=0
Soit Φ l’ensemble des fonctions φ : [0, 1] → R telles que φ(0) = 0, φ(1) = 1 et,
pour tout x ∈ [0, 1[, la série
+∞
converge et tend vers 0 lorsque x → 1− .
X
an φ(xn ) (2)
n=0
545
90. Théorème taubérien de Hardy-Littlewood
une approximation fine des sommes partielles par des sommes plus lisses, alors
approchables par des sommes de polynômes pour lesquelles le résultat est facile.
L’énoncé du théorème taubérien de Hardy-Littlewood concerne avant tout le pro-
longement d’une fonction au bord de son domaine de définition a priori, justifiant
sa présence dans la leçon sur les prolongements de fonctions (207). Le cadre
particulier des théorèmes taubériens est celui des séries entières, en faisant une
bonne illustration de ces objets (230, 243). Enfin, l’essentiel de l’argument est
une succession d’approximations des sommes partielles par des fonctions de plus
en plus lisses, de sorte qu’il est l’archétype des méthodes d’approximations de
fonctions (209).
Correction.
a) Tout polynôme nul en zéro s’écrit comme combinaison linéaire de monômes X k
avec k > 1. Par linéarité, il suffit donc de prouver le résultat pour de tels monômes.
Soient k > 1 et φ = X k ∈ R[X]. On a xk → 1− lorsque x → 1− , de sorte que
l’hypothèse (1) permet de conclure que
+∞ +∞ n
x → 1− .
X X
an φ(xn ) = an xk −→ 0 lorsque
n=0 n=0
1
− si x ∈ [0, 1/2[;
g(x) − x
h(x) = = 1−x
x(1 − x) 1
si x ∈ [1/2, 1].
x
Nous allons approcher h par des fonctions continues, puis par des polynômes que
nous normaliserons enfin pour obtenir les conditions voulues.
de sorte la convergence se passe au bord du domaine, justifiant la description donnée.
546
Intégration et approximation de fonctions
• Notons que h est une fonction continue par morceaux sur [0, 1] avec une
seule discontinuité en 1/2. Il est possible d’approcher h par deux fonctions
continues vérifiant s1 6 h 6 s2 et telles que
Z 1
|s2 − s1 | 6 ε. (3)
0
s2
h
1 ε s1
2 − 16
0 1 1
+ ε
2 2 16
ε
2
kti − si k∞ 6 ε. (4)
547
90. Théorème taubérien de Hardy-Littlewood
u1 6 s1 6 h 6 s2 6 u2 ,
• Considérons enfin pi = X + X(1 − X)ui ∈ R[X] pour tout i ∈ J1, 2K. Ces pi
vérifient évidemment la deuxième condition requise par l’énoncé. Concernant
la première condition, par définition de h on a, pour tout x ∈ [0, 1],
On peut donc approcher h par des polynômes p1 , p2 avec les propriétés voulues.
(iii) Il est clair que g(0) = 0 et que g(1) = 1. Pour tout x ∈ [0, 1[, la série
n n
n an g(x ) converge car c’est une somme finie. En effet, x → 0 lorsque x
P
tend vers 0 et g est nulle au voisinage de 0, de sorte que g(xn ) = 0 pour tout n
suffisamment grand. Il reste à montrer que la somme de série obtenue en mettant p1
à la place de g est une bonne approximation. En notant p = p2 (x)−p 1 (x)
x(1−x) et puisque
|an | 6 C/n pour un certain C > 0 par l’hypothèse de domination, on a
+∞
X +∞
X +∞
X
an g(xn ) − an p1 (xn ) 6 |an |(g(xn ) − p1 (xn ))
n=0 n=0 n=0
+∞
X p2 (xn ) − p1 (xn )
6C
n=1
n
+∞
X xn (1 − xn )
6C p(xn )
n=1
n
+∞
X
6 C(1 − x) xn p(xn ).
n=0
548
Intégration et approximation de fonctions
+∞
X +∞
X +∞
X +∞
X
an g(xn ) 6 an g(xn ) − an p1 (xn ) + an p1 (xn )
n=0 n=0 n=0 n=0
6 (C + 1)ε,
de sorte que g ∈ Φ.
c) Sans perdre de généralité, quitte à remplacer a0 par a0 + `, on peut supposer
P
que ` = 0. La fonction g permet de simuler les sommes partielles de la série an .
En effet on a, pour tout x ∈ [0, 1[,
N +∞
ln 2
X X
an = an g(xn ) où N= − ,
n=0 n=0
ln x
de sorte que N tend vers l’infini lorsque x tend vers 1− . Puisque g ∈ Φ par la
fonction b)(iii), on en déduit que la somme de cette série tend vers zéro lorsque x
tend vers 1− , ce qui est le résultat escompté.
Commentaires.
© Ce théorème constitue une sorte de réciproque au théorème d’Abel (1826) :
+∞
X
Soit ` ∈ R. Soit (an )n∈N une suite de réels. Si an = `, alors
n=1
+∞
lorsque x → 1− .
X
an xn → `
n=0
+∞
X
an = `.
n=0
549
90. Théorème taubérien de Hardy-Littlewood
De tels théorèmes, ainsi que leurs analogues pour les séries de Dirichlet, sont
particulièrement présents et utiles en théorie analytique des nombres, où l’étude
de quantités arithmétiques (les coefficients an ) est ramenée à une étude analytique
locale de la fonction génératrice associée.
© Il est important d’être conscient du choix de présentation fait aux ques-
tions b)(ii) et (iii) pour prouver les convergences vers zéro. En effet, plutôt
que de majorer par ε comme le demande la définition habituelle de la limite,
nous majorons par M ε où M > 0 est une constante (à savoir M = 5 dans la
question b)(ii) et M = C + 1 dans la question b)(iii). Cela ne change en rien le
résultat, puisqu’il est possible de réécrire la preuve en remplaçant ε > 0 par la
valeur ε/M > 0.
© La construction explicite de l’approximation de h par des fonctions continues à
la question b)(ii) est essentiellement élémentaire, mais toutefois technique à écrire.
S’il est important de savoir justifier cette approximation, nous recommandons
de représenter le graphe de h au tableau lors de la présentation comme fait
à la Figure 2.37, et d’expliquer brièvement quelles sont les fonctions s1 et s2 .
Une explication claire, en montrant où sont les paramètres dépendant de ε
dans l’approximation (sans mentionner toutefois les ajustements nécessaires de
550
Intégration et approximation de fonctions
facteurs multiplicatifs, pour les mêmes raisons qu’à la remarque précédente) est
convaincante. Il faut toutefois s’attendre à des questions demandant le détail
donné dans la correction.
Questions.
1. Justifier que le rayon de la série entière apparaissant en (1) est supérieur à 1.
2. Que se passe-t-il sans l’hypothèse an = O(n−1 ) ?
Indication : considérer les exemples an = (−1)n et an = √1 .
n
551
91. Divergence de l’interpolation de Lagrange
Correction.
a) Le polynôme d’interpolation de Lagrange considéré est explicitement
Y u
X−
1 u6=2 m
Pm (X) = · ,
m Y 2 u
−
u6=2
m m
où les indices des produits sont dans J−m, mK. La valeur Pm (1/2) est donc
Y
(m − 2u)
1 1
u6=2
Pm = · Y
2 m22m (2 − u)
u6=2
1 1 3m(3m − 2) · · · (m − 4) · · · 1 · (−1)(−3) · · · (−m)
= · ·
m22m m − 4 (m + 2)(m + 1) · · · 1 · (−1)(−2) · · · (2 − m)
3m(3m − 2) · · · m(m − 2) · · · 1 · 1 · 3 · · · m
= .
m(m − 4)22m (m + 2)(m + 1) · · · 2 · 1 · 1 · 2 · · · (m − 2)
552
Intégration et approximation de fonctions
Transformons ce quotient comme suit : séparons les éléments du numérateur par pa-
quets en fonction de leur appartenance à J1, mK, Jm + 1, 2m + 1K ou J2m + 3, 3mK
et distribuons la puissance de 2 dans chaque terme du dénominateur. On obtient
alors
1 m−1 3m(3m − 2) · · · (m + 2)(m · · · 5 · 3)2
Pm = ·
2 2m(m − 4)(m + 1)(m + 2) (2m(2m − 2) · · · 2 · 4)2
m−1 3m(3m − 2) · · · (2m + 3)
= 2
·
4m (m − 4)(m + 1)(m + 2) (2m − 2) · · · (m + 3)(m + 1)
(2m + 1) · · · (m + 2) (m · · · 5 · 3)2
× · .
2m(2m − 2) · · · (m + 3)(m + 1) ((m − 1) · · · 2 · 4)2
où
m···5 · 3
A=
(m − 1) · · · 4 · 2
(2m + 1)(2m − 1) · · · (m + 2)
B=
2m(2m − 2) · · · (m + 1)
3m 3m − 2 2m + 3
C= ··· .
2m − 2 2m − 4 m+1
Notons alors f1 = gh1 . Considérons Lkf1 (1/2) et laissons tendre k vers l’infini. On
a alors deux possibilités :
• Soit Lkf1 (1/2) ne tend pas vers zéro lorsque k → +∞, alors on prend f = f1
et on obtient le résultat escompté : Lkf est un polynôme de Lagrange sur [−1, 1]
553
91. Divergence de l’interpolation de Lagrange
interpolant f en au moins k points distincts, mais Lkf (1/2) ne converge pas vers
la valeur f (1/2) = 0 lorsque k tend vers l’infini.
• Soit il existe un entier r1 > 1 tel que pour tout k > r1 , on a |Lkf1 (1/2)| < K/2.
Soit alors h2 > max(h1 , r1 ). Considérons la fonction f1 + gk pour k > h2 . Les deux
fonctions de cette somme sont à supports disjoints, de sorte qu’elle est continue
sur [−1, 1], nulle en 1/2 et telle que, pour tout k > h2 ,
Notons que les fonctions fn sont des sommes de fonctions gk pour différentes valeurs
de k, et que les gk sont nulles en 1/2 et à supports dans des intervalles disjoints et
loin de 1/2. Ainsi, en laissant tendre n vers l’infini, (fn )n converge simplement vers
une fonction f nulle en 1/2. La suite ainsi construite de polynômes d’interpolation
de Lagrange prend des valeurs hors de [−K, K] en 1/2 par l’inégalité précédente,
donc en particulier ne peut pas converger en 1/2 vers f (1/2) = 0.
554
Intégration et approximation de fonctions
Commentaires.
© La théorie de l’interpolation a pour objectif d’approcher des fonctions suffisam-
ment régulières par des polynômes. Elle est motivée par des enjeux numériques
notamment en termes de vitesse de calcul (voir par exemple les approximations
par splines cubiques très utilisées dans l’industrie, qui sont des approximations par
des fonctions polynomiales de degré 3 par morceaux). L’idée est de fixer un certain
nombre de points (les nœuds) de la fonction recherchée et d’essayer de trouver
le meilleur polynôme – en un sens à préciser – passant par les mêmes points
que la fonction en ces nœuds, tout en espérant pouvoir contrôler suffisamment
bien l’erreur d’approximation hors de ces points. Le théorème d’approximation de
Weierstrass assure la possibilité d’une telle approximation, de manière uniforme
dès que la fonction est continue sur un segment. Cette possibilité est réalisée par
exemple en utilisant les polynômes de Bernstein (voir par exemple [QZ13]), qui
sont des approximations polynomiales convergeant uniformément vers la fonction.
Les splines mentionnées précédemment sont justement les polynômes de Bernstein
de degré 3. Toutefois, les polynômes de Bernstein ne sont pas des polynômes de
meilleure approximation (voir Développement 92), de sorte qu’ils ne sont pas for-
cément les plus adaptés pour aborder certains problèmes théoriques. Par exemple,
le polynôme de Bernstein de degré n d’un polynôme de degré n n’est en général
pas le polynôme lui-même !
© Les polynômes d’approximation de Lagrange sont des polynômes interpolateurs
de degré minimal. On pourrait penser que ces polynômes donnent un bon moyen
d’approcher les fonctions continues sur un segment, en augmentant le nombre de
points d’interpolation. Il n’en est rien dans le cas de nœuds d’interpolation équiré-
partis : ce développement prouve que, pour certaines fonctions, il existe toujours
des points de l’intervalle où la suite des polynômes interpolateurs diverge lorsque
le nombre de points augmente. C’est un phénomène d’instabilité de type Runge :
l’approximation polynomiale de Lagrange n’est pas une approximation globale,
et peut très mal se comporter aux points hors de ceux fixés pour l’interpolation.
Internet regorge d’illustrations de ce phénomène.
Il faut des conditions de régularité fortes pour que cette situation ne puisse pas se
produire, et c’est un enjeu important de pouvoir maîtriser l’erreur d’approximation.
On peut ainsi prouver une borne de type « accroissements finis » :
555
91. Divergence de l’interpolation de Lagrange
Questions.
1. Justifier que les facteurs de C dans la question a) sont de plus en plus petits
de gauche à droite.
2. Répondre à la première question en utilisant la formule de Stirling.
3. Expliquer pourquoi P3k = Lkgk .
4. Justifier l’égalité des polynômes de Lagrange énoncée en (2).
5. Montrer que la suite (fn )n∈N∗ construite dans le développement converge
simplement.
6. Prouver la borne (3) mentionnée en commentaire.
7. Montrer que les mêmes polynômes de Lagrange que ceux considérés à la
question a) ne divergent plus en 1/2 si on remplace [−1, 1] par [0, 1].
8. Montrer que, des nœuds distincts x0 , . . . , xn étant fixés, la base (Li )i formée
des polynômes de Lagrange élémentaires associés est la base duale dans L(Rn [X])
des évaluations (φi )i , où φi (P ) = P (xi ) pour tout i ∈ J0, nK.
556
Intégration et approximation de fonctions
Soient a, b ∈ R tels que a < b. Soit une fonction f définie et continue sur un
intervalle [a, b] de R. Pour tout polynôme P ∈ R[X], on pose
Correction.
a) (i) Soient L0 , . . . , Ln les polynômes de Lagrange associés aux points x0 , . . . , xn ,
c’est-à-dire les polynômes
Y
(X − xj )
j6=i
Li = Y , i ∈ J0, nK .
(xi − xj )
j6=i
La famille (Li )i∈J0,nK est une base de l’espace des polynômes de degré au plus n,
557
92. Meilleure approximation polynomiale
Les |Pk (xi )|, pour i ∈ J0, nK et k > 1, sont uniformément bornés par A par
hypothèse. De plus, pour tout j ∈ J0, nK, les coefficients de degré j des polynômes
de Lagrange Li , pour tout i ∈ J0, nK, sont en nombre fini et sont donc uniformément
bornés. Ainsi, les coefficients des Pk sont uniformément bornés d’après (2).
(ii) Par définition de dn (f ), pour tout k > 1 il existe Pk ∈ Rn [X] tel que
1
dn (f ) 6 d(f, Pk ) 6 dn (f ) + .
k
1
|Pk (x)| 6 |f (x)| + dn (f ) + 6 |f (x)| + dn (f ) + 1.
k
Puisque f est continue, cette dernière quantité est bornée uniformément pour
x ∈ [a, b] et k > 1. Pour i ∈ J0, nK et k > 1, notons ai,k le coefficient de Pk devant
le monôme X i . Par la question précédente, la suite des familles de coefficients
(a0,k , . . . , an,k )k∈N∗ des Pk est une suite bornée de Rn+1 . Par le théorème de
Bolzano-Weierstrass, il existe un point d’accumulation (a0 , . . . , an ) ∈ Rn+1 de la
suite (a0,k , . . . , an,k )k∈N∗ , autrement dit il existe une extraction φ : N → N telle
que (a0,φ(k) , . . . , an,φ(k) )k∈N∗ → (a0 , . . . , an ) lorsque k tend vers +∞. Introduisons
le polynôme P dont les coefficients sont les ai , pour i ∈ J0, nK, c’est-à-dire
n
X
P = ai X i ∈ Rn [X].
i=0
Ainsi, on a d(P, Pφ(k) ) → 0 lorsque k tend vers +∞. Par inégalité triangulaire la
fonction polynomiale P vérifie alors
Puisque cette inégalité est vraie pour tout k > 1, en passant à la limite on en
déduit que d(f, P ) 6 dn (f ). Puisque P ∈ Rn [X], on obtient alors d(f, P ) = dn (f )
par minimalité de dn (f ). La distance dn (f ) est donc atteinte.
b) (i) Notons d = dn (f ). Introduisons la différence g = P − f qui est continue
sur [a, b]. Si g = 0, le résultat est immédiat, de sorte que l’on peut supposer g 6= 0.
Par définition du polynôme P de meilleure approximation, le maximum de |g| sur
le segment [a, b] est d = dn (f ). Par continuité de g sur le segment [a, b], celui-ci
est atteint.
558
Intégration et approximation de fonctions
Supposons que g n’atteigne pas d et −d, de sorte que soit g soit −g atteint d mais
est toujours strictement supérieure à −d. Quitte à multiplier par −1, on peut
supposer qu’il s’agit de g, autrement dit qu’il existe ε > 0 tel que
∀x ∈ [a, b], −d + ε 6 g(x) = f (x) − P (x) 6 d,
559
92. Meilleure approximation polynomiale
Ainsi, par continuité, le supremum supc I |f − (P + ηR)| est atteint sur c I qui est
compact, et est strictement inférieur à d.
Finalement, la distance |f − (P + ηR)| atteint son supremum sur [a, b], qui est
donné par la combinaison des deux situations précédentes :
!
sup |f − (P + ηR)| = max sup |f − (P + ηR)|, sup |f − (P + ηR)| < d.
[a,b] I cI
Commentaires.
© La question a)(ii) peut-être traitée plus rapidement par un argument de
compacité très efficace, mais un peu moins explicite : il suffit de constater que
l’ensemble des P ∈ Rn [X] tels que d(f, P ) 6 dn (f ) + 1 est un compact non vide de
l’espace vectoriel normé de dimension finie Rn [X] muni de la norme infinie, donc
la fonction continue d(f, ·) atteint son minimum sur ce compact. Ce minimum est
exactement un polynôme de meilleure approximation.
© Ce développement s’attaque au problème de l’approximation polynomiale glo-
bale d’une fonction. Il s’agit de minimiser la distance entre la fonction et son
approximation polynomiale uniformément sur tout l’intervalle considéré, c’est-à-
dire d’optimiser la pire erreur ponctuelle possible. Cette approche est différente des
560
Intégration et approximation de fonctions
Questions.
1. En assimilant polynômes et fonctions polynomiales, le supremum d(P, Q) défini
au début de l’exercice induit-il une distance sur Rn [X] ?
2. Montrer qu’il existe un unique polynôme de meilleure approximation de f dans
l’espace L2 ([a, b]), défini comme un polynôme P ∈ Rn [X] minimisant la distance
Z b !1/2
2
d(f, P ) = |f (t) − P (t)| dt .
a
561
Probabilités et statistiques
On lance une aiguille de longueur 1 sur une surface assimilée au plan R2 muni
d’un repère orthonormé (O, → −ı , →
− ). On note alors (x, y) la position du centre
de l’aiguille dans ce repère, x ∈ [0, 1] le représentant dans [0, 1] de la classe de
congruence de x modulo 1 et θ ∈ 0, π2 une mesure de l’angle géométrique
y θ
→
−
→
−ı
O 1 x 2
On suppose que le couple (x, θ) peut être modélisé par une variable aléatoire
notée (X, Θ) de loi U [0, 1] × 0, π2 (c’est-à-dire
que X et Θ sont indépen-
dantes et de lois uniformes sur [0, 1] et 0, π2 respectivement).
565
93. Aiguille de Buffon
Correction.
a) L’aiguille étant de longueur 1, ses extrémités ont pour abscisses x − cos(θ)2
et x + cos(θ)
2 , si bien qu’elle coupe l’une des droites {n} × R (avec n ∈ Z) si et
seulement si l’une des deux conditions incompatibles
cos(θ) cos(θ)
x− <0 ou x+ >1
2 2
est réalisée.
On cherche donc à déterminer la probabilité de l’événement
cos(Θ) cos(Θ)
A= X− <0 t X+ >1 .
2 2
Or
cos(Θ) cos(Θ)
P(A) = P X − <0 +P X + >1
2 2
cos(Θ) cos(Θ)
=P X< +P X >1− ,
2 2
et comme X et Θ sont indépendantes et de lois uniformes, on a
π Z 1 π Z 1
2 2
Z Z
2 2
P(A) = 1x− cos(θ) <0 dxdθ + 1x+ cos(θ) >1 dxdθ
0 π 0 2 0 π 0 2
π π
2 cos(θ) 2 cos(θ)
Z Z
2 2
= P X< dθ + P X >1− dθ
0 π 2 0 π 2
π π
2 cos(θ) 2 cos(θ)
Z Z
2 2
= dθ + dθ
0 π 2 0 π 2
π
2
Z
2
= cos(θ) dθ
0 π
2
= .
π
b) On déduit de la question précédente que si l’on réalise un grand nombre de
lancers indépendants dans les conditions de l’énoncé, la proportion d’aiguilles
chevauchant une droite {n}×R (avec n ∈ Z) doit converger (en probabilité d’après
la loi faible des grands nombres et presque sûrement d’après la loi forte des grands
nombres) vers π2 .
Précisons le résultat de convergence en probabilité en fournissant un intervalle de
confiance pour π à un niveau arbitraire.
Pour tout k ∈ N∗ , on note Bk la variable de Bernoulli prenant la valeur 1 si la
k-ième aiguille lancée chevauche l’une des droites considérées et 0 sinon, et pour
tout n ∈ N∗ on pose
n
1X
Bn = Bk ,
n k=1
566
Probabilités et statistiques
2 1 2 2
si bien que E B n = π et V B n = n · π 1− π par indépendance des Bk .
Soit à présent α ∈ ]0, 1]. Pour ∗
n ∈ N , l’inégalité de Bienaymé-Tchebychev et
tout
la majoration grossière π2 1 − π2 6 14 (qui provient de la relation x(1 − x) 6 14
valable pour tout x ∈ R) impliquent que
2 2
2 1
V Bn π 1− π
P Bn − > √ 6 2 = · 4αn 6 α,
π 2 αn √1 n
2 αn
Commentaires.
© La célèbre expérience présentée dans cet exercice a été proposée pour la première
fois par le mathématicien, naturaliste et philosophe Georges-Louis Leclerc de
Buffon en 1733 dans son Mémoire sur le jeu du Franc Carreau. Elle est aisément
réalisable en pratique en jetant un grand nombre d’aiguilles de même longueur
connue L sur un parquet composé de lattes de largeur au moins égale à L. Le lecteur
désireux de tenter cette mise en pratique prendra toutefois garde à reprendre le
calcul de la question a) en tenant compte du fait que la longueur des aiguilles
n’est pas nécessairement égale à la largeur des lattes !
© La technique proposée dans la question b) appartient à la famille de méthodes
d’estimation dites de Monte-Carlo. Ces méthodes permettent d’approcher un
paramètre inconnu, exprimé comme une probabilité ou comme une espérance, par
simulation d’un grand nombre de variables aléatoires, et possèdent généralement
une vitesse de convergence en √1n , garantie par le théorème central limite. Leur
intérêt dans le calcul d’intégrales de fonctions d’une variable réelle, qui peuvent
être approchées bien plus rapidement par des méthodes numériques spécifiques,
est essentiellement anecdotique ; toutefois, elles s’avèrent particulièrement intéres-
santes pour approcher des intégrales multiples en grandes dimensions, cadre dans
lequel les méthodes de quadrature deviennent trop coûteuses.
© Une autre méthode d’approximation de π appartenant à la famille des méthodes
de Monte-Carlo revient à tirer un grand nombre de points indépendamment et
selon une loi uniforme dans le√pavé [0, 1]2 , puis à estimer la proportion de points
du plan (x, y) vérifiant y 6 1 − x2 . La loi forte des grands nombres stipule
567
93. Aiguille de Buffon
R √
que cette proportion converge presque sûrement vers 01 1 − x2 dx = π4 , et le
théorème central limite assure que cette convergence est réalisée avec une vitesse
de l’ordre de √1n .
© On a obtenu l’intervalle de confiance In,α grâce à l’inégalité de Bienaymé-
Tchebychev. On pouvait toutefois gagner en précision
en utilisant le théorème
central limite et la majoration grossière π2 1 − π2 6 41 , qui donnent l’intervalle
de confiance asymptotique suivant de niveau 1 − α pour π :
2 2
Jn, α = , ,
Φ−1 (1− α ) Φ−1 (1− α )
Bn + √ 2
2 n
Bn − √ 2
2 n
Dans tous les cas, le niveau de précision atteint dans l’estimation de π2 avec un
niveau de confiance donné est de l’ordre de √1n , conformément aux prédictions du
théorème central limite, et il n’est pas difficile de montrer qu’il en est de même
pour l’estimation de π.
Questions.
1. Rappeler la définition de l’angle géométrique entre deux droites. Le résultat de
ce développement aurait-il changé si l’on avait considéré un angle géométrique
entre vecteurs, de loi uniforme sur [0, π] ?
2. A-t-on implicitement fait des hypothèses sur la loi suivie par l’ordonnée du
centre de l’aiguille à l’issue du lancer ?
3. Détailler le raisonnement permettant d’affirmer que l’aiguille coupe l’une des
droites {n} × R (avec n ∈ Z) si et seulement si
cos(θ) cos(θ)
x− < 0 ou x + > 1,
2 2
et que ces deux conditions sont incompatibles.
4. Détailler le raisonnement permettant de généraliser la méthode présentée dans
ce développement à des aiguilles de longueur L > 0 lancées sur un parquet dont
les lattes sont de largeur au moins égale à L.
5. La méthode d’estimation proposée ici semble-t-elle efficace par ses aspects
pratiques ?
568
Probabilités et statistiques
569
94. Paradoxe de Penney
Leçons concernées : 153, 155, 162, 226, 230, 243, 261, 264, 266
Correction.
a) Pour obtenir la séquence « face-face-pile », il est nécessaire d’obtenir dans
un premier temps la séquence « face-face ». Une fois cette séquence observée (ce
570
Probabilités et statistiques
qui survient après T 0 lancers), le jeu revient à attendre l’apparition d’un « pile »
(pendant un temps G, qui suit donc bien une loi géométrique de paramètre 1/2).
Les lancers réalisés avant l’apparition de la séquence « face-face » et ceux réalisés
après étant indépendants, on obtient bien le résultat escompté.
b) Pour tout k ∈ N∗ , on note Bk la variable de Bernoulli prenant la valeur 1 si le
k-ième « face » obtenu est suivi d’un « face » et 0 sinon. Le temps d’attente du
premier « face » peut être modélisé par une variable aléatoire G1 de loi G (1/2).
Une fois ce premier « face » obtenu, si B1 (qui est indépendante de G1 ) prend la
valeur 1 alors T 0 prend la valeur G1 + 1, sinon l’expérience est réinitialisée à partir
du rang G1 + 2. Il faut alors attendre pour obtenir à nouveau « face » un nombre
de tirages aléatoire G2 de loi G (1/2), indépendant des événements portant sur les
tirages passés. Dans ce cas, si B2 prend la valeur 1 alors T 0 = (G1 + 1) + (G2 + 1),
sinon l’expérience est réinitialisée à partir du rang (G1 + 1) + (G2 + 1) + 1. En
reproduisant ce raisonnement par récurrence, on voit que
G0
0
X
T = (Gk + 1),
k=1
P 0
G
=E E s k=1
(Gk +1)
G0
0
= E E(sG1 +1 )G
571
94. Paradoxe de Penney
s3
∀s ∈ [0, 1], φS (s) = φS 00 (s)φS 0 (s) = φT 0 (s)φS 0 (s) = φ(sφ(s))φ(s) = .
s3 − 8s + 8
Les variables S et T ont donc la même loi.
e) Considérons un jeu de lancers de pièces équilibrées autour duquel s’affrontent
deux joueurs, et dans lequel il est décidé que le joueur A gagne la partie si la
séquence « face-face-pile » apparaît avant la séquence « pile-face-face » et que le
joueur B gagne la partie dans le cas contraire. La probabilité pour que le joueur A
gagne la partie est donc P(T < S). Or l’issue de la partie est en réalité déterminée
par le résultat des deux premiers lancers. En effet, si les deux premiers lancers
n’amènent pas la séquence « face-face », c’est-à-dire amènent au moins un « pile »,
alors la première apparition de la séquence « face-face » par la suite initiera certes
une séquence « face-face-pile », mais complètera une séquence « pile-face-face ».
Ainsi, le joueur B gagnera systématiquement la partie dans le cas où X1 et X2 ne
prennent pas toutes deux la valeur 0. Le joueur A gagnera par contre la partie
dans le cas où X1 et X2 prennent la valeur 0 puisqu’alors le premier « pile » obtenu
complètera la séquence « face-face-pile », si bien que
1
P(T < S) = P(X1 = X2 = 0) = .
4
On obtient un résultat surprenant : le joueur B a trois chances sur quatre de
gagner la partie, alors que les temps d’attente des séquences « pile-pile-face » et
« face-pile-pile » possèdent la même loi. Ce fait, énoncé en 1969 par Walter Penney,
est connu sous le nom de paradoxe de Penney.
Commentaires.
© Pour éviter le recours à l’espérance conditionnelle lors du calcul de φT 0 dans la
question c), on peut écrire :
P 0
G
(Gk +1)
∀s ∈ [0, 1], φT 0 (s) = E s k=1
0
+∞
X G
X
= sn P (Gk + 1) = n
n=1 k=1
0
+∞ +∞ G
0
X X X
n
= s P G = i ∩ (Gk + 1) = n
n=1 i=1 k=1
+∞ +∞ i
!!
0
X X X
n
= s P G =i ∩ (Gk + 1) = n
n=1 i=1 k=1
+∞ +∞ i
!
0
X X X
n
= s P G =i P (Gk + 1) = n
n=1 i=1 k=1
572
Probabilités et statistiques
i=1
+∞
P G0 = i φPi
X
= (Gk +1)
(s)
k=1
i=1
+∞
P G0 = i φi(G1 +1) (s)
X
=
i=1
= φG0 φ(G1 +1) (s)
= φG0 (sφG1 (s)) .
573
94. Paradoxe de Penney
1
2
1 2 3
1 1
1 2 2 1
2
574
Probabilités et statistiques
d’où
1
∀n ∈ N, Zn = An Z0 = An 0 .
0
3. Le polynôme caractéristique de A est
1 − 2X 1 0
1 (1 − X)(4X 2 − 2X − 1)
χA (X) = 1 −2X 0 =
8 4
0 1 2 − 2X
puisque ((Yn = 3))n∈N est une suite croissante d’événements. Comme |µ| < 1
et |µ| < 1, passer à la limite dans (4) assure que α = 1.
Un simple regard à la Figure 2.38 permet ensuite d’écrire
P(Y0 = 3) = P(Y1 = 3) = 0,
On en déduit √
1−µ 3− 5
γ= = √
µ−µ 2 5
34. en écrivant l’égalité An Z0 = P Dn P −1 Z0 , où P ∈ GL3 (R) et où D ∈ M3 (R) est une
matrice diagonale, et en observant la forme des coefficients de Zn = An Z0 .
575
94. Paradoxe de Penney
puis √
3+ 5
β = −1 − γ = − √ .
2 5
On a finalement
√ √
3+ 5 n 3− 5 n
∀n > 0, P(Yn = 3) = 1 − √ µ + √ µ
2 5 2 5
© On peut prolonger le calcul précédent pour obtenir la loi de T (ce qui donne
alors lieu à un développement FF, toujours élémentaire mais relativement long).
On reprend les notations de la question a). Par indépendance de T 0 et G, on
déduit que si k > 2, alors :
k−1
P (T 0 = i) ∩ (G = k − i)
X
P(T = k) =
i=1
k−1
P(T 0 = i)P(G = k − i)
X
=
i=1
k−1
X 1 1
= √ µi−1 − µi−1 k−i
i=1 2 5 2
1 k−1
X
i−1 i−1
= √ (2µ) − (2µ)
2k 5 i=1
!
1 1 − (2µ)k−1 1 − (2µ)k−1
= √ −
2k 5 1 − 2µ 1 − 2µ
1 2(µ − µ) − (1 − 2µ)(2µ)k−1 + (1 − 2µ)(2µ)k−1
= √
2k 5 1 − 2(µ + µ) + 4µµ
k
µ −µ k 1
= √ − k,
5 2
la dernière ligne de calcul étant facilitée par deux remarques : d’une part, µ et µ
sont par définition les racines du polynôme 4X 2 − 2X − 1, ce qui permet d’écrire
sans calcul que µ + µ = 12 et que µµ = − 14 , et d’autre part 1−2µ
2 = µ et 1−2µ
2 =µ
d’après ces relations.
© Un jury d’agrégation pourrait légitimement vouloir vérifier la capacité d’un
candidat à formaliser la réponse à la question a). Dans ce cas, il suffirait d’écrire
T = inf {k > T 0 : Xk = 1}
576
Probabilités et statistiques
P (T 0 = m) ∩ (inf {k > T 0 : Xk = 1} − T 0 = n)
= P (T 0 = m) ∩ (inf {k > m : Xk = 1} − m = n)
= P T 0 = m P (inf {k > m : Xk = 1} − m = n)
1
= P T0 = m n,
2
où la deuxième égalité découle du fait que l’événement (T 0 = m) s’écrit uniquement
en fonction des variables X1 , . . . , Xm qui sont indépendantes de la famille de
variables (Xk )k>m .
Le lecteur est invité à formaliser de même tous les arguments probabilistes mobilisés
dans la correction ci-avant.
© Dans le cadre d’une leçon sur les séries, il est possible de déterminer explicitement
la loi de T (et donc de S) en développant en série entière l’expression de sa fonction
génératrice (ce qui donne lieu à un développement assez long et un peu technique,
de difficulté FF). Si s ∈ [0, 1], on rappelle que
s2 s s3 1 1
φT (s) = φ(sφ(s))φ(s) = · = · . (5)
2
4 − 2s − s 2 − s s
8 1− 2 − s2
4
1 − 2s
k 1
la série de Taylor de s 7→
P
Notons k>0 ak s 2
1− 2s − s4
en 0. Son rayon de convergence
est strictement positif puisque 0 n’est pas un pôle de la fraction rationnelle associée
1
X X2
, donc on a
1− 2
− 4
! +∞ +∞
s s2 X X 1 +∞
X 1 +∞
X
1= 1− − ak sk = ak s k − ak sk+1 − ak sk+2
2 4 k=0 k=0
2 k=0 4 k=0
1 1
∀k > 0, ak+2 − ak+1 − ak = 0.
2 4
√ √
1+ 5 1− 5
On en déduit, en posant µ = 4 et µ = 4 :
1 1 1 1
∀k ∈ N, ak = + √ µk + − √ µk .
2 2 5 2 2 5
577
94. Paradoxe de Penney
Comme les termes sommés sont positifs, on peut écrire l’égalité ci-avant à l’aide
d’un produit de Cauchy, d’où, pour s assez proche de 0,
k
s3 +∞
!
X X 1
φT (s) = ai k−i sk
8 k=0 i=0 2
+∞ k
1 1 1 1 sk+3
XX
= + √ (2µ)i + − √ (2µ)i k+3
k=0 i=0
2 2 5 2 2 5 2
+∞
" #
X 1 1 1 − (2µ)k+1 1 1 1 − (2µ)k+1 sk+3
= + √ + − √
k=0
2 2 5 1 − (2µ) 2 2 5 1 − (2µ) 2k+3
+∞
" #
X 1 1 − (2µ)k+1 1 1 − (2µ)k+1 sk+3
= 1+ √ √ + 1− √ √
k=0 5 1− 5 5 1+ 5 2k+3
+∞
" #
X 1 (2µ)k+1 1 (2µ)k+1 sk+3
= 1+ √ √ − 1− √ √ − 1 k+3
k=0 5 5−1 5 5+1 2
+∞
" #
X µk+3 − µk+3 1
= √ − k+3 sk+3 .
k=0 5 2
En écrivant que
+∞
X
φT (s) = P(T = k)sk
k=0
pour tout s ∈ [0, 1], on obtient alors que P(T = 0) = P(T = 1) = P(T = 2) = 0 et
que pour tout k > 3,
µk − µ k 1
P(T = k) = √ − k.
5 2
+∞
X
P(T < +∞) = P(T < +∞) = P(T = k) = 1
k=2
578
Probabilités et statistiques
Questions.
1. Formaliser l’argument de la question a) selon lequel « une fois [le] premier
« face » obtenu, si B1 (qui est indépendante de G1 ) prend la valeur 1 alors T 0
prend la valeur G1 + 1, sinon l’expérience est réinitialisée à partir du rang G1 + 2 ».
2. Montrer en utilisant la loi forte des grands nombres que les variables T et T 0
prennent des valeurs finies avec probabilité 1.
3. Écrire l’événement (T = m) en fonction d’événements portant sur les variables
X1 , . . . , Xm .
4. Justifier que la suite (Bk )k∈N∗ est bien définie, au sens où il existe effectivement
un rang d’obtention du k-ième « face » pour tout k ∈ N∗ .
5. Justifier la relation (1).
6. Justifier la convergence des séries dont on calcule les sommes dans les commen-
taires suivant le développement.
7. Quelle est l’expression de φT sur ] − 1, 0[ ?
8. Quelle est la valeur de E(T ) ?
9. Montrer à l’aide d’arguments heuristiques que pour tout k > 0 on a
P(T 0 = k + 1 | X1 = 0) = P(T 0 = k)
et
P(T 0 = k + 2 | (X1 = 1) ∩ (X2 = 0)) = P(T 0 = k),
puis vérifier que la suite (P(T 0 = k))k∈N est récurrente linéaire d’ordre 2 et retrou-
ver l’expression explicite de P(T 0 = k) pour tout k > 2.
10. Aurait-on pu recourir à une formalisation en termes de marche aléatoire
comme celle donnée en commentaires et à une matrice de taille 4 × 4 pour calculer
directement la loi de T sans passer par celle de T 0 ?
11. Calculer E(T 2 ) et E(T 3 ). La variable aléatoire T admet-elle des moments de
tous ordres ?
12. On réalise des lancers successifs d’une pièce équilibrée jusqu’à obtenir la
séquence « pile-face », et on note T la variable aléatoire comptant le nombre de
lancers effectués. Déterminer la loi de T 00 . Calculer E(T 00 ) et V (T 00 ).
Indication : on pourra poser pour tout n > 1 l’événement
579
95. Formule de Stirling par la limite centrale
Soit (Xn )n∈N∗ une suite de variables aléatoires indépendantes et de même loi
de Poisson de paramètre 1.
Pour tout n > 1, on pose
n
1X
Xn = Xi
n i=1
et
√
Zn = n(Xn − 1).
b) Montrer que pour tout A > 0 et pour toute variable aléatoire X admettant
un moment d’ordre 2 :
E(X 2 )
0 6 E(X) − E(X ∧ A) 6 ,
A
où X ∧ A := min(X, A).
c) Montrer que
lim E(Zn− ) = E(Z − ),
n→+∞
580
Probabilités et statistiques
Correction.
√
a) Soit n > 1. La variable aléatoire Zn− est à valeurs dans [0, n], donc elle admet
une espérance. Par ailleurs,
!−
n
− 1 X
E Zn =√ E Xi − n
n i=1
!−
n n
1 X X
=√ kP Xi − n = k
n k=0 i=1
!−
n n
1 X X
=√ kP Xi − n = k
n k=1 i=1
n n
!
1 X X
=√ kP Xi − n = −k
n k=1 i=1
n n
!
1 X X
= √ kP Xi = n − k ,
n k=0 i=1
Pn
or i=1 Xi suit une loi de Poisson de paramètre n donc
n
1 X nn−k
E Zn− = √ k e−n
.
n k=0 (n − k)!
On a donc bien √ n
n n
E(Zn− ) = .
n! e
2
b) Soit A > 0. On va établir que 0 6 x − x ∧ A 6 xA pour tout x ∈ R, ce qui
2
permettra d’écrire 0 6 X − X ∧ A 6 XA puis de conclure par passage à l’espérance.
On distingue deux cas selon la valeur de x :
581
95. Formule de Stirling par la limite centrale
x2
• Si x 6 A, alors x − x ∧ A = 0, donc 0 6 x − x ∧ A 6 A.
x x2
• Si x > A, alors x − x ∧ A = x − A, or x − A > 0 et x − A < x < x A = A
x
puisque x > 0 et A > 1.
x2
On a donc bien 0 6 x − x ∧ A 6 A pour tout x ∈ R, d’où le résultat.
c) D’après le théorème central limite, on a
L
Zn −−−−−→ Z,
n→+∞
lim E Zn− ∧ A = E Z − ∧ A .
(1)
n→+∞
0 6 (Zn− )2 6 Zn2
L’inégalité (2) et la question b) donnent donc, pour tout A > 0 et tout n > 1,
1 1
E(Zn− ) − E(Z − ) 6 + E(Zn− ∧ A) − E(Z − ∧ A) + ,
A A
582
Probabilités et statistiques
Commentaires.
© Il est aisé de démontrer qu’il existe C > 0 tel que
n
n √
n! ∼ C n
n→+∞ e
1
en remarquant que ln(nn+ 2 e−n ) − ln(n!) est la somme partielle d’une série té-
lescopique convergente.
√ L’apport de ce développement est de spécifier que la
constante est égale à 2π grâce à la connaissance de la valeur de l’intégrale de
Gauss — cachée derrière le fait que la densité de la loi normale centrée réduite
est d’intégrale 1.
© On peut démontrer la convergence de E(Zn− ) vers E(Z − ) dans la question c)
sans passer par la question b). Pour cela, on remarque dans un premier temps
que (1) implique
pour tout A > 0. Comme E(Z − ) = supA>0 E(Z − ∧ A) on en tire, par le théorème
de convergence monotone (ou par le théorème de convergence dominée),
583
95. Formule de Stirling par la limite centrale
Cette observation implique, après passage à limite supérieure dans l’inégalité (4)
grâce à (1), que
1
lim sup E(Zn− ) 6 E(Z − ∧ A) +
n→+∞ A
pour tout A > 0, d’où
1
lim sup E(Zn− ) 6 E(Z − ) +
n→+∞ A
E (Zn− )2
1
E Zn− 1Zn− >A 6 6 −−−−−→ 0.
A A n→+∞
Comme (Zn− )n∈N∗ converge en loi vers Z − , il existe par le théorème de Sko-
rokhod un espace probabilisé (Ω0 , A0 , P0 ) sur lequel sont définies des variables
584
Probabilités et statistiques
aléatoires (Zn0 )n∈N∗ et Z 0 telles que pour tout n > 1 la loi de Zn0 sous P0 soit la loi
de Zn− sous P, que la loi de Z 0 sous P0 soit la loi de Z − sous P, et que
p.s.
Zn0 −−−−−→ Z 0 .
n→+∞
et à calculer les termes 0+∞ P(Zn > t)dt et 0+∞ P(Z > t)dt. Comme on va le
R R
Z +∞ Z +∞
√
P(Zn > t)dt = P(X1 + . . . + Xn > t n + n)dt
0 0
+∞ +∞
! !
nk k
Z +∞ Z +∞
n
1k>t√n+n e−n 1k>t√n+n e−n
X X
= dt = dt
0 k=0
k! k=0 0 k!
+∞ k−n +∞
!
k √
nk k − n
−n n
Z
n
e−n
X X
= e dt = √
k=n
k! 0 k=n
k! n
+∞ +∞ +∞ +∞
! !
e−n X nk X nk e−n X nk X nk+1
= √ k − n = √ −
n k=n
k! k=n
k! n k=n
(k − 1)! k=n k!
+∞ +∞
e−n X e−n nn
nk+1 X nk+1
= √ − = √
n k=n−1 k! k=n
k! n (n − 1)!
n
√ n 1
= n ,
e n!
585
95. Formule de Stirling par la limite centrale
On calcule enfin 0+∞ P(Z > t)dt grâce à une nouvelle application du théorème
R
de Fubini-Tonelli :
Z +∞ Z +∞ Z +∞
1
u2
P(Z > t)dt = √ e− 2 du dt
0 0 t 2π
Z +∞ Z +∞
1 − u2
= 1t6u √ e 2 du dt
0 0 2π
Z +∞ +∞ 1 − u2
Z
= 1t6u √ e 2 dt du
0 0 2π
Z +∞ Z u
1 2
u
= √ e− 2 dt du
0 0 2π
Z +∞
1 u2
= √ ue− 2 du
0 2π
1
=√ ,
2π
Questions.
1. Détailler l’utilisation du théorème de transfert faite à la question d).
Pn
2. Justifier que i=1 Xi suit une loi de Poisson de paramètre n.
3. Justifier que la variable Zn est centrée et réduite.
4. Représenter graphiquement la fonction x 7→ x− ∧ A pour constater qu’elle est
continue et bornée.
5. Justifier que si X admet un moment d’ordre 2, alors E(X) et E(X ∧ A) existent.
6. La variable Z − est-elle à densité ?
n
X nk 1
7. Justifier que exp (−n) −→ à l’aide du théorème central limite.
k=0
k! n→+∞ 2
1
8. Montrer que ln nn+ 2 e−n − ln(n!) est bien la somme partielle d’une série
télescopique convergente.
9. Donner une construction explicite des variables Xn0 et X 0 obtenues par le
théorème de Skorokhod utilisé en commentaire.
Indication : utiliser les fonctions de répartition inverses des Xn− et de X − .
10. Rappeler pourquoi une suite uniformément intégrable de variables aléatoires
réelles convergeant en probabilité converge aussi dans L1 .
586
Probabilités et statistiques
11. On présente ici une autre preuve de la formule de Stirling, tirée de [GK19]
(exercice 251 de la deuxième édition).
Soit (Yn )n∈N une suite de variables aléatoires indépendantes et de même loi
exponentielle de paramètre 1. Pour tout n ∈ N, on pose Sn = Y0 + · · · + Yn .
n −n
(a) Montrer que S√ n
converge en loi vers une variable suivant une loi normale
centrée réduite lorsque n tend vers +∞.
Indication : on pourra utiliser le lemme de Slutsky.
(b) Montrer que pour tout n > 1, la variable aléatoire Sn suit la loi Γ(n + 1, 1),
n −n
et déduire que la densité de S√ n
s’écrit gn = an hn avec
1 √
nn+ 2 e−n 2π
an =
Γ(n + 1)
et n
1 √ x
hn (x) = √ e− nx 1 + √ 1[−√n,+∞[ (x).
2π n
(c) Montrer que
Z 1 Z 1 Z 1
1 x2
lim gn (x)dx = lim hn (x)dx = √ e− 2 dx.
n→+∞ 0 n→+∞ 0 0 2π
587
96. Une marche aléatoire sur [0, 1]
Soit p ∈ ]0, 1[. On considère une suite (ξn )n∈N de variables aléatoires de
même loi de Bernoulli de paramètre p, ainsi qu’une suite (Un )n∈N de variables
aléatoires de même loi uniforme sur [0, 1]. On suppose que toutes les variables
aléatoires ainsi introduites sont indépendantes.
On pose à présent X0 = x pour un x ∈ [0, 1], et
Xn+1 = Un Xn + ξn (1 − Un )
pour tout n > 0. Les Xn sont donc à valeurs dans [0, 1].
a) Montrer que si (bn )n∈N est une suite réelle convergente et si a ∈ [0, 1[, alors
toute suite (un )n∈N vérifiant la relation de récurrence un+1 = aun + bn , pour
tout n > 0, converge.
b) En déduire que pour tout k ∈ N, la suite (E(Xnk ))n∈N converge vers le
moment d’ordre k d’une loi bêta de paramètres p et 1 − p.
c) Montrer que la suite (Xn )n∈N converge en loi vers une loi bêta de para-
mètres p et 1 − p.
On étudie ici la convergence en loi d’une chaîne de Markov (Xn )n∈N représentant
la position d’une particule qui se déplace sur [0, 1] en choisissant à chaque pas
de temps une nouvelle position uniformément parmi les points situés à sa droite
(avec probabilité p) ou parmi les points situés à sa gauche (avec probabilité 1 − p).
La preuve consiste à exploiter la relation de récurrence existant entre les moments
des Xn pour en montrer la convergence en loi grâce à un argument de densité.
À ce titre, ce développement permet d’illustrer les leçons 201, 209, 261 et 262.
Par l’utilisation répétée qu’il fait des fonctions spéciales gamma et bêta, il trouve
par ailleurs tout à fait sa place dans la leçon 265. Enfin, la modélisation explicite
des sauts de la particule à l’aide de variables à densité indépendantes justifie
pleinement l’utilisation de ce développement pour illustrer la leçon 266.
Correction.
Définissons les suites arithmético-géométriques (vn )n>N et (wn )n>N en posant les
valeurs initiales vN = wN = uN ainsi que
588
Probabilités et statistiques
vn 6 un 6 wn (2)
pour tout n > N . Or il est classique que la suite arithmético-géométrique (vn )n>N
b−ε b+ε
converge vers 1−a et que (wn )n>N converge vers 1−a , si bien que (2) donne
b−ε b+ε
6 lim inf un 6 lim sup un 6 .
1−a n→+∞ n→+∞ 1−a
b
Comme ε est quelconque, on en déduit que (un )n∈N converge vers 1−a .
b) Comme les Xn sont à valeurs dans [0, 1], elles admettent des moments de
tous ordres. Pour tous k, n ∈ N, on note mn,k = E(Xnk ). En conditionnant par
la valeur de ξn puis en utilisant l’indépendance de Un et de Xn , on obtient pour
tous k, n ∈ N :
k
mn+1,k = E(Xn+1 )
k k
= (1 − p)E(Xn+1 | ξn = 0) + p E(Xn+1 | ξn = 1)
h i h i
= (1 − p)E (Un Xn )k + p E (Un Xn + 1 − Un )k
h i
= (1 − p)E(Unk )E(Xnk ) + p E (Un (Xn − 1) + 1)k
Z 1 h
1−p i
= mn,k + p E (u(Xn − 1) + 1)k du.
k+1 0
Montrons par récurrence forte sur k que (mn,k )n∈N converge pour tout k ∈ N.
La propriété est évidente pour k = 0, puisque dans ce cas on a mn,k = 1 quel
que soit n > 0. Considérons à présent k ∈ N et supposons que la suite (mn,i )n∈N
converge pour tout i 6 k. La relation (3) permet alors d’écrire que pour tout n > 0
1 p Pk−1
la quantité mn+1,k vaut amn,k + bn , où a = k+1 ∈ [0, 1[ et où bn = k+1 i=0 mn,i
589
96. Une marche aléatoire sur [0, 1]
converge lorsque n tend vers +∞. D’après la question a), la suite (mn,k+1 )n∈N
converge donc, ce qui établit la propriété au rang k + 1.
Par le principe de récurrence, on déduit que pour tout k ∈ N la suite (mn,k )n∈N
converge vers une limite que nous noterons mk .
Il s’agit à présent de montrer que les mk sont exactement les moments d’une loi
bêta de paramètres p et 1 − p. En passant à la limite n → +∞ dans (3), on obtient
pour tout k ∈ N la relation
1 p k−1
X
mk = mk + mi ,
k+1 k + 1 i=0
soit encore
p k−1
X
mk = mi .
k i=0
En utilisant le fait que m0 = 1 et en calculant les premiers termes de (mk )k∈N ,
on conjecture la formule suivante, qui se démontre sans difficulté par récurrence
forte :
p k−1
Y p 1 k−1
∗
Y
∀k ∈ N , mk = 1+ = (i + p) . (4)
k i=1 i k! i=0
En utilisant la relation Γ(z + 1) = zΓ(z) valable pour tout z ∈ C tel que Re(z) > 0,
on en déduit pour tout k ∈ N que
1 k−1
m0k =
Y
(p + i)
k! i=0
590
Probabilités et statistiques
Commentaires.
© On peut traiter la question a) à l’aide d’un argument de sommation des relations
de comparaison. Plaçons-nous une fois encore dans les conditions de l’énoncé,
b
notons b ∈ R la limite de la suite (bn )n∈N et posons ` = 1−a , si bien que ` vérifie
` = a` + b. Pour tout k ∈ N, on a alors
et donc
a−(k+1) (uk+1 − `) − a−k (uk − `) = o a−k , (6)
soit a−n (un − `) = o(a−n ) et donc un − ` = o(1), si bien que (un )n∈N converge
vers `.
591
96. Une marche aléatoire sur [0, 1]
592
Probabilités et statistiques
Dans ce développement, cette formule est utilisée pour le système complet d’évé-
nements {(ξn = 0), (ξn = 1)}.
Les lecteurs probabilistes reconnaîtront dans E(X | A) la valeur sur A de l’espérance
conditionnelle de X par rapport à une tribu contenant A, et dans la formule
k k k
E(Xn+1 ) = (1 − p)E(Xn+1 | ξn = 0) + p E(Xn+1 | ξn = 1)
utilisée dans la correction de la question a) une réécriture de la relation
E(Xn+1 ) = E[E(Xn+1 | ξn )] .
Questions.
1. Expliquer pourquoi (Xn )n∈N représente la position d’une particule qui se
déplace sur [0, 1] en choisissant à chaque pas de temps une nouvelle position
uniformément parmi les points situés à sa droite (avec probabilité p) ou parmi les
points situés à sa gauche (avec probabilité 1 − p).
Indication : on pourra écrire Xn+1 = (1 − ξn )Un Xn + ξn (Un Xn + (1 − Un ) · 1) pour
tout n > 0.
2. Montrer que l’intégrale
Z 1
B(α, β) := tα−1 (1 − t)β−1 dt
0
est bien finie pour tous les complexes α, β ∈ C tels que Re(α) > 0 et Re(β) > 0.
3. Détailler la récurrence menant à l’encadrement (2) dans la question a).
4. Traiter la question a) pour des suites à valeurs dans C en supposant seulement
que a ∈ C vérifie |a| < 1.
5. Détailler les calculs préliminaires donnant l’intuition de la relation (4), ainsi
que la démonstration par récurrence de cette relation.
Indication : dans la démonstration par récurrence, on pourra faire apparaître une
somme télescopique en écrivant pi comme 1 + pi − 1.
6. Détailler l’utilisation du théorème de Fubini et du théorème de convergence
dominée dans la réponse à la question c) par le théorème de Lévy suggérée en
commentaire.
7. Démontrer la relation (7).
8. Montrer que
Z 1
φn+1 (t) = p + (1 − p)eit(1−u) φn (ut)du
0
593
97. Loi forte des grands nombres
presque sûrement.
b) Soit (Xn )n∈N∗ une suite de variables aléatoires indépendantes de même loi
et d’espérance m ∈ R. Montrer que
n
1X p.s.
Xk −−−−−→ m.
n k=1 n→+∞
Correction.
n n+1
Sn0
X X
a) Pour tout n ∈ N∗ , on note Sn = Yk et = Yk puis on définit
k=1 k=2
On va montrer que P(A) = 0, ce qui permettra de conclure que (Sn )n∈N∗ est
minorée presque sûrement et d’obtenir la conclusion attendue.
Remarquons d’ores et déjà que 1A0 = 1A presque sûrement. Par ailleurs, pour
tout n ∈ N∗ , les variables Ln et L0n sont intégrables puisqu’elles sont majorées
respectivement par nk=1 |Yk | et n+1k=2 |Yk |.
P P
594
Probabilités et statistiques
Ln = Y1 + min(S1 − Y1 , . . . , Sn − Y1 )
= Y1 + min(0, S20 , . . . , Sn−1
0
)
= Y1 + min(0, L0n−1 )
> Y1 + min(0, L0n ),
Mais A0 appartient à la tribu engendrée par les Yk pour k > 2 donc 1A0 est
indépendant de Y1 , si bien que E (Y1 1A0 ) = E(Y1 )E(1A0 ) = mE(1A0 ) = mP(A).
Par ailleurs, les suites (Yn )n>2 et (Yn )n∈N∗ ayant même loi, on a
et donc
= E (1A max(0, Ln )) .
quel que soit n > 2 puisque la suite (Lk )k∈N∗ est décroissante. Le théorème de
convergence dominée donne donc, par passage à la limite dans (2), mP(A) 6 0,
puis P(A) = 0, ce qu’il fallait démontrer.
b) Soit p ∈ N∗ . Posons
n n
!
1 1X 1X 1
Bp = m − 6 lim inf Xk 6 lim sup Xk 6 m + .
p n→+∞ n
k=1 n→+∞ n k=1 p
595
97. Loi forte des grands nombres
soit
n
1X 1
lim sup Xk 6 m +
n→+∞ n k=1
p
Commentaires.
© L’hypothèse d’indépendance et d’identique distribution des variables Xn n’est
en rien minimale ; il existe de nombreuses versions plus fortes encore de la loi forte
des grands nombres, relâchant par exemple la contrainte d’équidistribution.
© Rappelons les grandes étapes de la démonstration traditionnelle de la loi des
grands nombres par Kolmogorov. On se ramène tout d’abord au cas où les Xn
sont centrées, puis l’on pose Xn0 = Xn 1|Xn |6n pour tout n ∈ N∗ . Grâce au lemme
de Borel-Cantelli, on montre ensuite que presque sûrement Xn0 6= Xn seulement
pour un nombre fini (aléatoire) de n, et qu’il suffit alors d’établir que
n
1X
X 0 −−−−−→ 0
n k=1 k n→+∞
On utilise ensuite le fait que la série de terme général V(Zk /k) converge et on
utilise l’inégalité de Kolmogorov 35
( n ) ! P Zk
X Zk k>1 V k
P sup ,n > 1 >x 6
k=1
k x2
596
Probabilités et statistiques
Questions.
1. Que signifie rigoureusement le fait que les suites (Yn )n∈N∗ et (Yn )n>2 ont la
même loi ?
2. Construire une suite (Xn )n∈N∗ de variables aléatoires non indépendantes, iden-
tiquement distribuées et de même espérance m ∈ R, ne satisfaisant pas la loi des
grands nombres.
3. Construire une suite (Xn )n∈N∗ de variables aléatoires indépendantes de même
espérance m ∈ R mais non identiquement distribuées ne satisfaisant pas la loi des
grands nombres.
4. Montrer que si (Xn )n∈N∗ est une suite de variables aléatoires indépendantes de
même loi telle que E(|X1 |) = +∞, alors
n
1 X
lim sup Xk = +∞
n→+∞ n k=1
presque sûrement.
Indication : on remarquera que si E(|X1 |) = +∞ alors E (|X1 |/A) = +∞ pour
tout A > 0, puis on montrera que
X X
P (|Xn | > An) = P (|X1 | > An) = +∞
n>1 n>1
597
97. Loi forte des grands nombres
E |X1 − X10 | 6 ε.
(d) Conclure.
598
Probabilités et statistiques
où les
k
ξ sont des variables aléatoires indépendantes et de même loi uniforme
sur − e1 , e1 , . . . , −ed , ed .
Le but de ce développement est d’établir le théorème de Pólya qui affirme que
la chaîne de Markov (Xn )n∈N est récurrente si et seulement si d 6 2.
a) Montrer que si la marche aléatoire simple sur Zd est récurrente, alors la
0
marche aléatoire sur Zd l’est pour tout d0 6 d.
b) Montrer que (Xn )n∈N est récurrente si et seulement si la série de terme
général P(Xn = 0) diverge.
c) Conclure.
Correction.
a) Notons R l’événement correspondant au retour de la marche aléatoire en 0 en
temps fini, c’est-à-dire [
R := (Xn = 0).
n∈N∗
Rappelons que par définition, la chaîne de Markov irréductible (Xn )n∈N est
transiente lorsque P(R) < 1 et récurrente sinon.
0
Fixons d0 ∈ J1, dK. On note κ la projection de Rd sur Rd définie par
0
κ: Rd −→ Rd
(x1 , . . . , xd ) 7−→ (x1 , . . . , xd0 )
599
98. Théorème de Pólya — version dénombrement
La suite (τn )n∈N est la suite des rangs auxquels l’une des d0 premières coordonnées
du vecteur aléatoire Xk change. On pose alors
∀n ∈ N, Xn0 := Xτ (n) .
La suite (Xn0 )n∈N ainsi construite, obtenue en tronquant les d − d0 dernières
coordonnées des termes de la suite (Xn )n∈N et en éliminant les termes successifs
0
qui se répètent, modélise alors la marche aléatoire simple sur Zd . Or
R0 := (Xn0 = 0) =
[ [ [
(Xτ (n) = 0) ⊃ (Xn = 0) = R
n∈N∗ n∈N∗ n∈N∗
0
d’où P(R0 ) > P(R), si bien que (Xn0 )n∈N est récurrente (sur Zd ) dès que P(R) = 1,
c’est-à-dire dès que (Xn )n∈N est récurrente (sur Zd ), ce qu’il fallait démontrer.
b) On sait que le nombre de retours en 0 de (Xn )n∈N , défini par
+∞
X
N0 := 1Xk =0 ,
k=1
suit une loi géométrique de paramètre 1 − P(R) si (Xn )n∈N est transiente et vaut
presque sûrement +∞ sinon. Ainsi, (Xn )n∈N est transiente si et seulement si N0
admet une espérance finie. En écrivant
+∞ +∞ +∞
!
X X X
E(N0 ) = E 1Xk =0 = E (1Xk =0 ) = P(Xk = 0)
k=1 k=1 k=1
600
Probabilités et statistiques
p ! ! !
X p p 2p
La formule de Vandermonde = donne alors
k=0
k p−k p
!2
2p 1
P(X2p = 0) = .
p 42p
1
2πp e−p p p
p
p! ∼ pour obtenir P(X2p = 0) ∼ ,
p→+∞ p→+∞ πp
Cas de la dimension 3.
Supposons à présent que d = 3. Pour tout n ∈ N impair, on a P(Xn = 0) = 0
pour la même raison que précédemment. Par ailleurs, on remarque que le nombre
22p P(X2p = 0) de chemins de longueur 2p conduisant la marche aléatoire de 0 à 0,
que nous appellerons fermés, est une fonction croissante de p ∈ N puisqu’il est
possible de créer un chemin fermé de longueur 2(p + 1) à partir d’un chemin fermé
de longueur 2p en lui ajoutant deux mouvements qui se compensent. Ainsi, pour
tout p ∈ N∗ on a
601
98. Théorème de Pólya — version dénombrement
Figure 2.41 – Trajectoire de (Xn )n∈N (en haut) et de (kXn k1 )n∈N (en bas) dans
le cas d = 2 : la marche aléatoire retourne en 0 avec probabilité 1.
Or on a i!j!k! > (p!)3 pour tous i, j, k ∈ J0, 3pK tels que i + j + k = 3p (voir
602
Probabilités et statistiques
603
98. Théorème de Pólya — version dénombrement
Commentaires.
© La marche aléatoire simple sur Zd est parfois appelée « marche de l’homme
ivre ». Le théorème de Pólya stipule que l’homme ivre décrit par le processus
parvient avec probabilité 1 à rentrer chez lui (bien qu’il ne dise pas quand !), sauf
s’il effectue sa marche dans l’espace ou en dimension supérieure...
© L’inégalité i!j!k! > (p!)3 pour tous i, j, k ∈ J0, 3pK vérifiant i + j + k = 3p, qui
peut sans mal être admise pour ne pas allonger outre mesure la présentation du
développement, se démontre comme suit.
Posons S = {(i, j, k) ∈ J0, pK3 : i + j + k = 3p} et montrons que le minimum de la
quantité i!j!k! pour (i, j, k) ∈ S est atteint pour le triplet (p, p, p). Soit (i, j, k) ∈ S
minimisant i!j!k!. Si i < k − 1, alors i < 3p et k > 1 donc (i + 1, j, k − 1) ∈ S, or
Questions.
1. Démontrer la formule de Vandermonde, qui affirme que pour tous m, n ∈ N et
tout r ∈ J0, m + nK on a
r
! ! !
m+n X m n
= .
r k=0
k r−k
604
Probabilités et statistiques
0
sont toutes à valeurs dans Zd , que l’on a X00 = 0 et que les variables aléatoires
0
Xn+1 − Xn0 (pour n ∈ N) sont indépendantes et de même loi uniforme sur
0
{−e01 , e01 , . . . , −e0d0 , e0d0 }, où (e01 , . . . , e0d0 ) représente la base canonique de Rd .
Indication : on utilisera la propriété de Markov forte et on considèrera les trajec-
toires de (Xn )n∈N possibles entre les temps τn successifs.
7. Démontrer la formule du multinôme, qui stipule que si x1 , . . . , xn ∈ R, alors
N!
xi11 · · · xinn .
X
(x1 + · · · + xn )N =
i
∈J0,N K 1
i1 , ··· , in
! · · · in !
i1 +···+in =N
8. Considérons le cas d = 2. Vérifier que les suites des projections (he1 , Xn i)n∈N
et (he2 , Xn i)n∈N sur Z ne sont pas des marches aléatoires simples indépendantes,
mais que (he1 + e2 , Xn i)n∈N et (he1 − e2 , Xn i)n∈N le sont. En déduire que pour
tout entier n ∈ N on a P (Xn = 0) = P (Yn = 0)2 , où (Yn )n∈N modélise une marche
aléatoire simple sur Z.
9. Montrer que si l’on change la loi des ξk de façon à ce qu’elles soient toujours
indépendantes, identiquement distribuées et à valeurs dans {−e1 , e1 , . . . , −ed , ed }
mais d’espérance non nulle, alors on a
P kXn k −−−−−→ +∞ = 1.
n→+∞
605
99. Théorème de Pólya — version analytique
ϕ : Rd −→ C
x 7−→ E e2iπhx, ξ1 i .
ϕn : Rd −→ C
x 7−→ E e2iπhx, Xn i .
1
c) On pose à présent 1 := (1, . . . , 1) ∈ Rd . Montrer que la fonction est
1−ϕ
bien définie et continue sur [0, 1]d \ {0, 1}, puis que
+∞
dx
X Z
P(Xn = 0) = ∈ R ∪ {+∞}.
n=0 [0,1]d 1 − ϕ(x)
d) Conclure.
606
Probabilités et statistiques
Correction.
a) Notons R l’événement correspondant au retour de la marche aléatoire en 0 en
temps fini, c’est-à-dire [
R := (Xn = 0).
n∈N∗
Rappelons que par définition, la chaîne de Markov irréductible (Xn )n∈N est
transiente lorsque P(R) < 1 et récurrente sinon.
On sait que le nombre de retours en 0 de la marche aléatoire (Xn )n∈N , défini par
+∞
X
N0 := 1Xk =0 ,
k=1
suit une loi géométrique de paramètre 1 − P(R) si (Xn )n∈N est transiente et vaut
presque sûrement +∞ sinon. Ainsi, (Xn )n∈N est transiente si et seulement si N0
admet une espérance finie. En écrivant
+∞ +∞ +∞
!
X X X
E(N0 ) = E 1Xk =0 = E (1Xk =0 ) = P(Xk = 0)
k=1 k=1 k=1
n
!
2iπhx, ξk i
Y
=E e
k=1
n
E e2iπhx, ξk i = ϕ(x)n ,
Y
=
k=1
d’où ϕn = ϕn .
Par définition de l’espérance et par linéarité de l’intégration, on a
Z Z
ϕn (x)dx = E e2iπhx, Xn i dx
[0,1]d [0,1]d
Z X
= e2iπhx,ki P(Xn = k)dx
[0,1]d
k∈Zd
X Z
= P(Xn = k) e2iπhx,ki dx.
[0,1]d
k∈Zd
607
99. Théorème de Pólya — version analytique
608
Probabilités et statistiques
R dx dx
R
Or toutes les intégrales P − 1−εϕ(x) (pour ε ∈ [0, 1[) ainsi que l’intégrale P − 1−ϕ(x)
1
sont finies puisque 1−ϕ est bornée par 1 sur l’ensemble P − qui est de mesure finie.
On peut donc sommer les égalités (3) et (4) pour obtenir la relation suivante,
cette fois dans R ∪ {+∞} :
dx dx dx
Z Z Z
= +
[0,1]d 1 − ϕ(x) P + 1 − ϕ(x) P − 1 − ϕ(x)
dx dx
Z Z
= lim + lim
ε%1 P + 1 − εϕ(x) ε%1 P − 1 − εϕ(x)
dx dx
Z Z
= lim +
ε%1 P + 1 − εϕ(x) P − 1 − εϕ(x)
dx
Z
= lim ,
ε%1 [0,1]d 1 − εϕ(x)
1 − ϕ(x) = 1 − ϕ(1 − x)
2π 2
∼ k1 − xk22 .
d
On en tire les équivalents
1 d 1 d
∼ et ∼ .
1 − ϕ(x) x→0 2π kxk22
2 1 − ϕ(x) x→1 2π k1 − xk22
2
609
99. Théorème de Pólya — version analytique
dx dx
Z Z
et
B(0,1) kxk22 B(1,1) k1 − xk22
dx
Z
< +∞ si et seulement si d ∈ {1, 2}.
B(0,1) kxk22
d−1
ψ : ]0, 1[ × − π2 , π2
−→ B(0, 1)
ρ ρ cos(θ1 )
θ1
ρ sin(θ1 ) cos(θ2 )
..
7−→
..
,
. .
θd−2 ρ sin(θ1 ) · · · sin(θd−2 ) cos(θd−1 )
d−1
dont le déterminant jacobien Jψ (ρ, θ) au point (ρ, θ) ∈ ]0, 1[ × − π2 , π2
vérifie
l’identité
Jψ (ρ, θ) = ρd−1 Jψ (1, θ)
dx 1 d−1
Z Z
= ρ |Jψ (1, θ)| dρdθ
A kxk22 ]0,1[ ×] − π2 , π2
[
d−1
ρ2
Z Z
= ρd−3 dρ d−1
|Jψ (1, θ)| dθ (5)
]0,1[ ]− π2 , π2 [
610
Probabilités et statistiques
c’est-à-dire que
dx
Z
< +∞ si et seulement si d ∈ {1, 2},
B(0,1) kxk22
d’où le résultat annoncé.
La question a) implique alors le théorème de Pólya.
Commentaires.
© On se reportera au Développement 98 ainsi qu’aux commentaires et aux ques-
tions qui le suivent pour une démonstration plus combinatoire et des informations
supplémentaires sur le théorème démontré ici.
© La méthode présentée ici permet le calcul explicite de la probabilité P(R) de
retour de la marche aléatoire simple en 0, puisque les questions a) et c) donnent
+∞
1 dx dx1 · · · dxd
X Z Z
−1= P(Xn = 0) = = Pd dx.
P(R) n=1 [0,1]d 1 − ϕ(x) [0,1]d d − k=1 cos(2πxk )
Glasser et Zucker ont montré en 1977 que dans le cas d = 3, cette probabilité vaut
−1 −1 −1 −1
32π 3 1 5 7 11
P(R) = 1 − √ Γ Γ Γ Γ ≈ 0, 3405373296.
6 24 24 24 24
Les expressions analytiques de P(R) ne sont pas connues en dimension supérieure,
mais les approximations numériques montrent sans surprise que P(R) est d’autant
plus faible que d est grand :
P(R) ≈ 0, 1932 si d = 4, P(R) ≈ 0, 1352 si d = 5,
P(R) ≈ 0, 1047 si d = 6, P(R) ≈ 0, 0858 si d = 7, etc.
611
99. Théorème de Pólya — version analytique
Questions.
1. Montrer que pour tout k ∈ Z on a
Z 1
e2iπxk dx = 1{0} (k).
0
612
Probabilités et statistiques
Soit (Xn )n∈N∗ une suite de variables aléatoires indépendantes de même loi de
Bernoulli de paramètre 12 . Pour tout n ∈ N∗ , on note
n
1X
Xn = Xk .
n k=1
I : ]0, 1[ −→ R
x 7−→ ln(2) + x ln (x) + (1 − x) ln (1 − x) .
613
100. Un théorème de grandes déviations
Correction.
a) Soit n ∈ N. Pour tout p ∈ J0, nK, on note up = p!(n − p)! > 0. On a alors :
up+1 p+1
∀p ∈ J0, n − 1K , =
up n−p
donc up+1 < up si et seulement si p < n−1
2 et up+1 > up si et seulement si p >
n−1
2 .
Ainsi, si n est pair on a
r n z rn z
∀p ∈ 0, − 1 , up > up+1 et ∀p ∈ , n , up < up+1 ,
2 2
et si n est impair on a u n−1 = u n+1 ainsi que
2 2
s { s {
n−1 n+1
∀p ∈ 0, − 1 , up > up+1 et ∀p ∈ , n , up < up+1 .
2 2
i i2
b) Soit (a, b) ∈ 1
2, 1 tel que a < b. Pour tout n ∈ N∗ on a
!
n n! n!
max ln = max ln = ln
p∈J0,nK p p∈J0,nK p!(n − p)! dane!(n − dane)!
p/n∈[a,b] p/n∈[a,b]
d’après la question précédente, puisque dane est la valeur de p ∈ J0, nK telle que
p 1
n ∈ [a, b] soit le plus proche de 2 . La formule de Stirling donne l’équivalent
√ 1
n! ∼ 2πnn+ 2 e−n ,
n→+∞
d’où
1
n! nn+ 2
∼ √ 1 1
dane!(n − dane)! n→+∞
2πdanedane+ 2 (n − dane)n−dane+ 2
dane+ 1 n−dane+ 1
1 n n
2 2
=√ . (1)
2πn dane n − dane
n! n
Comme > n−1 = n pour tout n ∈ N∗ tel que a 6 n−1
n , on a
dane!(n − dane)!
n!
−−−−−→ +∞.
dane!(n − dane)! n→+∞
On peut donc composer (1) par la fonction ln pour obtenir
!
n n! 1 1
ln max = ln ∼ − ln(2π) − ln(n)
p∈J0,nK p dane!(n − dane)! n→+∞ 2 2
p/n∈[a,b]
1 n 1 n
+ dane + ln + n − dane + ln ,
2 dane 2 n − dane
d’où, comme dxne ∼ xn pour tout x ∈ R∗ lorsque n → +∞ :
!
1 n
ln max −
−−−−→ −a ln (a) − (1 − a) ln (1 − a) .
n p∈J0,nK p n→+∞
p/n∈[a,b]
614
Probabilités et statistiques
et donc
! !
1 n n+1 n
max 6 P X n ∈ [a, b] 6 max .
2n p∈J0,nK p 2n p∈J0,nK p
p/n∈[a,b] p/n∈[a,b]
0
Mais pour tout n ∈ N∗ on a P X n ∈ [1 − b, 1 − a] = P X n ∈ [a, b] ainsi
que I(1 − b) = I(b), si bien que
1 h i
ln P X n ∈ [a, b] −→ −I(b).
n n→+∞
• Enfin, si a < 12 < b, la loi des grands nombres montre que P(X n ∈ [a, b])
tend vers 1 lorsque n → +∞, et si a = 12 < b ou a < 12 = b, le théorème
central limite montre que cette probabilité tend vers 12 .
Dans les trois cas, on a donc
1 h i
ln P X n ∈ [a, b] −−−−−→ 0,
n n→+∞
Commentaires.
© Le résultat présenté ici est un cas particulier du théorème de Cramér-Chernoff
démontré dans le Développement 101. On se reportera aux commentaires suivant
ce dernier développement pour une formulation plus générale du théorème.
© On notera que la limite obtenue en b) ne dépend pas de la borne b. Une
explication de ce phénomène est que conditionnellement au fait que X n dépasse
la valeur a, X n se trouve avec haute probabilité à proximité immédiate de a. Ce
dernier point est abordé dans les questions ci-après.
615
100. Un théorème de grandes déviations
Questions.
1. Détailler l’utilisation du théorème central limite faite dans la question c).
2. Étudier les variations de la fonction I sur ]0, 1[ (voir la Figure 2.43) et en
déduire que pour tout intervalle [a, b] ⊂ ]0, 1[ avec a < b, on a
1 h i
lim ln P X n ∈ [a, b] = − inf I(x).
n→+∞ n x∈[a,b]
ln(2)
0 1/2 1
616
Probabilités et statistiques
On considère une suite de variables aléatoires (Xk )k∈N∗ non constantes, indé-
pendantes et de même loi µ sur (R, B(R)), d’espérance nulle et telle que eλX1
soit intégrable pour tout λ ∈ R. Pour tout n ∈ N∗ , on pose
n
1X
X n := Xk .
n k=1
Pour tout ε > 0 tel que P(X1 > ε) > 0, il existe un unique λ0 ∈ R
tel que
1 h i
lim ln P X n > ε = ln E eλ0 X1 − ελ0 < 0.
n→+∞ n
eλ0 x µ(dx)
µ
e(dx) = .
E (eλ0 X )
617
101. Théorème de Cramér-Chernoff
Correction.
a) Pour tout λ ∈ R, on pose
φ(λ) = E eλX1 et ψ(λ) = ln E eλX1 − ελ.
La fonction φ est bien définie sur R par hypothèse sur X1 , et la fonction ψ l’est
aussi puisque φ > 0.
Montrons que ψ est deux fois dérivable sur R. Fixons pour cela M > 0 ; la
majoration
X1 eλX1 6 e|X1 | eλX1 6 e|X1 | eM |X1 | = e(1+M )|X1 | 6 e−(1+M )X1 + e(1+M )X1 ,
valable pour tout λ ∈ [−M, M ], assure que l’espérance E(X1 eλX1 ) existe pour
tout λ ∈ [−M, M ] et, par le théorème de dérivation sous l’espérance, que φ est
dérivable sur ] − M, M [ et vérifie φ0 (λ) = E(X1 eλX1 ) pour tout λ ∈] − M, M [. On
obtient de même la majoration
X12 eλX1 6 e2|X1 | eλX1 6 e−(2+M )X1 + e(2+M )X1 ,
pour tout λ ∈ [−M, M ], qui permet de voir que φ0 est dérivable sur ] − M, M [ et
que φ00 (λ) = E(X12 eλX1 ) pour tout λ ∈] − M, M [. Ces identités sont bien entendu
valables sur R tout entier puisque M est quelconque.
La fonction ψ est donc deux fois dérivable et vérifie :
d’où ψ 00 (λ) > 0. La fonction ψ est donc strictement convexe. Elle admet donc un
minimum sur R, nécessairement unique, si et seulement si elle admet un point
critique, c’est-à-dire s’il existe λ0 ∈ R tel que ψ 0 (λ0 ) = 0, soit
E X1 eλ0 X1
= ε. (1)
E (eλ0 X1 )
618
Probabilités et statistiques
Or on remarque que ψ(λ) = ln E eλ(X1 −ε) pour tout λ ∈ R. Le lemme de
Fatou ainsi que les relations
p.s p.s
eλ(X1 −ε) −−−−→ (+∞) · 1X1 >ε et eλ(X1 −ε) −−−−→ (+∞) · 1X1 <ε
λ→+∞ λ→+∞
impliquent alors que ψ tend vers +∞ en −∞ et +∞, puisque P(X1 > ε) > 0 et
P(X1 < ε) > P(X1 6 0) > 0. Ainsi, ψ admet bien un minimum global sur R, d’où
l’existence (et l’unicité) du point λ0 recherché. Comme ψ(0) = ln(φ(0)) = 0 et
comme λ 6= 0 d’après (1), on a bien ψ(λ0 ) < 0.
b) Soit n ∈ N∗ . Comme les variables Xk sont indépendantes, on a
Pn Pn
P X n > ε = P eλ0 k=1
Xk
> eλ0 nε 6 E eλ0 k=1
Xk
e−nελ0
h in h in
= E eλ0 X1 e−ελ0 = exp ln E eλ0 X1 − ελ0
eλ0 x
Z +∞ Z +∞
xµ
e(dx) = x µ(dx)
−∞ −∞ E(eλ0 X )
1 +∞ Z
= xeλ0 x µ(dx)
E(eλ0 X ) −∞
1
λ0 X
= E Xe
E(eλ0 X )
=ε
619
101. Théorème de Cramér-Chernoff
Alors
1 h 0 i
ln P ε > X n > ε
n
n
" !#
1 1X
> ln E e λX1 0
− ε λ0 + ln P ε0 > X
ek > ε ,
n n k=1
n
!
0 1X 1
P ε > X
ek > ε −−−−−→
n k=1 n→+∞ 2
et donc
1 h i
lim inf ln P X n > ε > ln E eλX1 − ε0 λ0 .
n→+∞ n
1 h i
lim sup ln P X n > ε 6 ln E eλX1 − ελ0 ,
n→+∞ n
Commentaires.
620
Probabilités et statistiques
de prédire que le temps de sortie du voisinage d’un point attractif par le processus
est, avec grande probabilité, de l’ordre de e−V n pour un « coût de sortie » V > 0
calculé en fonction d’une quantité appelée quasi-potentiel, mais aussi que cette
sortie aura lieu, toujours avec grande probabilité, par un chemin « de moindre
résistance » minimisant le coût induit par le quasi-potentiel.
© Une relation du type limn→+∞ n1 ln(un ) = −α, où (un )n∈N∗ est une suite stricte-
ment positive et α > 0, est appelée équivalence logarithmique et est généralement
notée un ≈ e−nα . Elle est strictement moins forte que l’équivalence un ∼ e−nα .
Notons que la borne supérieure obtenue dans la question b) réalise cette dernière
équivalence.
© On pouvait démontrer la convexité de la fonction ψ sans calculer sa dérivée
seconde. Pour tous λ, λ0 ∈ R et a ∈]0, 1[, l’inégalité de Hölder appliquée à eaλX1
0
et e(1−a)λ X1 avec les exposants conjugués a−1 et (1 − a)−1 donne
0
a 0
1−a
φ(aλ+(1−a)λ0 ) = E eaλX1 e(1−a)λ X1 6 E eλX1 E eλ X1 = φ(λ)a φ(λ0 )1−a ,
d’où, après passage au logarithme, la convexité de ln ◦ φ, et donc de ψ.
© L’intérêt principal — et le coup de force mathématique — de ce développement
réside dans le changement de mesure opéré. En pondérant la mesure d’entrée µ par
une densité proportionnelle à eλ0 x pour un λ0 bien choisi, on obtient une mesure
µ
e dont l’espérance n’est plus nulle mais égale à la dérive constitutive des grandes
déviations que l’on cherche à étudier, ce qui permet de ramener le problème à
l’étude d’une marche aléatoire centrée et de conclure en invoquant le théorème
central limite.
© Le théorème de Cramér-Chernoff prend une forme plus générale pour des
variables supposées seulement intégrables (et non plus de transformée de Laplace
définie sur tout R). Il s’écrit alors :
n
" !#
1 X
∀A ∈ B(R), lim ln P Xk ∈ A = − inf I(x),
n→+∞ n x∈A
k=1
pour une certaine fonction I à valeurs dans [0, +∞], dite fonction de taux 36 . C’est
ce formalisme qui est retenu dans le Développement 100.
Questions.
1. Calculer λ0 dans le cas de variables de Rademacher, c’est-à-dire le cas où
µ = 12 (δ−1 + δ1 ).
2. Calculer λ0 et ln E eλ0 X1 − ελ0 dans le cas µ = N (0, 1).
3. Détailler l’argument utilisant le théorème central limite dans la réponse à la
question d).
4. Généraliser le théorème de Cramér-Chernoff au cas où les variables Xk ne sont
pas centrées.
36. Cette fonction est définie par I(x) = supξ∈R ξx − ln E(eξX1 , où E(eξX1 ) vaut +∞
621
101. Théorème de Cramér-Chernoff
la moyenne empirique de
ces variables aléatoires.
Donner un équivalent logarith-
mique de la quantité P X n ∈
/ [p − ε, p + ε] lorsque n tend vers l’infini.
7. On modélise les temps de passage des bus à un arrêt de bus par un processus
de Poisson d’intensité 1. Donner un équivalent logarithmique lorsque n tend vers
l’infini de la probabilité pour que strictement moins de 2n bus soient passés à
l’arrêt avant le temps 2n.
8. La conclusion du théorème de Cramér-Chernoff est-elle vraie si ε > 0 est tel
que P(X1 > ε) = 0 mais P(X1 = ε) > 0 ?
622
Développements d’informatique
Algorithmique
Un algorithme est une description d’une méthode de résolution d’un problème qui
utilise uniquement des opérations élémentaires. On peut ainsi citer les algorithmes
d’addition et de soustraction d’entiers appris dès l’école primaire, qui correspondent
à des procédures décrites au IXe siècle par le mathématicien perse Al-Khwârismî
(dont le nom aurait inspiré le mot « algorithme »).
Bien que la formalisation précise de la définition d’algorithme fait appel à des
notions récentes (voir page 666), certains algorithmes étaient connus dès l’antiquité :
à Babylone dès le IIIe millénaire av. J.-C., en Grèce au IIIe siècle av. J.-C.
(comme l’atteste le célèbre algorithme d’Euclide — probablement connu bien avant
l’écriture du traité d’Euclide — ou un algorithme de calcul des décimales de π
fourni par Archimède), ou encore en Inde où la méthode chakravala permettait
de résoudre certaines équations de Pell-Fermat dès le VIe siècle. L’étude des
algorithmes a ensuite connu son essor avec le développement des machines à
calculer et des ordinateurs qui, bien qu’incapables de résoudre directement des
tâches complexes, excellent dans l’exécution de séquences d’instructions simples.
L’algorithmique est la branche de l’informatique consistant à analyser et conce-
voir des algorithmes. Dans cette discipline, on s’intéresse principalement à trois
caractéristiques d’un algorithme :
• sa terminaison : est-ce qu’il fournit toujours une réponse ?
• sa correction : est-ce qu’il a bien le comportement attendu ?
• sa complexité : de combien de temps et de mémoire a-t-il besoin ?
Autour de ces notions gravitent des questions majeures à la base de vastes domaines
de recherche. Par exemple, déterminer si un problème est décidable (c’est-à-dire
résolu par un algorithme qui termine toujours) est une question fondamentale
en calculabilité. La théorie de la complexité, quant à elle, est née de la volonté
de classifier les problèmes selon une échelle de difficulté définie à partir de la
complexité d’algorithmes qui les résolvent. On peut enfin citer le domaine de
la vérification de programmes, qui consiste à développer des outils (comme la
logique de Hoare, voir page 853) pour montrer la correction ou la terminaison
d’algorithmes (ou plus précisément de leur implémentation).
Dans ce chapitre, nous nous intéressons à des algorithmes manipulant des objets
simples, à savoir des structures linéaires (tableaux, listes) ou arborescentes (tas,
arbre de recherche). Les questions algorithmiques ne se limitent évidemment pas à
ces objets : d’autres algorithmes, manipulant des objets plus spécifiques (matrices,
graphes, langages. . .), seront développés dans les chapitres associés.
Algorithmique
(iii) En déduire une borne sur le nombre de comparaisons C(n) utilisées lors
du tri rapide d’un tableau de taille n utilisant cette version de f .
627
102. Autour du tri rapide
Algorithme 2 : Pivot(T ).
Entrée : un tableau T .
Sortie : un élément pivot de T .
1 Diviser T en b n5 c blocs de 5 éléments, plus un bloc à n mod 5 éléments
2 M ← tableau des médians de chaque bloc
3 renvoyer Rang(M, b n+5 10 c)
Correction.
a) L’algorithme du tri rapide peut s’écrire de la manière suivante :
Algorithme 3 : Tri(T ).
Entrée : un tableau T .
Sortie : le tableau obtenu en triant T .
1 si |T | 6 1 alors
2 renvoyer T
3 sinon
4 x ← f (T )
5 (i, j) ← (0, 0)
6 (T<x , T>x ) ← tableaux de taille n − 1
7 pour k = 0 à n − 1 faire
8 si T [k] < x alors
9 T<x [i] ← T [k]
10 i←i+1
11 sinon si T [k] > x alors
12 T>x [j] ← T [k]
13 j ←j+1
14 Tronquer T<x au i-ième élément et T>x au j-ième.
15 renvoyer Tri(T<x )+JxK+Tri(T>x )
628
Algorithmique
(2 + α)(1 + · · · + n) = O(n2 ).
Comme le pivot est choisi uniformément et que les éléments de T sont deux à
deux distincts, pour tout k ∈ J0, n − 1K, la probabilité que T<x soit de taille k
est n1 . De plus, on a alors |T>x | = n − 1 − k. Alors, par définition de l’espérance
et en effectuant un changement d’indices, on obtient
1 n−1
X 2 n−1
X
C(n) = n + (C(k) + C(n − 1 − k)) = n + C(k).
n k=0 n k=0
En sommant cette inégalité pour k ∈ J0, n − 1K, on reconnaît une somme télesco-
pique et on a (puisque C(0) = 0)
n−1
C(n) C(n) C(0) X 1
= − 62 6 2 ln n,
n+1 n+1 1 k=0
k+2
629
102. Autour du tri rapide
j k j k
De même x est inférieur ou égal à n5 − n+5 10 + 1 médians et chaque médian est
inférieur ou égal à trois éléments de son bloc, d’où
n n+5 n−5
|T>x | > 3 −3 +3>3 ,
5 10 10
où la dernière inégalité provient du fait que
γ = max{D(n) : n 6 90} et β = β1 + β2 + γ.
Pour tout entier k non nul, on montre par récurrence la propriété HRk :
k
X
« Pour tout n tel que ck n < 1, on a D(n) 6 βn ci + γ ».
i=0
D(n) 6 β n
1 + D(|M |) + β n
2 + D(|M 0 |) (1)
|{z} | {z } |{z} | {z }
calcul des médians sélection du pivot calcul de M0 appel récursif
n−5 n−5 7n + 45
|M 0 | 6 n − 3 6n−3 −1 = .
10 10 10
• Si 7n+45
10 > 3n
4 , alors n 6 90 et D(n) 6 γ par définition de γ, ce qui
montre HRk+1 .
• Autrement, on a |M | 6 n
5 et |M 0 | 6 3n
4 , d’où
n 3n
ck |M | 6 ck · 6 ck+1 n < 1 et ck |M 0 | 6 ck · < ck+1 n < 1.
5 4
On peut alors appliquer HRk et on obtient :
k k
D(|M 0 |) 6 β|M 0 |
X X
D(|M |) 6 β|M | ci + γ et ci + γ.
i=0 i=0
630
Algorithmique
Commentaires.
© Dans ce développement, il est indispensable d’écrire les algorithmes utilisés
car on s’y réfère très souvent. C’est notamment valable pour les algorithmes
Rang et Pivot, mais aussi pour l’algorithme du tri rapide vu qu’on en considère
différentes variantes. Comme le reste de l’analyse de complexité n’est pas très
long, ces algorithmes peuvent aussi bien figurer dans le plan qu’être écrits au
tableau. L’avantage de la deuxième solution est de pouvoir expliquer à l’oral leur
fonctionnement, voire les modifications à effectuer pour obtenir une variante en
place.
© On a supposé dans cet exercice que les éléments du tableau T étaient deux à
deux distincts. Cette hypothèse est nécessaire pour justifier que la longueur du
tableau T<x suit une loi uniforme sur J0, n − 1K, mais n’est pas requise pour la ver-
sion déterministe (quitte à légèrement modifier l’algorithme Tri pour calculer T>x
au lieu de T>x ). En pratique, on peut s’assurer que cette hypothèse est vérifiée en
remplaçant chaque T [i] par (T [i], i), puis en triant T par ordre lexicographique.
Cette opération générique permet de rendre stable n’importe quel algorithme de
tri, mais nécessite de doubler l’espace mémoire requis.
© L’algorithme Rang permet de calculer l’élément de rang donné dans un tableau.
Il est facile d’en tirer un algorithme de tri rapide déterministe de complexité
optimale. Le point difficile est le calcul de sa complexité. En supposant que la
631
102. Autour du tri rapide
par une récurrence immédiate, d’où cp = O(p2p ) = O(2p ln(2p )). Comme on ne
peut pas affirmer que C est croissante, on ne peut pas conclure directement. On
peut en revanche obtenir un algorithme de tri en O(n ln n) via un argument de
padding, c’est-à-dire en effectuant l’appel de Tri seulement sur un tableau de taille
2p − 1. Il suffit de considérer l’algorithme qui, à partir d’un tableau T de taille n,
calcule son maximum m, puis ajoute les éléments m + 1, m + 2, . . . à la fin de T
jusqu’à ce que sa taille soit de la forme 2p − 1 (la taille finale de T est donc au
plus le double de sa taille initiale). On applique alors l’algorithme Tri au tableau
obtenu, puis on restreint le résultat à ses n premières cases. Ce nouvel algorithme
n’utilise que n comparaisons (et O(n) opérations élémentaires) de plus que Tri,
c’est-à-dire au plus C(2p ) + O(n) = O(p2p ) + O(n) = O(n ln n) comparaisons.
© L’équation (2) est de la forme
avec a, b, d des réels. Par analogie avec le master theorem, on veut être dans le cas
a + b < d pour obtenir la complexité souhaitée.
Le choix d = 1 est imposé par l’algorithme. De même, découper en blocs de
taille 5 force a = 15 . Considérer des blocs plus longs est évidemment possible et
permet d’obtenir une meilleure valeur pour a, au prix de l’augmentation de la
constante β1 .
Le choix de b, quant à lui, est contraint d’une part par la relation a + b < d,
qui impose b < 54 , et d’autre part par le choix du pivot x, qui garantit que
les tableaux T<x et T>x ont une taille de l’ordre de 7n 10 + O(1). Ainsi, on doit
7
avoir b > 10 pour obtenir l’inégalité bn > 7n10 + O(1) pour n assez grand.
Ceci explique tout d’abord le choix de b = 4 , et donc c = 19
3 1 3
20 = 5 + 4 . Le choix
de γ, quant à lui, est nécessaire pour prendre en compte le nombre fini de valeurs
de n pour lesquelles 3n 7n
4 < 10 + O(1). L’analyse précédente donne une valeur
explicite sur la constante O(1), ce qui permet de montrer que cette inégalité est
satisfaite seulement si n 6 90, justifiant le choix de γ.
© En pratique, on n’utilise pas la variante déterministe présentée ci-avant, car elle
est nettement plus lente. On préfère choisir un pivot aléatoire, puisque le pire cas
quadratique s’avère être peu probable. On peut de plus éviter ce cas en utilisant
632
Algorithmique
Questions.
1. Justifier l’inégalité
n−1
X 1
6 ln n.
k=0
k + 2
2. Expliciter la valeur de β1 .
3. Justifier l’inégalité b2xc > 2bxc pour x > 0.
4. On suppose maintenant que l’algorithme Pivot(T ) utilise des sous-tableaux
de taille k. Comment évolue la borne sur D(n) dans la question d) en fonction
de k ? Peut-on choisir k = 3 ?
5. Écrire une version en place de l’algorithme du tri rapide avec pivot aléatoire.
Peut-on obtenir une version en place de la version déterministe ?
Indication : on pourra s’inspirer de l’algorithme de tri hollandais.
6. Quelle sont les complexités en temps et en mémoire des tris rapide et fusion ?
7. Montrer que tout algorithme de tri basé sur des comparaisons nécessite d’utiliser
Ω(n ln n) comparaisons pour trier un tableau de n entiers.
8. Montrer qu’aucun algorithme de tri basé sur les comparaisons ne peut utiliser
qu’un nombre linéaire de comparaisons sur la moitié des permutations de taille n.
Est-ce toujours vrai pour une fraction de n1 ? 21n ?
9. Pour trier un tableau de taille n, on le découpe en parties de taille k (sauf
éventuellement une, de taille au plus k), puis on applique un algorithme de tri
quadratique sur chaque partie. Donner un algorithme de fusion des tableaux triés.
Quelle est la complexité de cet algorithme (en fonction de k et n) ? Quel est le
meilleur choix possible de k (en fonction de n) ?
10. On considère l’algorithme de tri suivant : étant donné un tableau T de taille n,
n
on trie récursivement (et en place) T [1, . . . , 2n 3 ], puis T [ 3 + 1, . . . , n], puis à
2n
nouveau T [1, . . . , 3 ]. Montrer qu’il s’agit effectivement d’un algorithme de tri, et
déterminer sa complexité.
633
103. Tri par tas
Un tas est un arbre binaire étiqueté où la valeur de chaque nœud est supérieure
ou égale à la valeur de chacun de ses fils, tous les niveaux de l’arbre doivent
être remplis et le dernier niveau est « tassé » vers la gauche (voir ci-après).
On implémente la structure de tas à l’aide d’un tableau indexé à partir de 1.
Ainsi le fils gauche (resp. droit) du nœud en case i est en case 2i (resp. 2i + 1)
et le père d’un nœud i est en case bi/2c.
4 6
3 1 2
634
Algorithmique
Le tri par tas étant un tri par comparaison, il entre naturellement dans la leçon 903
dédiée au problème du tri. De plus, il a la particularité d’utiliser une structure de
données particulière, la structure de tas, afin d’atteindre la borne minimale de
complexité pour les algorithmes de tri par comparaison. Cela justifie son placement
dans la leçon 901. Enfin, puisque c’est un développement présentant un algorithme
dont on donne la complexité et dont on montre la terminaison et la correction,
c’est une illustration des leçons 926 et 927.
Correction.
a) (i) L’algorithme Entasse(T, i) transforme le sous-arbre de racine i en un
tas, en supposant que les deux fils de i sont bien des tas.
On compare l’élément d’indice i avec ses deux fils, on place le maximum des trois
éléments à l’indice i en l’échangeant avec l’ancien élément qui était en i et ensuite
on entasse de nouveau à partir de l’indice du fils qui a été modifié.
i 4 Entasse(T, i) 22 Entasse(T, 2i + 1) 22
17 22 17 4 17 9
8 2 9 7 8 2 9 7 8 2 4 7
(ii) L’algorithme termine car la hauteur de l’arbre est finie et que l’on appelle la
fonction Entasse sur un sous-arbre dont la hauteur est strictement plus petite que
l’arbre initial. Le variant est donc h(i) où h(i) désigne la hauteur du sous-arbre
enraciné en i.
635
103. Tri par tas
b) (i) On va commencer par construire des tas à partir des feuilles et remonter
petit à petit jusqu’à la racine en utilisant les tas déjà fabriqués et la fonction
Entasse.
Algorithme 5 : Construit(tab).
Entrée : un tableau tab.
Sortie : un tas qui contient exactement les éléments du tableau tab.
1 T.taille ← longueur de tab
2 T.tab ← tab
3 pour i allant de bT.taille/2c à 1 faire
4 Entasse(T, i)
5 renvoyer T
4 Entasse(T, 3) 4 Entasse(T, 2) 4
7 8 7 10 9 10
9 3 10 9 3 8 7 3 8
636
Algorithmique
Entasse(T, 1) 10 Entasse(T, 3) 10
9 4 9 8
7 3 8 7 3 4
(ii) L’algorithme Construit termine puisqu’il contient une boucle bornée dans
laquelle on appelle la fonction Entasse qui termine.
Les éléments enracinés en i pour i allant de T.taille à bT.taille/2c + 1 sont des
feuilles et donc sont déjà des tas. Ensuite un invariant de boucle est « l’arbre issu
de i est un tas ». En effet, on entasse pour chaque i (pris dans l’ordre décroissant)
un arbre dont les deux fils sont des tas par l’invariant de boucle. Ainsi l’algorithme
Construit est correct.
La complexité de Construit est naïvement en O(n ln n) car pour chaque élément
on appelle Entasse, mais on peut calculer plus finement pour avoir une complexité
linéaire.
Chaque nœud qui est de profondeur p s’entasse en O(h − p) et il y a au plus 2p
nœuds de profondeur p dans le tas. La complexité de Construit est en O(n) car
h−1 h h k +∞ k
X
p
X
h−k h
X 1 X 1
2 (h − p) = 2 k=2 k6n k = O(n).
p=0 k=1 k=1
2 k=1
2
| {z }
=2
Algorithme 6 : Tri_tas(tab).
Entrée : un tableau tab.
Sortie : un tableau trié qui contient exactement les éléments de tab.
1 T ← Construit(tab)
2 pour i allant de T.taille à 2 faire
3 échanger T.tab[1] et T.tab[i]
4 T.taille ← T.taille − 1
5 Entasse(T, 1)
6 renvoyer T.tab
637
103. Tri par tas
9 8 9 8 4 8
7 3 4 7 3 10 7 3 10
9 échanger 9 et 3 3 Entasse(T, 1) 8
7 8 7 8 7 3
4 3 10 4 9 10 4 9 10
échanger
8 et 4 4 Entasse(T, 1) 7
7 3 4 3 etc.
8 9 10 8 9 10
(ii) L’algorithme du tri par tas termine puisqu’il possède une boucle bornée qui
ne contient que des instructions qui terminent.
Grâce à la correction de Construit, on part d’un tas. On appelle L la longueur
du tableau initial. Un invariant de boucle est « les éléments entre L − i + 1 et L
sont les éléments les plus grands du tableau initial et sont rangés dans l’ordre
croissant ». En effet, à l’étape i on place l’élément maximal du tas (qui contient
les L − i + 1 plus petits éléments du tableau) en position L − i + 1, par invariant
de boucle, il est plus petit que les éléments entre L − (i − 1) + 1 et L, donc à la fin
de l’étape i, l’invariant de boucle est vérifié. Ainsi, à l’étape L, le tableau contient
les L plus grands éléments (autrement dit tous les éléments) rangés dans l’ordre
croissant, donc l’algorithme du tri par tas est correct.
La complexité du tri par tas est en O(n) + n × O(ln n) = O(n ln n).
Commentaires.
© On dit qu’un arbre dont tous les niveaux sont remplis est complet. On dit qu’un
arbre dont tous les niveaux sont remplis sauf le dernier niveau qui est alors tassé
vers la gauche est un arbre quasi-complet.
© On parle en réalité ici de tas-max, on pourrait définir le tas-min si la relation
d’ordre était « inférieur ou égal », mais ici, on ne considèrera que des tas-max
pour faciliter l’échange durant l’algorithme du tri par tas afin d’avoir un ordre
croissant sur les éléments. En considérant des tas-min, on obtiendrait un ordre
décroissant (à quelques modifications près des algorithmes).
638
Algorithmique
© Cet algorithme atteint la borne optimale de complexité pour les tris par compa-
raison, qui est O(n ln n). Cependant, en pratique, on préfère utiliser le tri rapide
qui est en moyenne moins coûteux, voir Développement 102. En effet, la constante
devant le n ln n du tri rapide est plus petite que celle du tri par tas.
© On peut voir l’algorithme Construit comme un algorithme utilisant la pro-
grammation dynamique puisqu’on commence par avoir des tas de taille 1 (les
feuilles) et ensuite à partir d’eux on construit des tas de plus en plus grand.
Cependant, l’apparition très courte de programmation dynamique ne justifie pas
le placement de ce développement dans la leçon sur les schémas algorithmiques.
© Ce tri possède l’avantage d’être un tri en place, il demande une quantité de
mémoire supplémentaire indépendante de la taille du tableau initial.
© Ce n’est pas un tri stable, c’est-à-dire que ce tri peut modifier l’ordre d’éléments
qui ont la même valeur.
© La structure de tas permet de faire des files de priorités, ce qui est utilisé dans
les algorithmes de Prim et Dijkstra par exemple.
Questions.
1. Écrire formellement les récurrences des questions a)(ii) et c)(ii).
+∞ k
X 1
2. Montrer que k = 2.
k=1
2
3. Montrer que la hauteur d’un arbre quasi-complet de taille n est bln2 nc.
4. Donner d’autres algorithmes de tri dont la complexité est en O(n ln n).
5. Montrer que tout tri par comparaison requiert Ω(n ln n) comparaisons.
6. Donner des algorithmes de tri non basé sur la comparaison en O(n).
7. En considérant (J5, 7, 4, 4, 6, 2K, 6), montrer que le tri par tas n’est pas stable.
639
104. Distance de Kendall et tri par insertion
ti tj tj ti
ti tj tj ti
Correction.
a) Soit T 0 le tableau obtenu à partir de T en insérant l’élément ti à la position j
et S 0 une PLSC de T 0 .
Si S 0 ne contient pas ti , alors S 0 est aussi une sous-séquence croissante de T , donc
par maximalité on a |S 0 | 6 |S|. Si S 0 contient ti , alors S 0 \ {ti } est aussi une
sous-séquence croissante de T , et |S 0 | − 1 6 |S|.
Ainsi, la longueur des PLSC augmente d’au plus un à chaque insertion. Initialement,
la longueur d’une PLSC de T vaut |S|. Celle d’un tableau trié est n, il faut donc
d’utiliser au moins n − |S| insertions pour obtenir un tableau trié.
b) Pour trier T , on parcourt les éléments de T \ S, et on les insère à leur place
dans S, en mettant S à jour de sorte qu’après chaque insertion, S soit une PLSC
de T . L’algorithme est le suivant :
640
Algorithmique
13 renvoyer T
641
104. Distance de Kendall et tri par insertion
c) Tout préfixe d’une PLSC de T est une PLSC d’un sous-tableau préfixe de T .
Cette propriété de « sous-structure optimale » conduit à considérer un algorithme
de programmation dynamique. Pour i ∈ J0, n − 1K, on note Mi la longueur d’une
sous-séquence croissante de T maximale parmi celles finissant sur ti . Comme toute
telle sous-séquence est construite en ajoutant ti à une sous-séquence finissant
sur tk avec k < i et tk < ti (pour un certain k), on peut établir la relation de
récurrence suivante :
Algorithme 8 : PLSC(T ).
Entrée : un tableau T .
Sortie : une PLSC de T .
1 M0 ← 1
2 P0 ← 0
3 pour i = 1 à n − 1 faire
4 Mi ← 1
5 Pi ← i
6 pour k = 0 à i − 1 faire
7 si tk < ti et Mi < 1 + Mk alors
8 Mi ← 1 + Mk
9 Pi ← k
Pour tout i ∈ J0, n − 1K, Pi contient l’indice du prédécesseur de ti dans une PLSC
de T finissant sur ti si cette PLSC n’est pas [ti ], et Pi = i sinon. Ce tableau
auxiliaire permet de reconstruire la PLSC finale sous la forme de la liste S. En
prenant l’exemple du tableau T = J4, 2, 7, 6, 3, 5K, on a P = J0, 1, 0, 0, 1, 4K et
la PLSC est S = [2, 3, 5].
Commentaires.
© L’opération d’insertion est celle utilisée dans les tris par sélection et par insertion.
Ce développement montre que n − s insertions sont nécessaires pour trier un
tableau de taille n dont la PLSC est de taille s. Ceci confirme l’observation selon
laquelle le tri par insertion est très efficace lorsque le tableau est presque trié. En
642
Algorithmique
effet, dans ce cas, s est proche de n, il y a donc peu d’insertions à effectuer. Ceci
explique pourquoi certains algorithmes de tri utilisés en pratique utilisent une
combinaison de deux tris : tout d’abord un premier tri qu’on utilise jusqu’à ce
que le tableau soit « presque trié », puis on applique un tri par insertion.
© Attention à l’acronyme PLSC, qui désigne parfois aussi la plus longue sous-
séquence commune à deux tableaux ou chaînes de caractères (voir question 3).
© Le titre de ce développement est issu de la notion de « distance de Kendall »,
qui compte le nombre de couples d’éléments mal ordonnés relativement à l’un et à
l’autre dans une permutation. En particulier, la distance de Kendall d’un tableau
à sa version triée correspond au nombre d’opérations à effectuer lors d’un tri à
bulles. On peut donc voir ce développement comme un analogue de cette notion
pour le tri par insertion.
© Dans la question b), on peut utiliser la croissance du tableau S pour déter-
miner le plus petit indice j tel que ti < sj plus efficacement, via une recherche
dichotomique. Cependant, ce n’est pas utile car il faut pouvoir ensuite insérer ti
à la bonne place dans S, ce qui coûte une opération d’insertion (ou a un coût
linéaire en nombre d’opérations si on ne souhaite pas comptabiliser les insertions
ayant lieu dans S).
© L’algorithme présenté en question c) n’est pas l’algorithme de complexité
optimale pour résoudre le problème PLSC. En considérant une autre quantité, on
peut en fait obtenir une complexité en O(n ln(n)) (voir question 2 ci-après).
Questions.
1. Adapter les algorithmes ci-avant dans le cas où les éléments de T ne sont plus
supposés deux à deux distincts.
2. Donner un algorithme de programmation dynamique calculant pour chaque
entier i ∈ J0, n − 1K un tableau M où Mj est tel que tMj soit la plus petite valeur
possible pour le dernier élément d’une sous-séquence croissante à j éléments dans
le tableau Jt0 , . . . , ti K.
En déduire un algorithme en O(n ln(n)) pour le calcul d’une PLSC.
3. Donner un algorithme calculant une plus longue sous-séquence commune à
deux tableaux.
4. Étant donnés deux tableaux, écrire un algorithme calculant une séquence de
longueur minimale dont chaque tableau est une sous-séquence.
Indication : on pourra dans un premier temps calculer la plus longue sous-séquence
commune des deux tableaux, puis y insérer les caractères manquants.
643
105. Tirage aléatoire de population
(i) Soit U une variable aléatoire uniforme sur [0, 1], et K le plus grand entier
de J0, n − 1K tel que qK < U . Montrer que eK suit la loi L.
(ii) En déduire un algorithme en temps O(ln n) pour réaliser un tirage
de X1 à partir du tableau des qi . En itérant s fois cet algorithme pour
réaliser (X1 , . . . , Xs ), quelle est la complexité obtenue ?
(iii) Lorsque s < n, proposer une amélioration permettant d’obtenir une
complexité en O(n + s ln s).
b) Soit F la fonction de répartition d’une variable aléatoire Y à support
sur [0, 1] telle que F |[0,1] est continue et strictement croissante. Montrer que
si U est une v.a. uniforme sur [0, 1], alors F |−1 [0,1] (U ) suit la loi de Y .
Soient Y1 , . . . , Ys des v.a. i.i.d. uniformes sur [0, 1], et (X1 , . . . , Xs ) le s-uplet
obtenu en triant (Y1 , . . . , Ys ).
c) (i) Déterminer la fonction de répartition de min(Y1 , . . . , Ys ).
(ii) Montrer que pour tout i ∈ J2, sK, la loi conditionnelle de Xi sachant Xi−1
est la loi du minimum de s − i + 1 v.a. i.i.d. uniformes sur [Xi−1 , 1].
(iii) En déduire un algorithme en O(s) permettant de simuler (X1 , . . . , Xs ).
(iv) En déduire une amélioration de l’algorithme de la question a) en
temps O(n + s).
644
Algorithmique
Correction.
a) (i) Soit i ∈ J0, n − 1K. On a
Comme T contient des réels de [0, 1], la boucle interne s’arrête dès que q > 1,
autrement dit quand j > n. Ainsi, lors de l’exécution de l’algorithme, la variable j
est majorée par n, ainsi la boucle interne n’effectuera que O(n) opérations au total.
Les deux boucles ont donc une complexité totale en O(n + s), et le pré-traitement
645
105. Tirage aléatoire de population
Comme Y est à support sur [0, 1], la fonction F est nulle sur R− et égale à 1
sur l’intervalle [1, +∞[, ce qui assure que l’égalité précédente reste valide pour
tout x ∈ R \ [0, 1]. Ainsi, la variable F −1 (U ) admet donc F comme fonction de
répartition.
c) (i) Soit x ∈ [0, 1] et Z = min(Y1 , . . . , Ys ). Comme les Yi sont i.i.d., on a
s
Y
P(Z > x) = P(Yi > x) = P(Y1 > x)s = (1 − x)s .
i=1
En particulier, la loi de Zj est uniforme sur [x, 1]. On peut vérifier de même
que les v.a. Zi , . . . , Zs sont indépendantes puisque Y1 , . . . , Ys le sont. Ainsi, la loi
conditionnelle de Xi sachant Xi−1 est bien fournie par le minimum de s − i + 1
variables aléatoires i.i.d. uniformes sur [Xi−1 , 1].
(iii) D’après la question précédente, il suffit de tirer successivement X1 , . . . , Xs
où, pour tout i ∈ J1, sK, la loi de Xi est celle de min(Zi , . . . , Zs ), où chaque Zj
suit une loi uniforme sur [Xi−1 , 1] (avec par convention X0 = 0).
• Pour i = 1, d’après la question b), il suffit de tirer u uniformément sur [0, 1],
1
et de choisir X1 = F −1 (u) = 1 − (1 − u) s où F est la fonction de répartition
définie en c)(i).
• Pour i > 1, supposons que x soit une réalisation de Xi−1 . On veut alors tirer
un réel selon la loi de min(Zi , . . . , Zs ) où chaque Zj est uniforme sur [x, 1],
,...,Zs )−x
ce qui est équivalent à tirer selon la loi de min(Zi1−x où chaque Zj est
uniforme sur [0, 1]. De manière similaire au cas i = 1, il suffit alors de tirer
s−i+1 −x
un réel u uniformément sur [0, 1], et de définir Xi = 1−(1−u) 1−x .
646
Algorithmique
(iv) Au lieu de tirer s réels uniformément sur [0, 1], puis de trier leur tableau
(ce qui coûte O(s ln s)), on peut tirer directement un tableau trié de taille s réels.
Il suffit alors d’appliquer l’algorithme de la question a)(iii), en changeant le
pré-traitement.
Algorithme 10 : Échantillonage en O(n + s).
Entrée : l’ensemble E et les probabilités (pi )i∈J0,n−1K représentés sous
forme de tableau, et un entier s.
Sortie : un échantillon R de taille s.
1 R←∅
2 j←0
3 x←0 /* x représente le dernier Xi réalisé */
q←0 /* q va contenir j−1
P
4 k=0 pk */
5 pour i = 1, . . . , s faire
6 Tirer un réel u uniformément sur [0, 1]
s−i+1
−x
7 x ← 1−(1−u)
1−x
8 tant que q < x faire
9 q ← q + pj
10 j ←j+1
11 R ← R ∪ {ej−1 }
12 renvoyer R
Comme précédemment, la boucle interne n’effectue au total que O(n) opérations
pendant toute l’exécution de l’algorithme. La complexité de cet algorithme est
dictée par le nombre d’opérations utilisées par la boucle externe, i.e. O(s + n).
Commentaires.
© Les algorithmes présentés ici permettent de tirer aléatoirement des échantillons
d’une population, avec des probabilités fixées. On peut aussi s’en servir pour
simuler s variables i.i.d. selon une loi L à support fini. Certaines de ces lois
admettent des caractérisations permettant de les simuler facilement (par exemple,
on peut simuler une variable de loi binomiale en sommant un nombre adapté de
variables de Bernoulli). Lorsqu’on ne connaît pas de telles caractérisations (par
exemple quand la distribution est obtenue de manière empirique), les algorithmes
présentés ici sont très utiles car ils ne reposent que sur la connaissance de la
distribution des probabilités.
© Dans certains cas, on peut se passer de l’hypothèse que la loi L est à support
fini. C’est traditionnellement la méthode utilisée pour simuler une loi de Poisson.
Si x est un réel choisi uniformément sur [0, 1], on peut calculer le plus grand
entier k tel que p1 + · · · + pk < x en parcourant les entiers dans l’ordre croissant
(ce processus termine pour chaque x). Lorsqu’on veut simuler un échantillon de s
éléments, il est souhaitable de précalculer les pk . Le problème est alors qu’on
ne sait pas a priori jusqu’où les calculer. Une solution consiste à tronquer la
distribution de probabilités à partir d’un entier k assez grand (c’est-à-dire tel que
647
105. Tirage aléatoire de population
648
Algorithmique
© La méthode de rejet est un autre outil de simulation, très pratique pour des
variables à densité. Soit Z une variable de densité f , et g une fonction de densité
telle que fg soit bornée par une constante M . On tire alors indépendamment Y de
densité g et U uniforme sur [0, M ]. Si f (Y ) 6 U g(Y ), on renvoie la valeur de Y ,
sinon on réitère le processus. Ce procédé termine presque sûrement (le nombre
1
d’itérations suit une loi géométrique de paramètre M ), et fournit une simulation
de Z.
En pratique, on utilise cette méthode lorsque la densité f est proche (au sens
où M est proche de 1, ce qui assure que le nombre moyen d’itérations du processus
est faible) d’une densité g facilement simulable.
© Soit Z une v.a. réelle de densité f à support compact K, et notons M un
majorant de f . Alors la méthode de rejet permet de simuler Z, en tirant Y
uniformément sur K, et U uniformément sur [0, M ] jusqu’à ce que U < f (Y ).
Intuitivement, on tire uniformément des points dans le rectangle K × [0, M ]
jusqu’à tomber sous le graphe de f . Cette idée se généralise lorsque f n’est plus à
support compact, en « tronquant » le support de f , c’est-à-dire en choisissant un
compact K tel que l’intégrale de f en dehors de K est petite.
Un autre exemple classique vise à tirer des points uniformément dans le disque
unité. Il suffit alors de tirer X, Y uniformes sur [0, 1] et indépendantes jusqu’à ce
que X 2 + Y 2 6 1.
© On peut aussi voir les arguments utilisés dans la question c)(ii) comme une
application de la méthode de rejet : on a Xi = min{Yj : Yj > Xi−1 }, ainsi, Xi est
le minimum de s − i + 1 v.a. obtenues en rejetant tous les Yj supérieurs à Xi−1 .
Aussi, lorsqu’on conditionne par rapport à Xi−1 , c’est-à-dire qu’on fixe sa valeur,
il reste s − i + 1 v.a. uniformes sur [Xi−1 , 1].
Questions.
1. Calculer la densité de min(Y1 , . . . , Ys ) où Y1 , . . . , Ys sont des v.a. i.i.d. uniformes
sur [0, 1].
2. Supposons qu’on tire successivement X1 , . . . , Xs dans l’ordre croissant. Soient i
et j deux entiers tels que Xj < qi < Xj+1 . Montrer que le nombre de Xi
contenus dans l’intervalle [qi , qi+1 ] suit une loi binomiale de paramètres (s −
pi
j, 1−q i
). En déduire un algorithme de tirage d’une population en temps O(n + s)
nécessitant O(n) tirages aléatoires d’une loi binomiale.
3. Calculer l’espérance d’une variable aléatoire de loi β(a, b).
4. Expliquer comment simuler une loi uniforme sur [a, b] à partir d’une loi uniforme
sur [0, 1].
5. Donner un algorithme simulant une loi binomiale de paramètre (n, p) (resp.
géométrique de paramètre p) à partir de variables de Bernoulli.
6. Comment simuler une loi uniforme sur [0, 1] à partir de variables de Bernoulli ?
7. Si X suit une loi de Poisson de paramètre λ > 0, donner une relation de
récurrence sur la suite (P(X = k))k∈N . Modifier ensuite l’Algorithme 9 pour
simuler X.
649
105. Tirage aléatoire de population
8. Soit λ ∈ R∗+ . Soit (Xn )n∈N une suite de v.a. indépendantes, où chaque Xn suit
une loi binomiale de paramètre (n, nλ ). Montrer que Xn converge en loi vers une
v.a. suivant la loi de Poisson de paramètre λ. En déduire un autre algorithme
permettant de simuler une loi de Poisson.
9. Montrer que le résultat de la question b) se généralise lorsque F est la fonction
de répartition d’une variable aléatoire réelle.
Indication : justifier que l’inverse généralisé G de F est bien défini puis montrer
l’égalité des évènements {ω 6 F (x)} et {G(ω) 6 x} par double inclusion.
10. En utilisant le théorème de la réciproque, comment simuler une loi de Cauchy ?
Une loi exponentielle ?
11. Soit R, T deux v.a. indépendantes telle que R suit la loi exponentielle de
paramètre 12 et T est uniforme sur [0, 2π]. Déterminer la densité du couple
√ √
(X, Y ) = R cos(T ), R sin(T )
650
Algorithmique
651
106. Transformée de Fourier rapide
Correction.
a) Pour calculer la somme de deux polynômes de Cn−1 [X] mis sous forme inter-
polée T = Jt0 , . . . , tn−1 K et T 0 = Jt00 , . . . , t0n−1 K, il suffit de construire un tableau
de taille n dont le k-ième coefficient est tk + t0k , ce qui se fait en temps O(n).
Pour le produit, il s’agit cette fois de construire un tableau de taille 2n dont
le k-ième coefficient est i+j=k ti t0j . Chacune de ces sommes se calcule en temps
P
ϕ : Cn−1 [X] −→ Cn
P 7−→ (P (x0 ), . . . , P (xn−1 ))
est linéaire entre deux espaces vectoriels de même dimension n. Elle est de plus
injective. En effet, si P ∈ Ker (ϕ), alors P est un polynôme de degré au plus n − 1
ayant n racines distinctes, d’où P = 0.
Ainsi, l’application ϕ est un isomorphisme dès que x0 , . . . , xn−1 sont deux à deux
distincts, ce qui assure que les deux représentations sont bien isomorphes.
Pour passer de la forme interpolée à la forme évaluée, il suffit d’évaluer le poly-
nôme P en chacun des xi . Chaque évaluation peut se faire en temps O(n) via
l’algorithme de Horner, d’où un coût total O(n2 ).
Pour l’opération inverse, on peut remarquer que les coefficients de P peuvent être
obtenus en multipliant le vecteur colonne t (P (x0 ), . . . , P (xn−1 )) par la matrice
de ϕ−1 dans la base canonique. Cette matrice est l’inverse de celle de ϕ (qui est une
matrice de Vandermonde). On peut calculer cet inverse en temps O(n3 ) à l’aide
d’un pivot de Gauss. Le passage de la forme évaluée à interpolée se ramène alors
à effectuer le produit d’une matrice par un vecteur en O(n2 ), soit une complexité
totale de O(n3 ).
c) (i) Posons P0 (resp. P1 ) le polynôme de degré au plus n/2 − 1 tel que le
coefficient de X i dans P0 (resp. P1 ) soit le coefficient de X 2i (resp. X 2i+1 ) dans P .
Autrement dit, P = P0 (X 2 ) + XP1 (X 2 ).
Alors, pour évaluer P sur 1, . . . , ω n−1 , on commence par évaluer P0 qet P1 aux
n
points 1, ω 2 , . . . , (ω 2 ) 2 −1 . On remarque alors que pour tout entier k ∈ 0, n2 − 1 ,
y
n
on a ω k+ 2 = −ω k , d’où :
P ω k = P0 ω 2k + ω k P1 ω 2k ,
n
P ω k+ 2 = P0 ω 2k − ω k P1 ω 2k .
652
Algorithmique
d) (i) On pose xk = ω k pour tout k ∈ J0, n − 1K. Par choix de ω, les xk sont
deux à deux distincts. Ainsi, l’application ϕ définie en question b) est alors un
isomorphisme entre Cn−1 [X] et Cn . On choisit alors Mω comme la matrice de ϕ
entre les bases canoniques de ces deux espaces, qui est bien inversible et vérifie
l’égalité recherchée.
(ii) On peut remarquer que Mω est une matrice de Vandermonde dont le coef-
ficient en position (j, k) est xk−1
j−1 = ω
(j−1)(k−1) . Calculons alors le coefficient en
Il s’agit de la somme des termes d’une suite géométrique de raison ω j−k . Ainsi,
n(j−k) −1
cette somme vaut n si j = k, et ωω(j−k) −1 = 0 sinon.
Ainsi, Mω Mω−1 = nIn d’où Mω−1 = n1 Mω−1 . On peut donc réutiliser l’algorithme
Eval pour passer de la seconde représentation à la première, en remplaçant ω par
son inverse, et en divisant par n. On obtient ainsi l’Algorithme Interpol ci-après.
Comme Eval fonctionne en temps O(n ln n), Interpol fonctionne avec une com-
plexité en O(n ln n) + O(n) = O(n ln n).
e) La multiplication de deux polynômes P et Q donnés sous forme évaluée S, S 0 se
fait en temps linéaire : il suffit de construire le tableau (sk s0k )k∈J0,n−1K . Cependant,
on a deg(P Q) = deg(P ) + deg(Q) 6 2n − 2 et cette inégalité est atteinte. La
donnée de seulement n valeurs évaluées de P Q ne suffit donc pas à interpoler P Q.
On doit donc évaluer P et Q en plus de points, ce qui conduit à l’Algorithme
Mult, où ω est une racine 2n-ième de l’unité, ce qui permet d’obtenir des tableaux
de taille 2n.
653
106. Transformée de Fourier rapide
Commentaires.
© Le cœur de ce développement est résumé dans la figure suivante. Il est recom-
mandé de faire ce dessin dès le début du développement : ceci permet de donner
les lignes directrices de la suite de l’exposé.
× en O(n2 )
ti t0j
X
P = (tk )k , Q = (t0k )k PQ =
i+j=k k
en O(n ln n)
interpolation
évaluation
en O(n ln n)
× en O(n)
(P (xk ))k , (Q(xk ))k (P Q(xk ))k
654
Algorithmique
Figure 3.1 – La suite (en gris de plus en plus foncé) des polynômes
interpolateurs s’éloigne de la fonction à approcher (en noir).
655
106. Transformée de Fourier rapide
à réécrire
n
X
P (x) = p k xk en (· · · ((pn x + pn−1 )x + pn−2 )x + · · · + p1 )x + p0 .
k=0
656
Algorithmique
Questions.
1. Expliciter la réciproque de l’application ϕ définie en question b).
2. Calculer la somme et le produit des racines n-ièmes de l’unité.
3. Soit Φn le n-ième polynôme cyclotomique, c’est-à-dire le produit des (X − ζ)
où ζ parcourt l’ensemble des racines primitives n-ièmes de l’unité. Montrer que
Y
Xn − 1 = Φd
d|n
et en déduire que le produit des racines primitives n-ièmes de l’unité est 1 ou −1.
4. Calculer le degré dn de Φn , et montrer que Φn est un polynôme réciproque,
c’est-à-dire que pour tout i ∈ J0, dn K, les coefficients de X i et de X dn −i dans Φn
sont égaux.
5. À l’aide de la formule d’inversion de Möbius, déterminer une expression de Φn
comme un quotient de produits de polynômes de la forme X d − 1. En déduire que
Φn est à coefficients entiers.
6. Justifier qu’on peut supposer que n est une puissance de 2 sans affecter la
complexité de l’algorithme.
7. Soit A un anneau et a1 , . . . , an des éléments de A. Calculer le déterminant et
l’inverse (lorsqu’il existe) de la matrice de Vandermonde (aji )i,j∈J1,nK .
657
107. B-arbres
J M
ABD K ST W
658
Algorithmique
Correction.
Pour tous les algorithmes, on considère les hypothèses suivantes :
• La racine du B-arbre se trouve toujours en mémoire principale : on pourra
l’appeler directement par T.racine ; cependant, il faudra effectuer une opé-
ration Écrire lors de sa modification.
• Tout nœud passé en paramètre sera déjà en mémoire principale, l’appel à
l’opération Lire aura été fait.
a) La recherche dans un B-arbre est analogue à la recherche dans un arbre de
recherche classique pour lequel ces nœuds contiennent des intervalles de clés. On
commence alors à chercher dans quel intervalle on se trouve, puis on descend dans
l’arbre.
Algorithme 14 : Recherche(x,c).
Entrée : un nœud x et la clé c à chercher.
Sortie : le nœud y et la place de c dans le nœud y si c est dans l’arbre, Nil
sinon.
1 i←1 /* recherche de l’intervalle dans lequel se trouve c */
2 tant que i 6 x.n et c > x.clei faire
3 i←i+1
4 si i 6 x.n et c = x.clei alors /* c trouvée dans le nœud x */
5 renvoyer (x, i)
6 si x.f euille alors /* absence de c dans l’arbre */
7 renvoyer Nil
8 Lire(x.f ilsi−1 )
9 renvoyer Recherche(x.f ilsi−1 , c)
b) Par définition d’un B-arbre, la racine a au moins une clé et les autres nœuds
ont au moins t − 1 clés. Ainsi, T possède au moins 2 nœuds à la profondeur 1,
2t nœuds à la profondeur 2, etc. Par récurrence, on montre que T possède au
moins 2ti−1 nœuds à la profondeur i. On en déduit que
h
!
X
i−1 th − 1
n > 1 + (t − 1) 2t = 1 + 2(t − 1) = 2th − 1.
i=1
t−1
659
107. B-arbres
n+1 n+1
On trouve alors th 6 , puis h 6 lnt .
2 2
On fait un seul Lire dans l’algorithme et l’appel récursif se fait sur un arbre de
hauteur strictement plus petite. La complexité de l’algorithme Recherche est
donc en O(h) où h est la hauteur de l’arbre. Ainsi, on peut borner la complexité
par O(ln n).
c) Dans un arbre binaire de recherche, on ajoute une feuille au bon endroit pour
préserver la structure d’arbre binaire de recherche. Cependant, pour les B-arbres,
on ne peut pas juste ajouter une nouvelle feuille, puisque les feuilles doivent être
toutes à la même profondeur. On est alors obligé d’insérer l’élément dans un nœud
déjà existant.
Pour ajouter une clé x dans un B-arbre, on essaye de l’insérer au bon endroit
dans une des feuilles f de l’arbre. Si f contient déjà un tableau de 2t − 1 clés, on
sépare f en deux feuilles contenant les t − 1 plus petites (resp. grandes) clés du
tableau, et on insère la clé médiane au bon endroit dans le père de f . On peut
alors ajouter notre élément x dans l’une des deux feuilles que l’on a créée. On
réitère le processus tant qu’on essaye d’insérer un élément dans un nœud déjà
plein.
Si on remonte l’arbre jusqu’à la racine sans trouver de nœud non plein, on va
alors séparer la racine en deux et créer un nœud constitué uniquement de la clé
médiane qui sera la nouvelle racine de l’arbre et qui aura pour fils les deux moitiés
du nœud initial. La hauteur de l’arbre va alors augmenter de 1.
On représente cela ci-après sur un exemple.
J M Partage BJ M
ABDE K ST W A DE K ST W
Insertion de E dans l’arbre de l’énoncé.
BJ M Partage BJ M T
A DE K ST U W A DE K S U W
J
Partage
de la racine
B M T
A DE K S U W
Insertion de U dans l’arbre précédent.
660
Algorithmique
Il nous faudra au pire deux passages dans l’arbre : un pour trouver l’emplacement
de la nouvelle clé et un pour remonter un potentiel élément quand les nœuds sont
pleins. Pour éviter de faire deux passages, on peut, pendant la descente (recherche
de l’emplacement) séparer tous les nœuds qui sont pleins. Ainsi on aura besoin
que d’un seul passage.
Pour implémenter l’insertion, on utilise deux fonctions auxiliaires : Partage qui
sépare un nœud plein et InsertionNonPlein qui insère un élément dans un
sous-arbre dont la racine n’est pas pleine. On commence par écrire la fonction
Partage qui sépare un sous-arbre dont la racine n’est pas pleine.
Algorithme 15 : Partage(x,i).
Entrée : un nœud x non plein et un paramètre i qui indique le fils x.f ilsi
plein à séparer.
1 z ← NœudVide()
2 y ← x.f ilsi
3 z.f euille ← y.f euille
4 z.n ← t − 1
5 pour j = 1 à t − 1 faire /* création des clés de z */
6 z.clej ← y.clej+t
7 si non y.f euille alors
8 pour j = 0 à t − 1 faire /* création des fils de z */
9 z.f ilsj ← y.f ilsj+t+1
10 y.n ← t − 1
11 pour j = x.n décroissant jusqu’à i + 1 faire
12 x.f ilsj+1 ← x.f ilsj /* modification des fils de x */
13 x.f ilsi+1 ← z
14 pour j = x.n décroissant jusqu’à i + 1 faire
15 x.clej+1 ← x.clej /* modification des clés de x */
16 x.clei+1 ← y.clet
17 x.n ← x.n + 1
18 Écrire(x)
19 Écrire(y)
20 Écrire(z)
661
107. B-arbres
18 InsertionNonPlein(x.f ilsi , k)
662
Algorithmique
Commentaires.
© Ce développement est très long surtout si on veut écrire les algorithmes d’inser-
tion (FFF). Cependant, il peut consister en l’écriture de l’algorithme Recherche,
puis la présentation sur un exemple de l’insertion dans un B-arbre, le but étant
de convaincre le jury que l’algorithme d’insertion est compris sans s’embarquer
dans l’écriture formelle de l’algorithme (FF).
© L’opération de suppression est plus complexe que l’insertion. Comme pour
l’insertion, il faut faire attention à préserver les propriétés du B-arbre notamment
le nombre minimal de clés dans un nœud. La suppression est expliquée dans
l’ouvrage [CLRS10].
© On n’a stocké que des clés dans les nœuds, cependant en pratique on stocke
des couples (clé, valeur) et on fait la recherche sur la composante « clé » afin de
pouvoir donner la valeur associée à cette clé.
© En pratique, on utilise des pointeurs pour les x.f ilsi et quand on effectue
l’action Lire, on charge donc qu’un seul nœud en mémoire vive et non tous les
sous-arbres de racines x.f ilsi .
© Les bases de données sont en général très volumineuses et donc stockées sur un
disque externe. Quand on travaille sur une base de données, on ne peut en importer
que quelques fragments dans la mémoire vive, on cherche donc à minimiser le
nombre d’actions sur un disque externe (c’est ce qui prend le plus de temps, avec
un facteur d’un million entre un accès au disque et d’une opération sur processeur).
La structure de données que l’on privilégie est un arbre de recherche. On cherche
alors un arbre avec une ramification importante ce qui nous permet de minimiser
le nombre d’appels au disque puisque la hauteur sera plus petite. En pratique on
stocke une page (unité de transfert avec le disque dur) sur un nœud. Dans ce cas,
on maximise l’impact de chaque accès au disque. De plus, l’ordre de grandeur
de t est choisi en fonction du nombre de tuples que peut contenir une page du
disque. Les opérations Lire et Écrire permettent donc d’importer et d’exporter
des pages sur le disque externe.
© Pour la complexité totale processeur, l’algorithme Partage est en O(t) à cause
des deux boucles pour et les autres algorithmes sont en O(th) = O(t ln n). Pour
l’algorithme Recherche, comme n < 2t, les boucles tant que s’effectuent en O(t),
ce qui donne le temps processeur total en O(th) = O(t ln n).
© Pour implémenter la structure de dictionnaire, les formalismes arborescents
sont nombreux. Ils permettent généralement d’obtenir des complexités linéaires en
leur hauteur. Ainsi, on utilise souvent des arbres satisfaisant certaines propriétés
d’équilibrage, ce qui permet d’obtenir une hauteur logarithmique en le nombre
de clés présentes dans le dictionnaire. Une des implémentations la plus naturelle
est celle d’arbre de recherche équilibré (AVL), pour laquelle on a recours à des
opérations de « rotation » lorsqu’on insère ou supprime un élément afin de préserver
l’équilibrage. Ce type de structures a ensuite été raffiné : on peut par exemple
citer les arbres rouge/noir, ou les arbres 2 − 3 − 4 qui leurs sont équivalents.
© L’inconvénient de l’algorithme Insertion est le fait que l’on partage parfois
inutilement des nœuds lors de la descente, cependant ce n’est pas grave en
663
107. B-arbres
complexité amortie (i.e. parce qu’on aurait dû les partager quand même si on
avait considéré une séquence assez longue d’insertions).
Questions.
1. Donner les algorithmes de recherche, d’insertion et de suppression pour un
arbre binaire de recherche.
2. Sur l’exemple de l’énoncé, supprimer l’élément J du B-arbre en préservant sa
structure.
3. Implémenter la structure de B-arbre, ainsi que les différents algorithmes qui
s’y rapportent.
664
Modèles de calcul
(0, 0, →) (0, 0, ←)
(1, 1, →) (1, 0, ←) (1, 1, ←)
(#, #, ←) (0, 1, ←)
q0 q1 q2
(#, 1, ←)
Définition 4 (Configuration)
Soit M = (Q, Σ, q0 , F, δ) une machine de Turing. On appelle configuration
de M tout triplet (q, u, v) où q ∈ Q est u, v ∈ Σ∗ .
Pour alléger les notations, on notera uqv la configuration (q, u, v). La configuration
uqv représente l’état courant de la machine M : sur le ruban figure le mot
infini · · · #uv# · · · , la tête de lecture est positionnée sur la première lettre de v#
et la machine se trouve dans l’état q (voir Figure 3.3).
Pour décrire formellement le fonctionnement d’une machine de Turing, on définit
comment passer d’une configuration à une autre. Chaque transition (q, a, q 0 , a0 , d)
modélise l’opération élémentaire suivante : si on se trouve dans l’état q et on lit le
caractère a sur le ruban, on entre dans l’état q 0 , on écrit a0 à la place de a, puis
on se déplace d’une case dans la direction indiquée par d.
666
Modèles de calcul
··· # a b c a b # ···
··· # a b c a b # ···
u1 v1
q0 q0
u2 v2 u2 v2
667
Définition 7 (Fonction calculable)
Une fonction partielle f : Σ∗ → Σ∗ est Turing-calculable s’il existe une machine
de Turing M dont l’alphabet contient Σ qui calcule f , c’est-à-dire que pour
tout w ∈ Σ∗ :
• si f (w) est défini, toutes les exécutions de M sur w sont finies et se terminent
dans une configuration uqv avec uv = f (w).
• si f (w) n’est pas défini, toutes les exécutions de M sur w sont infinies.
668
Modèles de calcul
{hw, f (w)i : w ∈ Σ∗ }
669
Complexité
Le formalisme mécanique des machines de Turing permet d’étudier plus finement
comment les calculs se déroulent. En particulier, on peut facilement quantifier
les ressources nécessaires pour effectuer un calcul : on s’intéresse généralement
au nombre de pas de calculs et du nombre de cases utilisées sur le ruban. On
peut alors classifier les problèmes selon leur complexité, c’est-à-dire la quantité
de ressources nécessaires pour les résoudre. Cette analyse n’a de sens que pour
les problèmes décidables, c’est pourquoi les machines de Turing considérées dans
cette section n’ont que des calculs finis.
Définition 12 (Complexité temporelle)
Soit C0 → · · · → Ck un calcul d’une machine de Turing M sur un mot w.
• L’entier k est appelé la longueur du calcul C0 → · · · → Ck .
• Le temps de calcul tM (w) de M sur w est le maximum des longueurs des
calculs de M sur w.
• La complexité temporelle de M est la fonction tM : N → N définie par
Ces deux complexités sont reliées par les inégalités suivantes : pour toute machine
de Turing M , il existe une constante K > 0 telle que
En effet, la première inégalité provient du fait qu’il faut au moins tM (n) pas de
calcul pour pouvoir remplir sM (n) cases, et que le mot d’entrée occupe déjà n
cases dans la configuration initiale de tout calcul de M . La deuxième inégalité est
une conséquence du principe des tiroirs : le nombre de configurations de taille au
plus sM (n) est borné par 2KsM (n) pour un certain entier K. Si tM (n) excède ce
nombre, il existe un calcul passant deux fois par la même configuration, ce qui
permet de construire un calcul infini. Ceci contredit le fait que M s’arrête sur
toute entrée.
Généralement, on ne s’intéresse qu’au comportement asymptotique des complexités,
et seulement à une constante multiplicative près. Ce fait est justifié par le théorème
d’accélération présenté ci-après.
670
Modèles de calcul
Théorème 1 (d’accélération)
Soit M une machine de Turing décidant le langage L, et dont la complexité
temporelle vérifie tM (n) = Ω(n). Alors, pour tout entier k ∈ N∗ , il existe une
machine de Turing M 0 qui décide L et telle que tM 0 (n) 6 tMk(n) .
On définit de même les classes Space(f (n)), NSpace(f (n)), PSpace, NPSpace,
ExpSpace et NExpSpace.
Définition 15 (Complémentaire)
Étant donnée une classe X, on note co-X la classe formée des complémentaires
des langages de X.
671
Exemple : les classes PSpace et co-PSpace coïncident.
Toujours dans le cas des classes de complexité spatiale, on peut établir d’autres
égalités entre versions déterministes et non-déterministes grâce au théorème de
Savitch.
Théorème 3 (Savitch)
Soit L un langage décidé par une machine de Turing M telle que sM (n) = Ω(n).
Alors il existe une machine de Turing déterministe M 0 décidant L telle que
sM 0 (n) = O(sM (n)2 ).
NExp co-NExp
Exp, co-Exp
NP co-NP
P, co-P
672
Modèles de calcul
Fonctions de bases
Les fonctions de base des fonctions primitives récursives sont :
• la fonction identiquement nulle d’arité 0
zéro : ∅ −→ N
;
() 7−→ 0
• la fonction successeur d’arité 1
succ : N −→ N
;
x 7−→ x + 1
• les projections d’arité n
πin : Nn −→ N
;
(x1 , . . . , xn ) 7−→ xi
en particulier, π11 est l’identité.
673
Composition
La composition d’une fonction f d’arité p et de p fonctions g1 , . . . , gp d’arité n est
la fonction d’arité n définie par :
comp(f, g1 , . . . , gp ) : Nn −→ N
~x = (x1 , . . . , xn ) 7−→ f (g1 (~x), . . . , gp (~x)).
Récursion primitive
La récursion primitive rec(f, g) d’une fonction f d’arité n et d’une fonction g
d’arité n + 2 est la fonction d’arité n + 1 définie par :
rec(f, g) : Nn × N −→ N
(
f (~x) si k = 0,
(~x, k) 7−→
g(~x, k − 1, rec(f, g)(~x, k − 1)) sinon.
Quelques exemples
• La fonction un : () 7−→ 1 s’écrit
un = succ (zero) .
674
Modèles de calcul
Minimisation bornée
• Si P est un prédicat primitif récursif, on peut définir l’opérateur de minimi-
sation bornée noté (n, ~x) 7−→ µ(i 6 n)P (i, ~x) qui renvoie le plus petit i 6 n
tel que P (i, ~x) est vrai, ou n + 1 si un tel i n’existe pas. On l’écrit alors
n Y
X i
µ(i 6 n)(P (i, ~x)) = (1 − P (~x)).
i=0 k=0
675
Bijection primitive récursive
Les fonctions primitives récursives sont à valeurs dans N. On peut naturellement
étendre la définition en considérant des fonctions à valeurs dans Nk puisqu’on
peut trouver des bijections entre les ensembles Nk et N` (pour tous k, ` ∈ N∗ ) qui
sont primitives récursives et dont les réciproques le sont aussi. Par exemple, pour
avoir une bijection entre N et N2 , on peut définir
ϕ : N −→ N2
k 7−→ (diag(k) − ecart(k), ecart(k))
avec
i(i + 1)
diag(k) = µ(i 6 k + 1) > k − 1,
2
diag(k)(diag(k) + 1)
ecart(k) = k − .
2
14
9 13
5 8 12
2 4 7 11
0 1 3 6 10
di
di
di
di
di
ag
ag
ag
ag
g
=
=
0
Fonctions µ-récursives
Ces fonctions primitives récursives ne suffisent pas à représenter toutes les fonctions
calculables par une machine de Turing. Par exemple, la fonction d’Ackermann
n + 1 si m = 0,
A(m, n) = A(m − 1, 1) si m > 0 et n = 0,
A(m − 1, A(m, n − 1))
si m > 0 et n > 0.
n’est pas primitive récursive. Pour avoir l’équivalence avec les fonctions calculables
par une machine de Turing, on doit considérer l’ensemble des fonctions µ-récursives
(voir Développement 109).
676
Modèles de calcul
3 λ-calcul
Le λ-calcul est un autre formalisme mathématiques pour définir les fonctions
calculables. Les objets centraux sont les λ-termes, qui sont des représentations
syntaxiques modélisant des fonctions dont les arguments sont aussi des fonctions.
Leur sémantique, ainsi que la notion de « calcul » est fournie par l’opération de
β-réduction, qui modélise l’opération d’application d’une fonction à un argument.
Syntaxe
Définition 16 (λ-terme, sous-terme)
Soit un ensemble {x, y, z, . . .} dénombrable de variables. On définit les termes
de λ-calcul (ou λ-termes) par induction :
• les variables sont des termes ;
• si M et N sont des termes, alors (M N ) est un terme ;
• si M est un terme et x une variable, alors (λx.M ) est un terme.
On dit que M et N sont des sous-termes de (M N ) et que M est un sous-terme
de (λx.M )
677
Exemple : les termes I = λx.x, K = λxy.x et S = λxyz.xz(yz) sont clos.
Définition 20 (substitution)
Soient M, N des termes et x une variable. La substitution de x par N dans M ,
notée M [x → N ], est le remplacement de chaque occurrence libre de x dans M
par N en renommant si besoin les variables de M par des variables fraîches
pour que les variables libres de N ne deviennent pas liées dans M [x → N ].
Exemple :
• L’expression (λy.xy)[x → λy.y] ne nécessite pas de renommage, (λy.(λy.y)y)
est alors l’expression obtenue.
• L’expression (λz.xz)[x → λy.zy] nécessite un renommage, (λt.(λy.zy)t) est
alors l’expression obtenue.
Définition 21 (α-conversion)
On définit l’α-conversion comme la plus petite relation d’équivalence ∼α
satisfaisant :
• λx.M ∼α λy. (M [x → y]) pour une variable fraîche y ;
• λx.M ∼α λx.N si M ∼α N ;
• M N ∼α P Q si M ∼α P et N ∼α Q.
Exemples :
• si I = λx.x alors IM →β M ;
• si K = λxy.x alors (KM )N →β (λy.M )N →β M ;
• si S = λxyz.xz(yz) alors SM N P →3β M P (N P ).
678
Modèles de calcul
Théorème 4 (Church-Rosser)
Si P →∗β P1 et P →∗β P2 alors il existe Q tel que P1 →∗β Q et P2 →∗β Q. Cette
propriété est nommée confluence.
Définition 24
On dit que P possède une forme normale s’il existe un terme M sous forme
normale tel que P →∗β M . Par le théorème de Church-Rosser, si P possède une
forme normale alors elle est unique.
Corollaire 1
• Si P ∼β Q et si Q est sous forme normale alors P →∗β Q.
• Si P ∼β Q alors soit ils ont la même forme normale, soit ils n’en ont pas.
Exemples
On va maintenant définir différents termes de λ-calcul. Rappelons que le λ-
calcul définit les mêmes fonctions calculables que les machines de Turing ou les
ordinateurs (on dit que ces modèles ont le même pouvoir d’expression). Il est donc
naturel de trouver des λ-termes ayant le même comportement que les instructions
if then else traditionnelles, ou permettant de manipuler des listes.
• T := λxy.x
• F := λxy.y
• if then else := λbxy.bxy
La terminologie est justifiée par le fait que si X ∼β T , alors
if X then M else N ∼β T M N ∼β M,
679
• πin := λx1 · · · xn .xi (projection)
(
N si n = 0,
On note M nN =
M (M n−1 N ) si n > 0.
Entiers de Church
Plus formellement, les entiers de Church et les opérations usuelles les manipulant
sont définis par :
• J0KC := λsz.z
• JnKC := λsz.sn z
• JsuccKC := λn.(λsz.ns(sz))
La terminologie est justifiée par le fait que
et
680
Modèles de calcul
Entiers de Barendregt
Les entiers de Barendregt sont quant à eux définis par :
• J0KB := I = λx.x
• Jn + 1KB := hF, JnKB i = λx.(xF JnKB )
• JsuccKB := λn.hF, ni
• JpredKB := λn.nF La terminologie est justifiée par le fait que
JpredKB Jn + 1KB ∼α λn.(nF )Jn + 1KB ∼β Jn + 1KB F ∼α λx.(xF JnKB ) F
∼β F F JnKB ∼α (λxy.y)F JnKB ∼β JnKB .
• Jis_zeroKB := λn.nT La terminologie est justifiée par le fait que
Jis_zeroKB J0KB ∼α (λn.nT )J0KB ∼β J0KB T
∼α (λx.x) T ∼β T
et
Jis_zeroKB Jn + 1KB ∼α (λn.nT )Jn + 1KB ∼β Jn + 1KB T
∼α λx.(x F JnKB ) T ∼β T F JnKB ∼β F.
Point fixe
Les opérations décrites précédemment permettent de définir des λ-termes pour
chaque fonction primitive récursive de base. Pour obtenir l’équivalent du schéma
de récursion primitive, on fait appel à des combinateurs de point fixe.
Définition 26 (point fixe)
Un point fixe est un λ-terme Y tel que, pour tout terme G, on a
Y G ∼β G(Y G).
Exemple : le point fixe de Turing est θ = AA avec A = λxf.f (xxf )
En effet, pour tout terme G, on a
θG ∼α AAG
∼α (λxf.f (xxf ))(λxf.f (xxf ))G
→β (λf.f ((λxz.z(xxz))(λxz.z(xxz))f ))G
→β G((λxz.z(xxz))(λxz.z(xxz))G)
∼α G(AAG)
∼α G(θG).
Exemple : le point fixe de Curry est Y = λf.((λx.f (xx))(λx.f (xx)))
En effet, pour tout terme G, on a
Y G →β (λx.G(xx))(λx.G(xx))
→β G((λx.G(xx))(λx.G(xx)))
←β G(Y G).
681
λ-calcul et calculabilité
Définition 27 (λ-définissable)
Soit φ une fonction de Np dans N. La fonction φ est λ-définissable si et seulement
s’il existe un λ-terme G tel que
x ∈ A =⇒ ϕ(x) = 0 et x ∈ B =⇒ ϕ(x) = 1.
682
Modèles de calcul
la première de ces cases qui est la moins visitée au cours de eu . Montrer que
[
∆n : Σn −→ N × δk
k∈N
u 7−→ s(eu ), σ eu , s(eu )
est injective.
c) Soient `n = max{|σ(eu , s(eu ))| : u ∈ Σn } et u ∈ Σn réalisant ce maximum.
Montrer que `n > c n pour tout n > 1, où c > 0 est une constante ne dépendant
que de M . En déduire que |eu | > c n2 .
d) Conclure que tM (n) = Ω(n2 ).
683
108. Complexité du langage des palindromes
Correction.
a) L’idée est de « panacher » les deux exécutions eu et ev pour obtenir une
exécution e acceptant u0v 0 , comme illustré ci-après : on simule eu lorsque la tête
de lecture est à gauche (c’est-à-dire en position i < r sur le ruban), et on simule ev
lorsque la tête de lecture est à droite (en position i > r). Ceci est possible car
σ(eu , r) = σ(ev , r) : les transitions effectuées par M lorsque la tête de lecture se
trouve au milieu (en position r) sont identiques dans les deux exécutions.
r
u 0 u0
eu :
r
v 0 v0
ev :
r
u 0 v0
e:
Figure 3.6 – Panachage (eu est exécuté sur la gauche du ruban et ev sur la
droite).
684
Modèles de calcul
où le maximum porte sur toutes les exécutions e de M sur l’entrée u. D’après c),
tM (3n) = Ω n2 ,
ce qui suffit pour conclure. En effet, considérons la machine M 0 qui, sur l’entrée w,
modifie le ruban pour qu’il y soit à la place inscrit le mot w0 = 0w0 (ce qui se
fait en O(n) opérations), puis simule M sur w0 . Alors M 0 est une machine de
Turing à un ruban acceptant L, donc d’après ce qui précède tM 0 (3n) = Ω(n2 ).
Comme on a l’inégalité tM 0 (n) 6 tM (n + 2) + O(n), on en déduit alors que
tM (3n + 2) = Ω(n2 ). Comme cette borne inférieure vaut donc aussi pour M 0 ,
on a aussi tM 0 (3n − 1) = tM 0 (3(n − 1) + 2) = Ω(n2 ) et on obtient par le même
raisonnement que tM (3n + 1) = Ω(n2 ). En conclusion, on a bien tM (n) = Ω(n2 ).
Commentaires.
© Quoique légèrement technique, ce développement est assez direct et naturel. La
plus grande difficulté est sans doute de savoir le mener avec juste ce qu’il faut de
formalisme pour être à la fois clair et convaincant.
L’heuristique est simple : pour vérifier le palindrome u0u e avec |u| = n, une
machine à un ruban ne peut pas vraiment faire mieux que Ω(n) « allers-retours ».
En effet, comme le montre l’argument-clé en a), la suite des opérations effectuées
lorsque la tête de lecture est à la position n est déterminée par u (sinon la machine
accepterait u0v avec v légèrement différent de u e), et puisqu’il y a |Σ|n mots u
possibles, la case du milieu (en position n) doit donc être visitée Ω(n) fois. Le
reste n’est qu’un petit argument de padding (le « milieu » devenant 0n plutôt
que seulement 0), qui ne change pas significativement la longueur de l’entrée et
permet de montrer que la tête de lecture effectue en fait Ω(n) va-et-vient (de part
et d’autre de ce milieu), et donc Ω(n2 ) transitions au total.
685
108. Complexité du langage des palindromes
Questions.
1. Justifier l’inégalité n3 6 4n , pour tout n ∈ N.
2. Le résultat de ce développement demeure-t-il lorsque |Σ| > 2 ? Et si |Σ| = 1 ?
3. Montrer qu’une machine de Turing M à k > 2 rubans est équivalente à une
machine de Turing M 0 à un seul ruban telle que tM 0 (n) = O(tM (n)2 ).
4. Décrire une machine de Turing à 2 rubans reconnaissant L en temps linéaire.
5. Montrer que L n’est pas un langage rationnel.
6. Donner une grammaire algébrique engendrant L. Proposer une forme normale
(de Chomsky ou de Greibach).
7. Montrer l’implication P = NP =⇒ Exp = NExp.
686
Modèles de calcul
Soit f une fonction calculée par une machine de Turing M , c’est-à-dire telle
que si on exécute la machine lorsque n est écrit en unaire sur son ruban, la
machine termine et f (n) est écrit en unaire sur son ruban. On suppose que M
est déterministe, à ruban bi-infini, qu’elle a exactement un état initial et un
état final et qu’elle boucle sur son état final. On note :
• J0, mK l’ensemble des états de M , où 0 est l’état initial et m l’état final ;
• J0, k − 1K l’alphabet d’écriture, où 0 représente le symbole blanc ;
• δ : J0, mK × J0, k − 1K → J0, mK × J0, k − 1K × {−1, 1} la fonction de
transition.
On représente la configuration
↓
··· 0 0 gj ··· g1 g0 d0 d1 ··· gi 0 0 ···
687
109. Turing-calculable implique µ-récursive
Ce développement démontre que toute machine de Turing peut être simulée par
une fonction µ-récursive. Il illustre donc parfaitement les leçons 912 et 913 qui
étudient respectivement les fonctions µ-récursives et les machines de Turing.
Correction.
a) La fonction δ est primitive récursive car elle s’écrit comme une somme finie
d’indicatrices puisqu’il y a un nombre fini de transitions.
b) On pose la fonction suivante
N →
N3
n−1
init : X
n
7→ 0, 0, kp .
p=0
688
Modèles de calcul
La fonction temps_arret est µ-récursive car elle utilise une minimisation non
bornée d’un prédicat primitif récursif.
e) Il faut écrire une fonction qui permet de retrouver le nombre de chiffres 1 dans
k
le nombre 1 · · · 1 écrit en base k car, à la fin de l’exécution de la machine de
Turing M , f (n) est écrit en unaire sur le ruban, mais notre représentation des
configurations nous donne des entiers en base k. On pose donc la fonction
(
N → N
somme :
p 7→ µ(i 6 p)(k i > p).
La fonction somme est primitive récursive car elle utilise qu’une minimisation
bornée sur des prédicats primitifs récursifs.
On peut maintenant écrire la fonction f sous la forme d’une fonction µ-récursive :
Commentaires.
© Dans la définition des fonctions µ-récursives, on considère des fonctions de N
dans N. Dans ce développement, on se donne des fonctions primitives récursives et
µ-récursives de N dans N3 . On peut faire cela, car il existe des bijections primitives
récursives de réciproque primitive récursive de N dans N2 . Par récurrence, on
montre donc que l’on peut définir les fonctions µ-récursives de Nk dans N` .
© La démonstration originelle utilise la notion de codage de Gödel. Elle requiert
des notations plus complexes, ce qui est évité ici par l’utilisation du codage unaire.
© Il y a une équivalence entre les trois modèles de calcul : machines de Turing,
fonctions µ-récursives et λ-calcul. On prouve ici une des implications de cette
équivalence. Dans le Développement 111 sur les fonctions λ-définissables, on
prouve une autre des implications.
© Il faut bien comprendre que le seul endroit où l’on a nécessairement une fonction
µ-récursive, c’est pour la fonction temps_arret, car on ne peut pas borner le nombre
d’étapes de la machine de Turing a priori.
© Dans la fonction config, il faut bien appliquer la fonction config_suivante à la
fonction config(~x, k − 1) car c’est le schéma de récursion primitive. L’inverse fonc-
tionne algorithmiquement mais n’est pas syntaxiquement licite pour les fonctions
primitives récursives.
689
109. Turing-calculable implique µ-récursive
© Pour montrer que toute fonction µ-récursive est calculable par une machine
de Turing, on procède par induction sur la structure de la fonction µ récursive.
Il suffit donc de montrer que les fonctions de bases sont exprimables par des
machines de Turing et montrer la clôture par composition, récursion primitive et
minimisation non bornée. Il faut donc donner des machines de Turing qui simulent
les algorithmes suivants :
Algorithme 18 : zero(x).
1 renvoyer 0
Algorithme 19 : succ(x).
1 renvoyer x + 1
Algorithme 23 : µi (P )(~n).
1 i←0
2 tant que ¬P (i, ~n) faire
3 i←i+1
4 renvoyer i
Questions.
1. Justifier que l’on peut considérer une machine de Turing qui vérifie les hypo-
thèses de l’énoncé (déterminisme, ruban bi-infini, unaire, unique état initial et
final, boucle sur l’état final).
2. Montrer que toute fonction µ-récursive est calculable par une machine de
Turing en explicitant les machines de Turing.
3. Montrer qu’une indicatrice est primitive récursive.
4. Montrer que les fonctions arithmétiques utilisées dans ce développement sont
primitives récursives.
690
Modèles de calcul
691
110. Caractérisation de RE
L’ensemble RE est l’ensemble des langages acceptés par une machine de Turing. Ce
développement entre donc naturellement dans la leçon 913. La caractérisation que
l’on donne permet de faire le lien entre l’ensemble RE et les fonctions primitives
récursives et µ-récursives, ce qui donne une belle illustration de la leçon 912. Enfin,
dans la leçon 914, on discute des problèmes décidables R et indécidables, or parmi
les problèmes indécidables, on trouve les problèmes qui sont dans RE\R, il est donc
utile de savoir caractériser les problèmes qui sont dans RE.
Correction.
a) Par définition il existe une machine de Turing M qui accepte A. On suppose
que la machine possède un seul état final et qu’elle boucle dessus. On pose le
prédicat :
P (t, x) = « la machine M accepte x en t étapes ».
avec les fonctions définies dans le développement sur l’équivalence entre fonctions
calculables par une machine de Turing et fonctions µ-récursives (voir Développe-
ment 109). La fonction init donne la configuration initiale de la machine, la fonction
config(~x, t) donne la configuration après t étapes en partant de la configuration
~x et l’indicatrice 1F (~x) renvoie Vrai si la configuration ~x est dans un état final
q ∈ F . Comme l’ensemble des états est fini, F est fini. Ainsi 1F est une somme
finie d’indicatrices 1q pour q ∈ F .
692
Modèles de calcul
x ∈ A ⇐⇒ ∃t, P (t, x)
⇐⇒ ∃t, (t, x) ∈ B
⇐⇒ x ∈ π22 (B).
N → N2
ϕ:
k 7→ (tk , xk )
14
9 13
5 8 12
2 4 7 11
0 1 3 6 10
di
di
di
di
di
ag
ag
ag
ag
ag
=
=
0
On a donc
π22 (ϕ(k)) si ϕ(k) ∈ B,
f (k) =
n sinon.
693
110. Caractérisation de RE
Ainsi Im(f ) = {n} ∪ π22 (B) = A. Comme f est primitive récursive, on a le résultat
souhaité.
Algorithme 24 : .
Entrée : un élément x.
1 k ←0
2 tant que f (k) 6= x faire
3 k ←k+1
4 renvoyer Accepter
Cette machine de Turing peut être implémentée (car f est calculable par une
machine de Turing) et accepte exactement les éléments de A car A = Im(f ). Donc
A ∈ RE.
Commentaires.
© Ce développement montre donc l’équivalence entre les quatre propositions
suivantes :
• A ∈ RE ;
• A = π22 (B) pour un ensemble B ⊂ N2 primitif récursif ;
• A = ∅ ou A est l’image d’une fonction primitive récursive ;
• A est l’image d’une fonction µ-récursive.
© Pour bien voir la bijection primitive récursive ϕ, il suffit de compter les éléments
de N2 par diagonales croissantes.
© L’équivalence entre « A = ∅ ou A est l’image d’une fonction primitive récursive »
et « A est l’image d’une fonction µ-récursive » peut paraître surprenante, mais il
faut bien comprendre que ce sont les images des fonctions qui sont égales et non
les fonctions en elles-mêmes.
© On a utilisé les deux sens de l’équivalence entre machine de Turing et fonction
µ-récursive. Un des deux sens est démontré dans le Développement 109 et l’autre
sens y est expliqué en commentaire.
694
Modèles de calcul
Questions.
1. Pourquoi doit-on traiter le cas A = ∅ à part ?
2. Montrer que si f est µ-récursive, alors f est Turing-calculable.
3. Montrer que la fonction ϕ est bijective ainsi que le caractère primitif récursif
de ϕ et de sa réciproque.
4. Montrer que (x, y) 7→ 2x (2y + 1) est aussi une bijection primitive récursive à
réciproque primitive récursive.
5. Donner un problème indécidable qui n’est pas dans RE.
6. En utilisant les notations du Développement 109, montrer l’implication
A = π22 (B) =⇒ A ∈ RE
695
111. µ-récursive implique λ-définissable
avec
F := λxy.y et hM, N i := λx.xM N.
On dit qu’une fonction χ : Np → N est λ-définissable si et seulement s’il existe
un terme X de λ-calcul tel que
Correction.
a) Le terme λx.J0K représente la fonction zero.
Le terme λx.hF, xi représente la fonction succ. En effet, comme Jn + 1K = hF, JnKi,
on a
λx.hF, xiJnK →β hF, JnKi = Jn + 1K.
De plus, on a
λx1 x2 · · · xn .xi t1 · · · tn →β λx2 x3 · · · xn .xi t2 · · · tn
→β λxi · · · xn .xi ti · · · tn
→β λxi+1 · · · xn .ti ti+1 · · · tn
→β λxn .ti tn →β ti ,
ce qui assure que le terme λx1 x2 · · · xn .xi représente la projection πin .
696
Modèles de calcul
Donc
λ~x.X(G1 ~x) · · · (Gp ~x)
représente la composition de f avec les fonctions ψ1 , . . . , ψp .
c) Soient χ une fonction λ-définissable à p arguments représentée par X et ψ
une fonction λ-définissable à p + 2 arguments représentée par G. On va montrer
que la fonction ϕ définie, pour tout ~n ∈ Np et k ∈ N, par le schéma de récursion
primitive suivant
ϕ(~n, 0) = χ(~n),
ϕ(~n, k) = ψ(~n, k, ϕ(~n, k − 1)),
est λ-définissable.
On voudrait trouver un terme M tel que
avec
On va donc avoir besoin d’un combinateur de point fixe θ tel que, pour tout
λ-terme K, on a θ K ∼β K(θ K).
Soit θ un combinateur de point fixe. On pose
697
111. µ-récursive implique λ-définissable
ϕ(~n) ∼β µk (χ(~n, k) = 0)
est λ-définissable.
Il suffit de trouver un terme qui fait un test sur le prédicat χ(~n, k) = 0 et qui
renvoie k si le prédicat est évalué à vrai et sinon teste sur k + 1, etc.
À ~x fixé, on pose P le prédicat λk.(is_zero (X ~x k)) qui représente χ(~n, k) = 0.
Soit θ un combinateur de point fixe. On pose
θ H J0K ∼β H (θ H) J0K
∼β if (P J0K) then J0K else θ H (succ J0K)
∼β if (P J0K) then J0K else θ H J1K
∼β θ H J1K
∼β H (θ H) J1K
..
.
∼β if (P JmK) then JmK else θ H Jm + 1K
∼β JmK.
Commentaires.
© Ce théorème est une implication dans l’équivalence des modèles de calcul entre
machines de Turing, fonctions µ-récursives et λ-calcul. En effet, combiné avec
le développement Turing-calculable =⇒ µ-récursive (Développement 109), il
suffit de prouver que toute fonction λ-définissable est calculable par une machine
de Turing pour prouver l’équivalence complète. Pour cela, il faut simuler la
β-réduction par une machine de Turing.
698
Modèles de calcul
© Il faut bien comprendre le sens des termes. Par exemple, pour la minimisation
non bornée, θ H J0K va donner J0K si P J0K et θ H J1K sinon et ainsi de suite en
appliquant θ H J1K. Le fait de comprendre le sens des formules permet de ne pas
s’embrouiller et de convaincre le jury que vous maîtrisez ce que vous faites.
© Il faut voir les λ-termes T et F comme les booléens true et false. En effet, pour
la conditionnelle if then else : λbtf.btf , le booléen b qui sera soit T soit F renverra
soit t soit f puisque T renvoie le premier argument et F le deuxième argument.
© Le combinateur de point fixe permet de simuler une boucle while, car il permet
de réitérer une fonction sans connaitre le nombre d’itérations. On a utilisé un
combinateur de point fixe pour simuler la récursion primitive mais l’expressivité du
combinateur de point fixe est plus grande puisqu’elle peut simuler la minimisation
non bornée. On peut prendre comme combinateur de point fixe celui de Curry Y
ou celui de Turing Θ avec
par exemple. Un des avantages du point fixe de Turing réside dans le fait qu’on a
une β-réduction directe, alors que pour celui de Curry, il faut réduire dans des
sens différents (c’est une β-équivalence). L’avantage de celui de Curry est qu’il est
plus naturel à définir. En effet,
Questions.
1. Montrer que à ~x fixé, λk.(is_zero (X J~xK JkK)) représente χ(~x, k) = 0.
2. Donner un λ-terme qui additionne deux entiers.
3. Donner une autre représentation des entiers.
4. Montrer que toute fonction λ-définissable est Turing-calculable.
5. Montrer que les combinateurs de Curry et de Turing sont bien des combinateurs
de point fixe.
699
112. Théorème de Scott-Curry
x ∈ A =⇒ ϕ(x) = 0 et x ∈ B =⇒ ϕ(x) = 1.
A = {gd(X) : X ∈ A} et B = {gd(X) : X ∈ B}
Rappelons que toute fonction µ-récursive peut être représentée par un λ-terme
(voir Développement 111).
Soit A et B deux ensembles non vides de λ-termes clos par β-équivalence.
Par l’absurde, on suppose qu’il existe ϕ une fonction µ-récursive (représentée
par un λ-terme M ) qui sépare les ensembles A et B. On pose G et N les
représentations des fonctions µ-récursives suivantes :
γ: N×N −→ N
(gd(X), gd(Y )) 7−→ gd(X Y ),
ν : N −→ N
n 7−→ gd(JnK).
Soit X ∈ A et Y ∈ B. On pose
700
Modèles de calcul
Le théorème de Scott-Curry montre que l’on ne peut pas séparer facilement des
ensembles de λ-termes, ce qui justifie son placement dans la leçon 929 de λ-calcul.
Correction.
a) Pour tout Z, W ∈ Λ, on a
N [Z] ∼β N Jgd(Z)K
∼β Jν(gd(Z))K
∼β Jgd(Jgd(Z)K)K
∼β [[Z]]
et
(is_zero Jϕ(gd(J))K) →β T.
De ce fait,
J →β T Y X →β Y ∈ B par hypothèse.
Or B est clos par β-équivalence donc J ∈ B, ce qui contredit J ∈
/ B.
• Si ϕ(gd(J)) > 0, alors on a J ∈
/ A par définition de ϕ et on a aussi
(is_zero Jϕ(gd(J))K) →β F.
De ce fait,
J →β F Y X →β X ∈ A par hypothèse.
Or A est clos par β-équivalence donc J ∈ A, ce qui contredit J ∈
/ A.
Ainsi on a une contradiction, donc la fonction ϕ n’existe pas et l’on ne peut pas
séparer récursivement les ensembles A et B.
701
112. Théorème de Scott-Curry
Commentaires.
© Il faut que ν et γ soient µ-récursives mais cela dépend du codage de gd.
Cependant, si on numérote les λ-termes par tailles croissantes de termes et par
nombre de variables utilisées croissant, on peut retrouver pour chaque n le terme
correspondant. Ainsi la concaténation de deux termes et la représentation des
entiers (de Barendregt ou de Church par exemple) sont bien calculables. Donc on
a bien des fonctions µ-récursives.
© On peut poser A l’ensemble des termes clos qui possèdent une forme normale
et B l’ensemble des termes clos qui ne possèdent pas de forme normale. Ces
ensembles sont bien disjoints, non vides et clos par β-équivalence, on peut donc
appliquer le théorème de Scott-Curry qui nous dit qu’il n’existe pas de fonction µ-
récursive qui sépare ces deux ensembles.
Ainsi le problème de terminaison (de la β-équivalence)
(
entrée : un terme clos X de λ-calcul ;
Terminaison
sortie : oui si X possède une forme normale, non sinon.
est indécidable.
© La preuve du théorème de Scott-Curry ressemble finalement beaucoup à la
preuve de l’indécidabilité du problème de l’arrêt pour les machines de Turing, on
crée une machine/un λ-terme qui est paradoxal(e) en s’appliquant à soi-même.
© On a utilisé de manière fondamentale que tout fonction µ-récursive est λ-
définissable.
© On a utilisé les fonctions is_zero, T et F qui sont explicitées dans l’introduction
sur le λ-calcul.
© On peut rapprocher l’utilisation de la notion de séparabilité récursive du théo-
rème de Rice pour les machines de Turing. En effet, on introduit cette notion
pour pouvoir séparer, par exemple, un ensemble qui vérifie une propriété et son
complémentaire.
© Lors de la présentation devant le jury, il peut être intéressant d’utiliser différentes
couleurs pour intercaler les calculs de N [H] et G [W ] [Z] dans la β-réduction
de J.
On peut en effet écrire
702
Modèles de calcul
Questions.
1. Donner un codage de Gödel injectif gd : Λ → N.
2. Montrer que l’ensemble des termes clos qui possèdent une forme normale et
l’ensemble des termes clos qui ne possèdent pas de forme normale sont tous les
deux non vides.
3. Où utilise-t-on que A et B sont non vides ?
4. Pourquoi l’ensemble A des termes clos qui possèdent une forme normale et
l’ensemble B des termes clos qui ne possèdent pas de forme normale sont non
vides ?
703
Théorie des graphes
Au même titre que les mots ou les arbres 37 , les graphes sont des objets fondamen-
taux en mathématiques discrètes et en informatique. À première vue, ces structures
ont d’abord une visée algorithmique : elles permettent de modéliser certains pro-
blèmes « de la vie courante » (voir par exemple les Développements 116, 118
et 126). Cependant, le champ d’application de la théorie des graphes est loin de
se limiter à l’étude de questions algorithmiques. En effet, comme on le verra dans
cette introduction ainsi que dans les Développements 4, 14, 28, 114, 115 et les
questions associées, les graphes apparaissent naturellement dans diverses branches
des mathématiques (combinatoire, théorie des groupes, théorie des nombres, proba-
bilités, voire géométrie différentielle) et de l’informatique (logique, algorithmique,
optimisation).
1 Premières définitions
Définition 28 (Graphe, sommet, arête)
Un graphe (non orienté) G est un couple (S, A) où S est un ensemble de sommets
et A est un ensemble d’arêtes, c’est-à-dire d’ensembles de la forme {s, t} où
s, t sont deux sommets (non nécessairement distincts) de S.
Pour simplifier les notations, on notera st (ou ts) l’arête {s, t}.
Définition 29 (Boucle, graphe simple)
Lorsque s = t ∈ S, l’arête {s, t} = {s} est appelée une boucle. Un graphe est
dit simple s’il ne contient pas de boucle.
Définition 30 (Graphe fini)
Un graphe (S, A) est dit fini si S est fini.
Sauf mention contraire, les graphes considérés dans ce livre seront systématique-
ment supposés finis, simples et non orientés (voir Section 3.3).
Définition 31 (Adjacence, voisinage)
Soit G = (S, A) un graphe et s ∈ S.
• On dit qu’un sommet t est adjacent à s si st ∈ A.
• On appelle voisinage de s, noté NG (s) (ou N (s) lorsqu’il n’y a pas matière
à confusion), l’ensemble des sommets adjacents à s.
37. Les arbres sont bien évidemment des cas particuliers de graphes. Cependant, dans de
nombreuses applications en algorithmique ou en théorie des langages (par exemple), les arbres
ne sont pas considérés comme des graphes particuliers mais comme des structures de données
arborescentes permettant de représenter des relations de parenté.
Définition 32 (Incidence, degré)
Soit G = (S, A) est un graphe et s ∈ S.
• On dit que l’arête e ∈ A est incidente à s si e = st pour un certain t ∈ S.
• On appelle degré de s et on note dG (s) (ou d(s)) le nombre d’arêtes incidentes
à s. On peut remarquer que lorsque G est simple, d(s) = |N (s)|.
Définition 33 (Graphes isomorphes)
Deux graphes G1 = (S1 , A1 ) et G2 = (S2 , A2 ) sont isomorphes s’il existe une
bijection f : S1 → S2 telle que
2 Quelques exemples
Définition 34 (Chemin, cycle, clique)
Soit n ∈ N∗ .
• Le chemin Pn , ou graphe linéaire à n sommets, est le graphe
{s1 , . . . , sn }, {si si+1 : i ∈ J1, n − 1K} .
706
Théorie des graphes
s1
s1 s2
s1
s2
s3 s2
s4 s3 s4 s3
s4
où a = a si a ∈
/ {s, t} et s = t = s|t. Ce graphe est représenté en Figure 3.8.
a e d a e d
c c
b b
Graphe G Graphe G − bc
a e d
b|c
Graphe G · bc
707
Définition 38 (Clique, ensemble indépendant)
• Une clique d’un graphe G est un sous-graphe complet de G.
• Un ensemble indépendant est un sous-graphe induit de G sans arête.
Figure 3.9 – Un graphe à 6 sommets possédant une clique de taille 3 (en gras) et
un ensemble indépendant de taille 3 (en pointillés).
Figure 3.10 – Deux graphes 4-partis, non complet à gauche et complet à droite.
Les graphes r-partis interviennent naturellement en théorie extrémale des graphes,
comme l’illustre le Développement 114. On montre dans ce développement que
les graphes les plus denses (autrement dit maximisant le rapport du nombre
d’arêtes au nombre de sommets) ne contenant pas Kr+1 comme sous-graphe sont
nécessairement r-partis complets. On peut alors décrire explicitement ces graphes
708
Théorie des graphes
Connexité et arbres
Définition 40 (Accessibilité)
Soient G = (S, A) un graphe et s, t ∈ S. On dit que t est accessible depuis s
s’il existe des sommets s1 , . . . , sn ∈ S tels que s1 = s, sn = t et pour tout
entier i ∈ J1, nK, si si+1 ∈ A. On dit aussi qu’il existe un chemin de s à t dans G.
Définition 41 (Connexité, composante connexe)
• Un graphe G = (S, A) est dit connexe si pour tous s, t ∈ S, il existe un
chemin de s à t dans G.
• Une composante connexe de G est un sous-graphe connexe de G maximal
pour l’inclusion ou, de manière équivalente, une classe d’équivalence de
sommets pour la relation d’accessibilité.
Définition 42 (Forêt, arbre)
On dit qu’un graphe est une forêt s’il ne contient aucun cycle comme sous-
graphe, et que c’est un arbre s’il est de plus connexe (voir Figure 3.11).
Voici quelques propriétés de base sur les arbres. La première permet en particulier
d’obtenir des résultats par récurrence, puisqu’elle montre que tout arbre à n
sommets peut être construit en ajoutant une feuille à un arbre à n − 1 sommets.
Proposition 3
• Tout arbre non vide possède un sommet de degré au plus 1. Un tel
sommet est appelé feuille.
• Tout arbre ayant au moins deux sommets possède deux sommets de degré
au plus 1.
• Tout arbre à n sommets possède exactement n − 1 arêtes.
• Toute forêt à n sommets et à k composantes connexes possède exactement
n − k arêtes.
• Dans un arbre, toute paire de sommets est reliée par un unique chemin.
709
• G = (S, A) est un arbre si et seulement si |A| = |S| − 1 et G est connexe.
• G = (S, A) est un arbre si et seulement si |A| = |S| − 1 et G n’a pas de
cycle.
Une des utilisations classiques des arbres est fournie par le problème d’arbre
couvrant.
Définition 43 (Arbre couvrant)
Un arbre couvrant d’un graphe G est un sous-graphe de G induisant un arbre
et contenant tous les sommets de G. Un tel arbre est représenté en Figure 3.12.
Graphes eulériens
Définition 44 (Cycle et chemin eulériens)
Soit G = (S, A) un graphe.
• Un cycle eulérien dans G est une suite de sommets s1 , . . . , sn (non nécessai-
rement deux à deux distincts) passant une et une seule fois par chaque arête
de G. Plus précisément, on doit avoir
710
Théorie des graphes
s3 s3
s2 s4 s2 s4
s1 s5 s1 s5
711
s3
s2
s2 s4
s1
s3 s4 s1 s5
Graphes planaires
Définition 46 (Graphe planaire, plongement)
On dit que G = (S, A) est planaire si on peut le dessiner dans le plan sans que
des arêtes ne se croisent (voir Figure 3.16). Plus formellement, G est planaire
s’il existe un plongement de G dans R2 , c’est-à-dire une application injective
p : S → R2 telle que pour tout st ∈ A, l’intervalle ouvert ]p(s), p(t)[ ⊂ R2 n’in-
tersecte pas l’image de p, ni aucun intervalle ]p(s0 ), p(t0 )[ pour s0 t0 ∈ A \ {st}.
G G H
Figure 3.16 – Un graphe planaire G « mal » plongé, un plongement planaire
de G, un graphe non planaire H.
712
Théorie des graphes
contenant le reste du graphe. Cette face (représentée en Figure 3.17) est appelée
face extérieure ou face externe du plongement, les autres étant dites internes.
Figure 3.17 – Un graphe avec une face interne et une face externe pentagonales.
5 Graphes orientés
La notion de graphe orienté est une extension naturelle de la notion de graphe,
dans laquelle on souhaite associer à chaque arête une direction. Classiquement,
on modélise cette situation en définissant A comme un sous-ensemble de S 2 . Le
couple (s, t) est alors appelé arc et noté (à nouveau) st. La plupart des notions
définies précédemment se transposent mutatis mutandis aux graphes orientés. On
détaille ci-après uniquement les notions qui leur sont spécifiques.
713
Définition 49 (Voisinages d’un sommet)
Soit G = (S, A) est un graphe orienté et st ∈ A.
• Le sommet t est dit successeur de s et s est dit prédécesseur de t.
• On appelle voisinage entrant (resp. sortant) de s ∈ S l’ensemble N − (s) (resp.
N + (s)) des prédécesseurs (resp. successeurs) de s.
• L’arc st est dit arc sortant de s et arc entrant de t.
• On appelle degré entrant d− (s) (resp. sortant d+ (s)) le nombre d’arcs entrants
(resp. sortants) de s.
• On appelle source tout sommet sans prédécesseur et puits tout sommet sans
successeur.
La notion d’accessibilité n’étant plus symétrique dans le cas des graphes orientés,
ce n’est plus une relation d’équivalence en général. On généralise alors la notion
de connexité comme suit.
Définition 50 (Connexité forte)
• Un graphe orienté G = (S, A) est dit fortement connexe si pour tous s, t ∈ S,
le sommet s est accessible depuis t et t est accessible depuis s.
• On appelle composante fortement connexe d’un graphe orienté tout sous-
ensemble de sommets maximal pour l’inclusion et qui induit un graphe
orienté fortement connexe (voir Figures 3.18 et 3.19).
Les composantes fortement connexes d’un graphe orientés peuvent être déterminées
en temps linéaire grâce aux algorithmes de Tarjan ou de Kosaraju.
Définition 51 (Circuit, cycle orienté)
Soit G = (S, A) un graphe orienté. On appelle circuit toute suite s1 , . . . , sn ∈ S
tels que sn s1 et si si+1 soient des arcs de A pour tout i ∈ J1, n − 1K. Si de plus
les si sont deux à deux distincts, on parle de cycle orienté (voir Figure 3.18).
2 4
3 5
Figure 3.18 – Le circuit 123145 est composé de deux cycles orientés 123 et 145.
Ce graphe est fortement connexe : il n’a qu’une composante fortement connexe.
Définition 52 (Acyclicité)
Un graphe orienté est dit acyclique s’il ne contient aucun circuit (ou de manière
équivalente, aucun cycle orienté).
714
Théorie des graphes
sommet vers un sommet qui lui est supérieur. Obtenir un tel tri permet de résoudre
des problèmes d’ordonnancement et est à la base de logiciels comme Make, qui
analyse les dépendances entre fichiers afin de les compiler dans un bon ordre.
Cette technique est aussi utilisée dans les gestionnaires de paquets pour installer
les paquets en satisfaisant leurs dépendances (voir Développement 117).
Définition 53 (Graphe quotient)
À partir de tout graphe orienté, on peut construire un graphe orienté acyclique
en contractant chaque composante fortement connexe en un seul sommet et en
reportant les arcs comme dans la Définition 36. Le graphe orienté obtenu est
appelé graphe quotient (voir Figure 3.19).
1
1
3 7
2 6
4 5 2|3|4 5|6|7
Figure 3.19 – Les composantes fortement connexes d’un graphe orienté et son
graphe quotient.
715
Théorie des graphes
Correction.
a) Soit G = (S, A) un graphe tel que A contienne un élément xy, et soit k ∈ N∗ .
Les colorations propres à k couleurs de G − xy sont de deux types : celles qui
associent la même couleur à x et à y, et celles qui leur associent des images
différentes. L’ensemble des colorations du premier type est en bijection avec
l’ensemble des colorations propres à k couleurs de G · xy : en effet, une telle
bijection est réalisée par l’application transformant une coloration propre φ de
G − xy vérifiant la propriété φ(x) = φ(y) en la coloration propre ψ de G · xy
717
113. Polynôme chromatique
définie par (
ψ(a) = φ(a) si a ∈ S \ {x, y},
ψ(x|y) = φ(x).
L’ensemble des colorations propres φ de G − xy vérifiant φ(x) 6= φ(y), quant à lui,
est exactement l’ensemble des colorations propres de G. On a donc
718
Théorie des graphes
1 2 3 4 n
Il existe k choix de couleurs pour le nœud 1. Pour chacun de ces choix, on dispose
ensuite de k − 1 choix de couleurs pour le nœud 2 (si celui-ci existe), puis à
nouveau de k − 1 choix pour le nœud 3 (si celui-ci existe), et ainsi de suite jusqu’au
nœud n. On a donc ck (Ln ) = k(k − 1)n−1 , d’où :
1 2 3 4 n
On voit aisément que ck (C3 ) = k(k − 1)(k − 2) pour tout k ∈ N∗ , si bien que (4)
donne par une récurrence facile :
n−1
∀n > 3, ∀k ∈ N∗ ,
X
ck (Cn ) = (−1)n−1−i k(k − 1)i + k(k − 1)(k − 2)(−1)n−1
i=3
"n−1 #
X
n−1 i
= k(−1) (1 − k) + (1 − k)(2 − k)
i=3
n−1
X
= k(−1)n−1 (1 − k)i
i=1
(1 − k) + (1 − k)n
= k(−1)n−1
k
n n
= (k − 1) + (−1) (k − 1),
et donc :
∀n > 3, PCn = (X − 1)n + (−1)n (X − 1).
719
113. Polynôme chromatique
Commentaires.
© La question a) permet le calcul de ck (G) en utilisant deux graphes dont le
nombre d’arêtes est strictement plus petit que celui de G (si ce dernier nombre
n’est pas nul). Ainsi, combiner les résultats des questions a) et c) permet de
déterminer de proche en proche le polynôme chromatique de graphes finis simples
arbitrairement complexes. À titre d’exemple, déterminons le polynôme chromatique
du graphe G1 représenté sur la figure ci-après 39 :
f e d
a b c
f e d f e d e d
a b c a b c a|f b c
e d e
Graphe G4 Graphe G5
PG 1 = PG 2 − PG 3 (5)
et
PG 3 = PG 4 − PG 5 . (6)
Il est clair (voir Figure 3.20) que pour tout k ∈ N∗ , une coloration propre de G2
à k couleurs est obtenue en se donnant une coloration propre de G3 à k couleurs
39. Il est possible (et intéressant !) de présenter ce calcul à la fin de l’exposition du développe-
ment, au prix de quelques raccourcis lors de la présentation des questions précédentes.
720
Théorie des graphes
d’où
PG1 = (X − 2)2 PG5 .
On remarque enfin que G5 est le graphe cyclique C4 , si bien que
PG5 = (X − 1)4 + (X − 1)
= X(X − 1)(X 2 − 3X + 3),
Il est aisé de démontrer que si ∆ est le degré maximal d’un sommet de G, alors on
a χ(G) 6 ∆ + 1. En effet, une coloration propre de G à ∆ + 1 couleurs peut dans
ce cas être obtenue en coloriant successivement chaque sommet à l’aide d’une
couleur par laquelle aucun de ses voisins n’a déjà été colorié, ce qui est toujours
possible. Le théorème de Brooks (1941) affine ce résultat en affirmant que si G est
connexe, alors χ(G) 6 ∆, sauf si G est un graphe complet ou un graphe cyclique
avec un nombre impair de sommets, auquel cas ∆ + 1 couleurs sont nécessaires
(et donc χ(G) = ∆ + 1).
© La détermination du nombre chromatique d’un graphe est un problème NP-
complet bien connu. À ce jour, on ne sait pas s’il est possible de généraliser le
théorème de Brooks avec une borne de ∆ − 1, sauf pour une famille de graphes
dont la structure est bien comprise. Ceci motive l’étude du nombre chromatique
sur certaines sous-classes de graphes. Les résultats en ce sens sont légion. Le plus
connu d’entre eux est probablement le théorème des quatre couleurs (1976), qui
affirme que le nombre chromatique de tout graphe planaire est au plus 4. Le
théorème de Grötzsch (1959) stipule que cette borne peut être ramenée à 3 si le
graphe est sans triangle.
© La coloration est une thématique très répandue en théorie des graphes, où elle
permet par exemple de modéliser des problèmes d’allocation de ressources. Par
exemple, supposons que les sommets du graphe représentent des trains susceptibles
de fréquenter une gare donnée, et qu’une arête du graphe reliant deux sommets
modélise le fait que les deux trains correspondants ne peuvent partager le même
quai, par exemple parce que leurs périodes de présence en gare se chevauchent.
Alors une coloration propre du graphe est une application associant à chaque train
un quai de sorte que le trafic se déroule sans encombre, et le nombre chromatique
721
113. Polynôme chromatique
est le nombre minimal de quais que la gare doit posséder pour que ce soit possible.
Ceci se généralise naturellement à un ensemble de tâches à accomplir dont certaines
ne peuvent être effectuées simultanément ; le nombre chromatique est alors la
quantité minimale de ressources nécessaires pour pouvoir effectuer toutes les
tâches. Ce point de vue se retrouve en compilation (quand on cherche à minimiser
le nombre de registres utilisés dans un programme), en télécommunications (quand
on cherche à définir quelles fréquences assigner aux éléments d’un réseau sans que
deux éléments proches n’utilisent la même fréquence à cause des interférences),
en planification pour créer des emplois du temps (dans lesquels deux cours ne
peuvent occuper le même créneau horaire s’il existe des élèves inscrits aux deux
cours à la fois) ou des plans d’occupation de salles (dans lesquels deux cours ne
peuvent occuper la même salle si leurs horaires se chevauchent)...
Ces nombreuses applications ont donné lieu à de tout aussi nombreuses variantes
du problème initial de coloration de sommets. On peut par exemple citer le
problème de la coloration d’arêtes, où l’on attribue une couleur à chaque arête de
sorte que deux arêtes partageant une extrémité reçoivent des couleurs différentes.
Le nombre minimal de couleurs nécessaire à ce type de coloration est appelé
indice chromatique. En considérant les arêtes incidentes à un sommet de degré ∆,
on s’aperçoit du fait que ∆ couleurs sont toujours nécessaires. Le théorème de
Vizing (1964) assure qu’il existe toujours une coloration d’arêtes à ∆ + 1 couleurs.
Cependant, déterminer la valeur exacte est un problème NP-complet (et ce, même
lorsque ∆ = 3).
Questions.
722
Théorie des graphes
9. Des garçons et des filles dansent dans une soirée de gala. À la fin de la soirée,
on demande à chacun et chacune le nombre de danses auxquelles ils ont participé.
Les réponses obtenues sont les suivantes : 3, 3, 3, 3, 3, 5, 6, 6, 6, 6. Montrer qu’au
moins une personne a fait une erreur.
10. Lors d’une école d’été, p ∈ N∗ conférences différentes sont proposées à des
mathématiciens qui sont invités à exprimer leur intérêt pour n’importe quel nombre
d’entre elles. Chaque conférence dure une journée, et il est considéré comme
primordial que chaque mathématicien puisse assister à toutes les conférences qui
l’intéressent. Comment les organisateurs doivent-ils s’y prendre pour déterminer
le nombre minimal de journées nécessaires pour satisfaire tous les participants ?
Indication : on pourra considérer un graphe G dont les sommets représentent les p
différentes conférences et dont on cherchera à définir le nombre chromatique,
c’est-à-dire le plus petit k ∈ N∗ tel que PG (k) 6= 0.
11. Soit G un graphe possédant m ∈ N∗ composantes connexes. Montrer que X m
divise PG .
Indication : on pourra considérer les polynômes chromatiques de ces différentes
composantes connexes vues comme des graphes isolés.
12. En utilisant le théorème de Brooks, montrer que le problème de 3-colorabilité
d’un graphe de degré au plus 3 est polynomial.
723
114. Théorème de Turán
(i) Montrer que Tn,r est l’unique graphe qui maximise le nombre d’arêtes
parmi les graphes r-partis à n sommets.
(ii) Soit G un graphe à n sommets sans clique à r + 1 sommets, et dont le
nombre d’arêtes est maximal pour cette propriété. Montrer que G est
r-parti complet, et en déduire que G = Tn,r .
Leçons concernées : 190, 264, 925
724
Théorie des graphes
Correction.
a) (i) On note v1 , . . . , vd les voisins de v dans G. Par construction de S, la
probabilité de l’évènement « v ∈ S » est égale à la probabilité que v soit choisi
avant ses voisins par le processus aléatoire, i.e. σ(v) < σ(vi ) pour tout i ∈ J1, dK.
Pour tout i ∈ J1, d + 1K, soit Σi l’ensemble des permutations de SV qui placent v
en i-ème position parmi les vj . La probabilité recherchée est alors |Σ1|
|V |! = P(v ∈ S).
Soit i ∈ J1, d + 1K. Soit ϕ : Σi → Σ1 l’application qui associe à tout τ ∈ Σi la
composée τ 0 τ où τ 0 est la transposition qui échange τ (v) avec min{τ (v1 ), . . . , τ (vd )}.
L’application ϕ est une bijection, car l’application ψ : Σ1 → Σi qui associe à τ
la composée τ 00 τ où τ 00 est la transposition de SV échangeant τ (v) avec le i-ème
plus petit élément de {τ (v1 ), . . . , τ (vd )} vérifie ψ ◦ ϕ = IdΣi et ϕ ◦ ψ = IdΣ1 . On
a donc l’égalité |Σ1 | = |Σi |.
|V |!
De plus, Σ1 , . . . , Σd+1 forment une partition de SV , d’où |Σ1 | = d+1 . Finalement,
1
on a donc P(v ∈ S) = d+1 .
(ii) D’après la question précédente et par linéarité de l’espérance, on a
!
X X X X 1
E(|S|) = E 1v∈S = E(1v∈S ) = P(v ∈ S) = .
v∈V v∈V v∈V v∈V
d(v) + 1
1
La convexité de la fonction x 7→ 1+x sur R+ donne alors que
1 X 1 1
> 1 .
n v∈V d(v) + 1
P
n v∈V d(v) + 1
1 n
On obtient alors n E(|S|) > 2m+n , ce qui est le résultat souhaité.
(iii) Soit G le graphe complémentaire de G, c’est-à-dire le graphe simple ayant
le même ensemble de sommets que G et dont les arêtes sont exactement celles
n’apparaissant pas dans G. Un ensemble indépendant de G est donc une clique
dans G. Ainsi, si G ne possède pas de clique de taille r + 1, tout ensemble
indépendant de G est de taille au plus r. Soit S un ensemble aléatoire construit à
725
114. Théorème de Turán
n2
r > E(|S|) > .
n + 2( n(n−1)
2 − m)
n2
On en déduit que m 6 2 (1 − 1r ).
b) (i) Soit G = (V, E) un graphe r-parti à n sommets ayant un nombre maximal
d’arêtes. Soit {V1 , . . . , Vr } une partition des sommets de G en r ensembles indé-
pendants dans G, triée par tailles croissantes. Pour tout i ∈ J1, rK, on note cette
taille ki = |Vi |. Comme le nombre d’arêtes de G est maximal, on peut supposer
que toutes les arêtes sont présentes dans G sauf entre deux sommets appartenant
au même Vi pour un certain i ∈ J1, rK. Autrement dit, le complémentaire de G est
composé de r cliques disjointes, de tailles k1 , . . . , kr , avec k1 > · · · > kr .
Chaque clique induite par Vi a ki (k2i −1) arêtes. Ainsi, le nombre d’arêtes de G est
r r r r
! !
X ki (ki − 1) 1 X X 1 X
= ki2 − ki = k2 − n .
i=1
2 2 i=1 i=1
2 i=1 i
Cette inégalité assure que, quand ki et kj diffèrent d’au moins 2, on peut faire
décroître strictement la somme ki2 + kj2 en remplaçant ki , kj par deux entiers notés
ki0 , kj0 qui ont même somme. Ainsi, pour minimiser ri=1 ki2 , les entiers ki et kj
P
doivent différer d’au plus 1, pour tout i, j ∈ J1, rK. Comme k1 > · · · > kr par
hypothèse, on peut donc supposer que k1 = · · · = kj et kj+1 = · · · = kr = k1 − 1
pour un certain j ∈ J1, rK.
On a alors n = ri=1 ki = rkr + j. Comme 0 6 j < r, on retrouve l’écriture de la
P
n
k1 = · · · = kj = ,
r
n
kj+1 = · · · = kr = .
r
Ainsi, G est isomorphe à Tn,r .
726
Théorie des graphes
(ii) Supposons que G ne soit pas k-parti complet pour un certain entier k, i.e.
que son complémentaire ne soit pas une union de k cliques. En d’autres termes,
supposons qu’il existe x, y, z ∈ V tels que xz ∈
/ E, yz ∈ / E et xy ∈ E.
Si d(z) < d(x), on remplace z par une copie de x, c’est-à-dire un sommet x0 qui
a les mêmes voisins que x. Le graphe obtenu H a alors plus d’arêtes que G. De
plus, supposons que H contienne une clique à r + 1 sommets. Alors cette clique
ne peut contenir qu’un seul sommet parmi x et x0 (car ils ne sont pas adjacents).
Comme x et x0 ont les mêmes voisins, si x0 appartient à la clique, alors on peut
le remplacer par x et obtenir une nouvelle clique de taille r + 1. Cette clique ne
contient que des sommets présents dans G, ce qui est absurde car G ne contient
pas de clique à r + 1 sommets.
On peut donc en déduire que d(z) > d(x) et, de manière similaire, d(z) > d(y).
On remplace alors x et y par deux copies z 0 et z 00 de z. Comme xy ∈ E, le graphe
H 0 obtenu a plus d’arêtes que G. Par le même argument que précédemment, H 0
ne contient pas de clique à r + 1 sommets. On aboutit donc à une contradiction.
Ainsi, G est k-parti complet pour un certain k.
Comme G ne contient pas de clique à r + 1 sommets, on a k 6 r. Ainsi, G
est r-parti (en effet tout graphe k-parti est aussi `-parti pour tout ` > k par
définition). D’après la question précédente, Tn,r est l’unique graphe r-parti sur n
sommets avec un nombre maximum d’arêtes, d’où G = Tn,r .
Commentaires.
© On connaît de nombreuses démonstrations du théorème de Turán. Celle présen-
tée ici en question b) est due à Zykov (1949). Pour la version faible, la preuve
originale de Turán (1941) procède par récurrence sur n, en considérant un graphe G
maximal en nombre d’arêtes ne contenant pas de cliques à r + 1 sommets. Par
maximalité, G doit contenir une clique K à r sommets. On peut alors obtenir une
borne supérieure sur |E(G)| en appliquant l’hypothèse de récurrence à V (G) \ K
et en remarquant que tout sommet de V (G) \ K a au plus k − 1 voisins dans K.
La version forte admet une autre preuve, due à Erdős (1970) qui procède par
récurrence sur r, et consiste à transformer un graphe G maximal en nombre
d’arêtes ne contenant pas de cliques à r + 1 sommets. À l’issue des transformations,
on peut montrer qu’on a augmenté le nombre d’arêtes sans créer de clique à r + 1
sommets (ce qui contredit la maximalité de G) sauf si G est multiparti complet,
ce qui permet de conclure grâce à la question b)(i).
© La méthode probabiliste est très utilisée en théorie des graphes. L’idée générale
est de considérer un processus aléatoire pour créer un objet, puis de montrer que la
probabilité que cet objet ait la propriété recherchée soit positive. Ceci assure qu’au
moins un des objets vérifie la propriété. On obtient ainsi des résultats d’existence,
mais de manière non constructive. On peut par exemple citer le résultat d’Erdős
(1959) : pour tous entiers k, g, il existe un graphe de nombre chromatique au
moins k et dont le plus petit cycle est de taille g.
© Soit F un graphe et n un entier. On note ex(F, n) le nombre maximum d’arêtes
d’un graphe à n sommets ne contenant pas F comme sous graphe. Le théorème
727
114. Théorème de Turán
de Turán établit que ex(Kr+1 , n) = |E(Tn,r )|, et que l’unique graphe atteignant
ce maximum est Tn,r .
Le théorème d’Erdős-Stone-Simonovits (1966) généralise ce résultat lorsque F est
un graphe quelconque :
Soit F un graphe non biparti. Alors
2
1 n
ex(F, n) ∼ 1− .
n→+∞ χ(F ) − 1 2
728
Théorie des graphes
Questions.
1. Montrer que pour tout n ∈ N, on a n = b n2 c + d n2 e.
n(n−1)
2. Justifier que G a bien 2 − m arêtes si G en a m.
P
3. Justifier l’égalité v∈V d(v) = 2m.
4. Retrouver l’inégalité de la question a)(ii) en utilisant l’inégalité des moyennes
harmonique et arithmétique.
5. Résoudre le problème de minimisation de la question b)(i) dans le cas où
k1 , . . . , kr sont réels.
6. Montrer qu’un graphe est multiparti complet si et seulement s’il ne contient
pas le graphe à trois sommets et une arête comme sous graphe induit.
7. Quelle est la complexité de décider si un graphe est t-parti ?
8. Tout graphe non t-parti admet-il une clique de taille t comme sous-graphe ?
9. Le cas r = 2 du théorème de Turán, à savoir le cas des graphes sans triangle,
est connu comme le théorème de Mantel. Donner une preuve par récurrence de ce
théorème.
Indication : dans un premier temps, on pourra vérifier que dans un graphe sans
triangle à n sommets, on a d(u) + d(v) 6 n pour toute arête uv. Ensuite, pour
prouver le résultat sur G, on pourra ensuite appliquer l’hypothèse de récurrence
à G privé de deux sommets adjacents.
4e n2
10. Montrer que tout graphe à n sommets et m arêtes contient au moins 3n (e− 4 )
triangles.
11. Montrer le théorème de Dirac : si G est un graphe à au moins r + 2 sommets
tel que |E(G)| = |E(Tn,r )| + 1, alors G contient une copie de Kr+2 privé d’une
arête.
12. Soit S ⊂ Rd un ensemble fini de vecteurs. Soient u, v deux vecteurs tirés
uniformément et indépendamment dans S. Montrer que pour tout réel positif x,
P(kuk > x)2
P(ku + vk > x) > .
2
13. Montrer que pour tout n ∈ N, tout ensemble de 3n points du √ disque unité
3
contient au moins 2 n(n − 1) paires de points à distance au plus 2.
14. Montrer que pour tout graphe F , la suite ( ex(F,n) ) est décroissante.
(n2 ) n∈N
15. Montrer que lorsque T est une étoile ou un chemin à k sommets,
n(k − 2)
ex(T, n) 6 .
2
Remarque : les étoiles et les chemins sont en quelque sorte les deux types d’arbres
les plus différents. Le résultat de cette question fournit ainsi la motivation de
la conjecture d’Erdős-Sós, qui affirme que l’inégalité précédente est vraie pour
n’importe quel arbre T à k sommets. De manière équivalente, elle affirme que
tout graphe à n sommets et au moins n(k−2) 2 arêtes contient une copie de tout
arbre à k sommets.
729
114. Théorème de Turán
√
16. Montrer que ex(C4 , n) 6 n 2 n .
Indication : on pourra compter de deux manières le nombre de copies de K1,2
dans un graphe à n sommets sans C4 .
17. Soit p un nombre premier, et G le graphe dont les sommets sont les éléments
de F2p \ {(0, 0)} où (x, y) et (a, b) forment une arête si ax + by = 1. Montrer que
2 −1)
G ne contient pas de cycle à 4 sommets et contient (p−1)(p
2 arêtes. En déduire
le théorème d’Erdős (1938) :
√
n n
ex(C4 , n) ∼ .
n→+∞ 2
18. Étant donné un entier k, on définit Rk comme le plus petit entier tel que
pour toute clique K de taille au moins Rk dont on a colorié les arêtes en deux
couleurs, K contient une clique monochromatique de taille k. Montrer que si
k(k−1)
2 nk < 2 2 , alors Rk > n.
Pour tout ε > 0, il existe n0 ∈ N tel que pour tout n > n0 et A ⊂ J1, nK
tel que |A| > εn, on peut trouver x, y, z ∈ A tels que x < y < z et
y − x = z − y.
730
Théorie des graphes
731
115. Formule d’Euler par déchargement
Correction.
a) (i) Supposons que q(T ) = 2 pour toute triangulation planaire T . Comme G
est simple, toutes ses faces ont taille au moins 3. On peut construire itérativement
une triangulation en ajoutant des arêtes à G selon la procédure suivante. Tant
que G possède une face non triangulaire, on ajoute une arête séparant cette face
en deux. La quantité q(G) reste inchangée car on ajoute une face et une arête.
Lorsque cette procédure se termine, le graphe H obtenu est une triangulation. On
a alors q(G) = q(H) = 2. On peut donc supposer que G est triangulé.
(ii) Pour θ ∈ [0, 2π[, on note rθ la rotation de R2 de centre (0, 0) et d’angle θ.
Considérons les images du plongement de G par rθ .
Pour chaque arête a de G, son image par rθ est horizontale pour seulement deux
valeurs de θ. Il existe ainsi au plus 2|A| valeurs de θ telles que l’image par rθ du
plongement de G contienne une arête horizontale. L’intervalle [0, 2π[ étant infini,
on peut choisir une valeur de θ pour laquelle cette situation n’arrive pas.
(iii) Soit f une face de G. Comme G est une triangulation, f est un triangle.
Comme il n’y a pas d’arête horizontale dans le plongement de G choisi, il existe
exactement un sommet x du plongement de f d’ordonnée maximum et un sommet y
d’ordonnée minimum. Soit z le troisième sommet de f . On distingue deux cas
selon que f est la face extérieure fext ou une face interne.
• Supposons que f est une face interne. Si (le plongement de) z est à gauche
(du plongement) de xy, alors f reçoit 1 par z et donne 1 à xz et yz. Sinon,
f donne seulement 1 à xy. Dans les deux cas, f perd un poids de 1 et son
poids final est 0.
x x
1
1
1 f f
1
z z
y y
732
Théorie des graphes
x 1 x
1
fext
1
1
1
1
z z fext
1
y y
1
car chaque arête de A apparaît dans les sommes correspondant à exactement deux
sommets (à savoir ses extrémités). De manière similaire, on obtient que
X
`(f ) = 2|A|. (2)
f ∈F
733
115. Formule d’Euler par déchargement
(ii) À partir d’un solide S, on peut construire un graphe connexe simple G qui
utilise les mêmes sommets et arêtes. En utilisant une projection stéréographique,
on peut obtenir un plongement de G dans R2 , qui est donc planaire. Par définition,
si S est un solide régulier, alors toutes ses faces sont des polygones réguliers de
même taille, et tous ses sommets sont incidents au même nombre d’arêtes. Cela
se traduit par le fait que tous les sommets de G ont même degré q > 1 et que
toutes les faces de G ont même degré p. De plus, on a p > 3 car les faces de S
sont au moins triangulaires. Si q = 1, alors G ne contient qu’une arête, et si q = 2,
comme G est simple alors G est un cycle. Or G est construit à partir d’un solide
donc il n’est ni réduit à une arête ni un cycle. Il reste donc le cas q > 3.
On utilise à nouveau les équations (1) et (2), qui fournit q|S| = 2|A| = p|F |. En
réinjectant ces égalités dans la formule d’Euler, on obtient
1 1 1 1
+ = + .
q p |A| 2
Comme p, q et |A| sont des entiers positifs, cette équation n’a qu’un nombre fini
de solutions :
• Si p = q = 3, alors |A| = 6, donc |F | = |S| = 4. Ceci correspond à un unique
graphe, la clique sur 4 sommets. Le solide associé est le tétraèdre.
• Si p = 4 et q = 3, on obtient |A| = 12, d’où |F | = 6 et |S| = 8, ce qui
correspond au cube.
• Si p = 5 et q = 3, on obtient |A| = 30, d’où |F | = 12 et |S| = 20, ce qui
correspond au dodécaèdre.
• Si p = 3 et q = 4, on obtient |A| = 12, d’où |F | = 8 et |S| = 6, ce qui
correspond à l’octaèdre.
• Si p = 3 et q = 5, on obtient |A| = 30, d’où |F | = 20 et |S| = 12, ce qui
correspond à l’icosaèdre.
Dans chacun des cas, on a un unique candidat pour G, et il existe bien un solide
régulier d’où G est issu. Il existe donc bien cinq types de solides réguliers convexes
(voir Figure 3.23).
(iii) Soit G un fullerène, et notons f5 (resp. f6 ) son nombre de faces pentagonales
(resp. hexagonales). En utilisant à nouveau les équations (1) et (2), on obtient
734
Théorie des graphes
p=q=3
p = 4, q = 3
p = 3, q = 4
p = 5, q = 3
p = 3, q = 5
735
115. Formule d’Euler par déchargement
Commentaires.
© La définition d’un plongement donnée en page 712 utilise des segments de
droite pour les arêtes. Une autre définition classique utilise des chemins non
nécessairement rectilignes, mais il s’avère que les deux définitions sont équivalentes :
c’est le théorème de Fary. On utilise de manière implicite ce fait en question a)(i)
quand on triangule la face extérieure.
© On peut étendre la définition de plongement à d’autres surfaces compactes
même non orientables. On peut montrer en utilisant des arguments similaires
mais plus évolués que la quantité |S| − |A| + |F | reste un invariant qui dépend du
genre de la surface considérée.
© La formule d’Euler peut être démontrée de nombreuses manières, par exemple
par récurrence sur les sommets, arêtes ou encore faces.
© La méthode de déchargement présentée ici a de nombreuses applications. Elle
est notamment utilisée pour montrer que tout graphe d’une certaine famille (par
exemple planaire) contient certaines configurations. Ces résultats sont alors utilisés
pour prouver inductivement des théorèmes de coloration ou de décomposition de
graphes (voir les questions ci-après pour un exemple). C’est par exemple la base
du célèbre théorème des quatre couleurs 41 .
© Le résultat de l’équation (1) est un grand classique de théorie des graphes et
est connu comme le « lemme des poignées de main ».
© La formule de la question b)(i) peut aussi s’obtenir par déchargement, en
donnant un poids initial de −2(a + b) aux sommets et aux faces, et de 2(a + b)
aux arêtes. On redistribue alors le poids de chaque arête en donnant a à chaque
sommet qu’elle contient, et b à chaque face incidente.
© Les fullerènes trouvent des applications en chimie du carbone et en biologie :
c’est notamment la structure des nanotubes de carbones et de certains virus.
Lorsque les faces pentagonales sont deux à deux disjointes, le résultat de la
question b)(iii) montre que le fullerène en question a au moins 60 sommets. Il
existe un tel fullerène (c’est le graphe aisément reconnaissable à la surface des
ballons de football).
© L’étude des graphes planaires a donné lieu à de nombreux résultats et conjec-
tures. Leur structure permet par exemple d’obtenir de meilleurs algorithmes pour
résoudre ou approximer les problèmes classiques de théorie des graphes. Un des
exemples les plus extrêmes est fourni par la détermination de la plus grande clique,
qui est un problème NP-complet en général, mais résoluble en temps polynomial
dans les graphes planaires.
© L’équation de la question b)(ii) reliant p, q et |A| est à rapprocher de l’équation
fondamentale du Développement 45, qui détermine aussi les (groupes d’isométries
des) polyèdres réguliers. En particulier, les cinq cas distingués ici correspondent
aux trois cas présentés dans ce développement (quitte à échanger p et q). Cet
échange peut se justifier grâce à la notion de graphe dual : le dual d’un graphe
planaire G est le graphe dont les sommets sont les faces de G, et deux sommets
41. Tout graphe planaire admet une coloration propre à quatre couleurs.
736
Théorie des graphes
Questions.
1. Montrer que la procédure de triangulation décrite en question a)(i) se termine.
2. Montrer que si S est un polyèdre régulier, il existe une projection stéréogra-
phique produisant un plongement planaire du graphe associé.
3. Montrer que tout graphe connexe simple dont tous les sommets ont degré 2 est
un cycle.
4. Montrer que dans un graphe planaire, on a
X
`(f ) = 2|A|.
f ∈F
737
116. Problème du voyageur de commerce
2 6
3 4 5 7
42. Si H est un sous-graphe de G, on note ω(H) la somme des poids de ses arêtes. Si C est un
cycle, on note ω(C) la somme des poids de ses arêtes (comptées avec multiplicité).
738
Théorie des graphes
Correction.
a) (i) Si e est une arête de γ ∗ , alors γ ∗ \ {e} est un arbre couvrant de G.
Comme T est un arbre couvrant minimal, on a
2 6
3 4 5 7
739
116. Problème du voyageur de commerce
Les autres étapes remplacent les arêtes 51 et 16 par 56, et 76 et 61 par 71.
Chacun de ces remplacements fait diminuer le poids de M puisque l’inégalité
triangulaire assure que ω(uw) 6 ω(uv) + ω(vw). On a donc bien ω(C) 6 ω(M ).
(iii) Dans le cycle M , chaque arête de T est parcourue exactement deux fois.
Ainsi, ω(M ) = 2ω(T ), d’où, par la question précédente :
Le calcul d’un arbre couvrant minimal peut s’effectuer par l’algorithme de Prim ou
de Kruskal en temps polynomial. L’algorithme de parcours en profondeur utilise
lui aussi un temps polynomial. Ainsi, Approx(G, ω) est bien un algorithme de
2-approximation de PVCE en temps polynomial.
b) (i) Supposons que G a un cycle hamiltonien γ. Alors γ est aussi un cycle
hamiltonien dans H. Par définition de la pondération ω, chaque arête de γ a
poids 1 dans H, d’où ω(γ) = |S|. De plus, comme toute tournée optimale de H
utilise au moins |S| arêtes, et que chaque arête a un poids au moins 1, le poids
d’une tournée optimale est au moins |S|. Ainsi, γ est une tournée optimale de H.
Supposons maintenant que G n’a pas de cycle hamiltonien. Soit γ ∗ une tournée
optimale de H. Par hypothèse, γ ∗ contient une arête qui n’est pas dans A (autre-
ment γ ∗ fournit un cycle hamiltonien dans G). Ainsi, comme chacune des autres
arêtes de γ ∗ a un poids positif, on obtient ω(γ ∗ ) > ρ|S| + 1, ce qui est le résultat
attendu.
(ii) Supposons qu’il existe une ρ-approximation Aρ de PVC en temps polynomial.
On montre alors qu’il existe un algorithme polynomial pour résoudre le problème
du cycle hamiltonien.
Étant donné un graphe G, on construit le graphe complet pondéré H décrit à la
question précédente, et on applique l’algorithme Aρ sur H. On répond alors « oui »
si et seulement si le chemin hamiltonien fourni par Aρ est de poids au plus ρ|S|.
740
Théorie des graphes
Cycle Hamiltonien
?
G H γ ω(γ) 6 ρ|S| oui
traduction Aρ non
Commentaires.
© Le problème PVC a été introduit au XIXe siècle par Hamilton et Kirkman. Il a
ensuite été étudié d’un point de vue algorithmique dans les années 1930. À cette
époque, il était déjà difficile d’obtenir des solutions particulières pour des instances
(mêmes petites) de la vie réelle, au point que résoudre une instance particulière
faisait alors l’objet de publications. Les premiers algorithmes d’approximation
datent des années 1960. Enfin, la preuve de NP-complétude de ce problème par
Karp date de 1972.
© On a considéré ici la version « optimisation » du problème PVC, c’est-à-dire
qu’on veut trouver (le coût d’) une tournée optimale. Rappelons que la complexité
de ce type de problèmes est définie comme la complexité du problème de décision
associé (voir page 863) : étant donné un entier k, existe-t-il une tournée optimale
de coût au plus k ?
© Étant donné un problème d’optimisation NP-complet, il est tentant de chercher
des algorithmes d’approximation polynomiaux. En effet, d’une part ces algorithmes
permettent d’obtenir des solutions approchées à des instances de la vie courante
(par exemple, pour PVC qui est utile aux entreprises de livraison, ou pour des
problèmes de coloration utiles pour la création d’emplois du temps, etc.). D’autre
part, ils permettent aussi d’obtenir des premières bornes utilisables par des
approches exhaustives de type branch and bound.
Comme on l’a vu ici, il n’est pas toujours possible d’obtenir des algorithmes
d’approximation polynomiaux. Cela a conduit à l’introduction de certaines classes
de complexité (APX, PTAS, EPTAS, etc.), qui classifient les problèmes selon s’il
741
116. Problème du voyageur de commerce
Questions.
1. Quelle est la complexité de l’algorithme d’approximation de la question a)(iii) ?
2. Montrer que le problème du chemin hamiltonien et PVC sont NP-complets.
3. Donner un algorithme de programmation dynamique résolvant PVC et de
complexité O(2n n2 ) où n est le nombre de sommets de l’instance.
4. On note PVCO la version orientée du problème PVC, c’est-à-dire où le graphe G
est orienté et contient tous les arcs possibles. Montrer que PVC et PVCO se
réduisent l’un à l’autre en temps polynomial.
Indication : pour la réduction de PVCO à PVC, on pourra remplacer chaque
sommet u de G par deux jumeaux u, ū reliés par une arête de faible poids. Pour
chaque arc uv de G, l’arête uv̄ recevra le poids de l’arc uv. Enfin toute arête uv
ou ūv̄ recevra un grand poids.
5. Montrer que l’algorithme glouton fournit une 2-approximation du problème de
couplage maximum.
742
Théorie des graphes
S’inscrire à l’agrégation
Préparer les écrits
Le tri topologique est un tri d’un ensemble muni d’un ordre partiel, il entre donc
naturellement dans la leçon 903 dédiée au problème du tri. L’utilisation d’un graphe
pour représenter les données de notre problème et d’un parcours en profondeur
pour trier notre ensemble de données permet le placement de ce développement
dans la leçon 925. Cet algorithme a la particularité de ne pas avoir recours à un
invariant de boucle pour montrer sa correction, ce qui en fait une belle illustration
de la leçon 927.
743
117. Tri topologique
Correction.
a) On peut donner comme ordre possible :
Algorithme 26 : TriTopo(G).
Entrée : un graphe orienté acyclique G = (S, A).
Sortie : une liste L constituée des sommets de G telle que si uv ∈ A, alors
u apparaît avant v dans L.
1 L←[]
2 Couleur ← tableau indexé par S et initialisé à la valeur « blanc »
3 pour u ∈ S faire
4 si Couleur[u] = blanc alors
5 Visite(u)
6 renvoyer L
Algorithme 27 : Visite(u).
1 Couleur[u] ← gris
2 pour uv ∈ A faire
3 si Couleur[v] = blanc alors
4 Visite(v)
5 Couleur[u] ← noir
6 L ← u :: L
744
Théorie des graphes
Commentaires.
© Les listes que l’on crée grandissent par la gauche. En effet, on ajoute un élément
en tête de liste par l’opération L ← u :: L.
© Il n’y a pas unicité de la solution a priori. Cet algorithme donne donc une
solution possible.
© L’algorithme prend en entrée un graphe acyclique. On pourrait faire un test
pour savoir si le graphe est bien acyclique. En effet, dans la boucle pour de
l’algorithme Visite, si le sommet v est gris, alors il existe un chemin de v à u et
comme on est en train de considérer l’arc uv, le graphe n’est pas acyclique.
© Il existe diverses applications du tri topologique. Par exemple, le logiciel Make
utilise ce tri pour la compilation automatique, afin de compiler dans un bon ordre
différents fichiers qui dépendent les uns des autres. Les gestionnaires de paquets
utilisent aussi ce tri pour l’installation de logiciels pour lesquels il faut installer
successivement des paquets dans un bon ordre.
745
117. Tri topologique
Questions.
1. Montrer le point (iii) de la question d).
2. Donner la solution que l’algorithme TriTopo renvoie sur l’exemple de l’énoncé
en partant de « S’inscrire à l’agrégation ».
X X
3. Montrer que 1 = |A|.
u∈S uv∈A
4. Montrer que tout graphe orienté sans cycle admet une source et un puits.
5. Que calcule l’algorithme suivant ?
Algorithme 28 : Mystère(G).
Entrée : un graphe G = (S, A) orienté.
1 pour uv ∈ A faire
2 d[v] ← d[v] + 1
3 tant que il existe u tel que d[u] = 0 faire
4 L ← u :: L
5 d[u] ← d[u] − 1
6 pour uv ∈ A faire
7 d[v] ← d[v] − 1
746
Théorie des graphes
747
118. Séquençage ADN et graphe de De Bruijn
Correction.
a) (i) Supposons que G soit eulérien et soit γ un circuit eulérien de G, c’est-
à-dire un circuit passant une et une seule fois par chaque arc de G. Soit v un
sommet de G. À chaque arc entrant uv de v, on peut associer un arc sortant qui
est l’arc qui le suit dans γ. Comme γ contient exactement une fois chaque arc,
cette application est bijective. On obtient donc bien d+ (v) = d− (v), c’est-à-dire
que v a autant de prédécesseurs que de successeurs.
(ii) Supposons que G est fortement connexe et que d+ (v) = d− (v) pour tout
sommet v de G. Sans perte de généralité, on peut supposer que G contient au
moins un arc.
Soit γ un chemin de G passant au plus une fois par chaque arc, et de longueur
maximale ` > 0. Notons u le premier sommet de γ et H le graphe obtenu à partir
de G en supprimant tous les arcs de γ. On va montrer d’une part que γ est un
circuit, puis d’autre part qu’il est eulérien.
• Si γ n’est pas un circuit, il sort une fois de plus de u qu’il n’y entre, autrement
dit on a d− +
H (u) = dH (u) + 1 > 0. Ainsi, u admet un prédécesseur v dans H.
En particulier, {vu} ∪ γ forme un chemin de G de longueur ` + 1 passant au
plus une fois par chaque arc, ce qui contredit la maximalité de `.
• Supposons que γ n’est pas eulérien, c’est-à-dire que G contient un arc vw
non parcouru par γ. Alors, comme G est fortement connexe, il existe un
chemin γ 0 de w à u dans G (voir Figure 3.24). Soit w0 le premier sommet
de γ 0 parcouru par γ, et v 0 son prédécesseur dans γ 0 . En particulier, v 0 w0
n’apparaît pas dans γ. De plus, comme γ est un circuit, on peut permuter
circulairement ses arcs de sorte que γ commence et finisse en w0 . On obtient
alors une contradiction car {v 0 w0 } ∪ γ est un chemin de G de longueur ` + 1
passant au plus une fois par chaque arc.
w0 v0 w v
748
Théorie des graphes
Algorithme 29 : Degrés(G).
Entrée : le graphe G représenté par une liste de couples L.
Sortie : la liste triée des sommets avec leurs degrés entrant et sortant.
1 D ← []
2 pour (a, b) ∈ L faire
3 si D contient un triplet (a, d+ , d− ) alors
4 d+ ← d+ + 1
5 sinon
6 Insérer (a, 1, 0) dans D
7 si D contient un triplet (b, d+ , d− ) alors
8 d− ← d− + 1
9 sinon
10 Insérer (b, 0, 1) dans D
11 renvoyer D
749
118. Séquençage ADN et graphe de De Bruijn
Commentaires.
© Le problème consistant à déterminer si un graphe admet un circuit ou un
chemin eulérien est nommé d’après Euler, qui aurait introduit ce concept pour
résoudre le problème des ponts de Königsberg. La question était de savoir si on
pouvait traverser la ville en empruntant une et une seule fois chacun de ses ponts.
© Le problème du chemin hamiltonien est similaire : on demande cette fois de
passer une et une seule fois par chaque sommet. Contrairement au problème
précédent, tester si un graphe est hamiltonien est un problème NP-complet.
Cette situation n’est pas rare en théorie des graphes (voir page 863). On peut
par exemple citer le problème du plus court chemin (polynomial) et du plus
long chemin ne repassant pas deux fois par le même sommet (NP-complet), le
problème de coupe minimale (polynomial par le théorème flot-max/coupe-min)
et de coupe maximale (NP-complet), ou enfin le problème de 3-colorabilité des
750
Théorie des graphes
Questions.
1. Lorsque le multi-ensemble est valide, y a-t-il unicité du brin d’ADN associé ?
2. Caractériser les graphes eulériens non orientés.
3. Donner un algorithme permettant de reconstituer un brin d’ADN possible à
partir d’un multi-ensemble valide.
Indication : s’inspirer de la preuve de la caractérisation des graphes eulériens.
4. Est-il préférable d’utiliser une représentation par matrice d’adjacence ou listes
d’adjacences (éventuellement triées) dans la question b) ? Que devient l’algorithme
de la question c) dans ce cas ?
5. Comparer l’efficacité d’un cadenas mécanique (nécessitant de valider chaque
essai) et d’un digicode d’immeuble (ne nécessitant de pas de valider à chaque
essai), lorsque la combinaison est une suite de k = 4 symboles sur un alphabet
possédant n = 10 lettres. Généraliser lorsque k et n sont quelconques.
751
Langages réguliers et algébriques
La théorie des langages a pris son essor dans les années 50, grâce aux travaux
fondateurs de Chomsky et Kleene. La hiérarchie de Chomsky est une classification
des langages formels en plusieurs classes d’expressivité de plus en plus faible. Les
langages de type 0 correspondent aux langages récursivement énumérables. Les
langages de type 1 sont les langages contextuels, qui ne figurent pas au programme
de l’agrégation, à la différence des langages de type 2 (algébriques) et de type 3
(réguliers 43 ). On peut noter qu’il existe des classes de langages intermédiaires,
comme les langages récursifs (entre le type 0 et 1).
Bien que la hiérarchie de Chomsky soit motivée par des problèmes de linguistique,
les classes de langages qui y sont décrites tiennent une place importante en
informatique. En effet, même si les langages récursivement énumérables sont
aussi expressifs que les machines de Turing qui les reconnaissent, la plupart des
problèmes de décision y sont indécidables. Ainsi, en pratique, on préfère considérer
des classes moins expressives, mais pour lesquelles on peut effectivement résoudre
les problèmes classiques, comme le problème du mot (qui devient décidable
quand on se restreint aux langages algébriques ou réguliers). Dans cette voie, une
application majeure est fournie par les processus de compilation, qui utilisent des
langages réguliers lors de la phase d’analyse lexicale et résolvent le problème du
mot pour des langages algébriques lors de la phase d’analyse syntaxique.
D’un point de vue théorique, on peut observer que les classes de langages de la
hiérarchie de Chomsky sont robustes : elles possèdent souvent de nombreuses
propriétés de clôture (opérations booléennes, résiduels, morphismes, etc.) et
admettent plusieurs définitions équivalentes utilisant des formalismes variés. Par
exemple, les langages de type 0 sont ceux acceptés par des machines de Turing, et
les langages algébriques et réguliers sont eux aussi reconnus par certains types
d’automates.
La diversité des formalismes et de leurs utilisations fait que les conventions et
notations dans ce domaine varient d’un auteur à l’autre, sans qu’aucune ne se
dégage comme meilleure que les autres. Sans se substituer à un cours, cette
section préliminaire a pour but de présenter les notations considérées par la suite
lorsqu’on manipule des langages réguliers ou algébriques, ainsi que de fournir
quelques remarques culturelles.
Dans ce qui suit, sauf mention contraire, Σ désigne un alphabet fini, Σ∗ est
l’ensemble des mots sur Σ et ε est le mot vide.
43. On utilisera de façon interchangeable la terminologie « régulier » et « rationnel ».
1 Langages réguliers
L’étude des langages réguliers remonte à l’article fondateur de Kleene en 1951,
où le célèbre théorème éponyme y est démontré : les langages réguliers sont (de
manière équivalente) ceux représentés par une expression régulière ou reconnus
par un automate. Ces deux représentations des langages réguliers sont les seules
explicitement au programme de l’agrégation. Cependant, il est à noter qu’il en
existe d’autres faisant intervenir différents formalismes, notamment logiques ou
algébriques :
• les langages réguliers sont ceux reconnus par des monoïdes finis (voir ques-
tions du Développement 119) ;
• les langages réguliers sont les langages des mots satisfaisant une formule de
la logique monadique du second ordre.
Expressions régulières
Définition 54 (Expression régulière)
L’ensemble des expressions régulières est défini inductivement par les règles
suivantes.
• Mot vide : ε est une expression régulière représentant le langage {ε} ;
• Alphabet : pour tout a ∈ Σ, a est une expression régulière représentant le
langage {a} ;
• Union : si E, E 0 sont des expressions régulières représentant des langages L
et L0 , alors E + E 0 est une expression régulière représentant L ∪ L0 ;
• Concaténation : si E, E 0 sont des expressions régulières représentant des
langages L, L0 , alors E ·E 0 (ou EE 0 ) est une expression régulière représentant
le langage {uu0 : u ∈ L, u0 ∈ L0 } ;
• Étoile de Kleene (ou itération) : si E est une expression régulière représentant
un langage L, alors E ∗ est une expression régulière représentant le langage
{u1 · · · un : n > 0, ui ∈ L}.
Définition 55 (Langage régulier)
Un langage L est régulier s’il existe une expression régulière E qui le représente.
On note alors L = L(E).
Automates
Définition 56 (Automate)
Un automate A est un quintuplet (Q, Σ, I, F, δ) où :
• Q est un ensemble fini d’états,
• Σ est un alphabet,
• I ⊂ Q est l’ensemble des états initiaux,
• F ⊂ Q est l’ensemble des états finaux,
• δ ⊂ Q × Σ × Q est l’ensemble des transitions.
754
Langages réguliers et algébriques
Un automate (Q, Σ, I, F, δ) est représenté comme un graphe orienté dont les arcs
sont étiquetés par des lettres de Σ. Chaque état de Q correspond à un sommet,
chaque transition (q, a, q 0 ) de δ correspond à un arc de q à q 0 étiqueté par a. Enfin
les états initiaux et finaux sont indiqués respectivement par des arcs entrants sans
prédécesseur et sortants sans successeur (voir Figures 3.25 et 3.26).
Définition 57 (Calcul, langage reconnu)
Soit w ∈ Σ∗ et A = (Q, Σ, I, F, δ) un automate.
• Un calcul de A sur w est une suite d’états q0 , . . . , q|w| telle que q0 ∈ I et
pour tout i ∈ J1, |w|K, on a (qi−1 , wi , qi ) ∈ δ. Il est acceptant si q|w| ∈ F .
• Le mot w est accepté par A s’il existe un calcul acceptant de A sur w.
• Le langage reconnu par A est l’ensemble L(A) des mots acceptés par A.
a
(aa)∗ 0 1
a
Lorsque A n’est pas complet, ces définitions restent valides, mais δ et δ ∗ sont
alors des fonctions partielles.
755
Proposition 4 (Déterminisation, complétion)
Soit A = (Q, Σ, I, F, δ) un automate. Il existe un automate déterministe
complet A0 reconnaissant le même langage que A. On peut par exemple
prendre l’automate des parties (voir Figure 3.26)
A0 = 2Q , Σ, {I}, {X ⊂ Q : X ∩ F 6= ∅}, δ 0
où n o
δ 0 (X, a) = q 0 : ∃q ∈ X, (q, a, q 0 ) ∈ δ .
a a, b a, b
a, b 0 b 0 01 1 2 12
b
a
b a a, b
a
1
02 012 a a, b ∅
a, b b
2
Figure 3.26 – Un automate et son automate des parties (dont les états
« inutiles » sont grisés). Cet exemple se généralise en un automate à n + 1 états
dont l’automate des parties a 2n états « utiles ».
756
Langages réguliers et algébriques
q ∼A q 0 ⇐⇒ {w ∈ Σ∗ : δ ∗ (q, w) ∈ F } = {w ∈ Σ∗ : δ ∗ (q 0 , w) ∈ F }.
757
afin de déduire des conditions nécessaires pour qu’un langage soit régulier. Utiliser
sa contraposée constitue ainsi une approche couramment employée pour montrer
qu’un langage n’est pas régulier. Ce type d’argument « de pompage » est très
répandu en théorie des langages. Un exemple d’utilisation est fourni dans le
Développement 121.
Proposition 6 (Lemme de l’étoile)
Soit L un langage régulier. Alors il existe un entier N > 0 tel que tout mot u
de L vérifiant |u| > N se décompose sous la forme u = xyz avec y 6= ε et pour
tout n ∈ N, xy n z ∈ L.
2 Langages algébriques
Dans cette partie, on s’intéresse aux langages algébriques, c’est-à-dire reconnus
par une grammaire. Il s’agit d’une classe de langages plus expressive que les
langages réguliers, mais pour laquelle certains problèmes (comme le problème du
mot étudié dans les Développements 122, 123) restent décidables, ce qui n’est
plus nécessairement le cas pour des modèles plus expressifs, comme les langages
acceptés par des machines de Turing.
Tout comme les langages réguliers, les langages algébriques sont reconnus par
différents formalismes équivalents. Le seul figurant explicitement au programme
de l’agrégation est celui des grammaires algébriques, qui sont en quelque sorte aux
langages algébriques ce que les expressions régulières sont aux langages réguliers.
L’analogue de la notion d’automate, qui permet de reconnaitre les langages
algébriques, est celle d’automate à pile.
Définition 62 (Grammaire)
Une grammaire algébrique (ou hors-contexte) est un quadruplet (N , T , S, R) où
• N est un ensemble de non-terminaux ;
• T est un ensemble de terminaux ;
• S ∈ N est l’axiome ;
• R est un ensemble de règles de productions de la forme N → w où N ∈ N
et w ∈ (N ∪ T )∗ .
Remarque : on utilisera en général des lettres minuscules pour noter les terminaux,
et majuscules pour les non-terminaux. De plus, si N → u et N → v sont des
règles de R, on notera généralement N → u | v ∈ R.
Exemple : les quadruplets G1 et G2 suivants sont des grammaires :
758
Langages réguliers et algébriques
L(G) = {u ∈ T ∗ : S →∗ u}.
On en déduit que L(G1 ) = {an bn : n ∈ N}. Il est à noter que ce langage est
un exemple classique de langage algébrique non régulier.
• Les mots de L(G2 ) sont appelés expressions arithmétiques. Il s’agit des
sommes de termes, où chaque terme est un produit de facteurs, et où chaque
facteur est soit v, soit une expression arithmétique entre parenthèses. Il
s’agit d’un langage très souvent utilisé pour illustrer les techniques d’analyse
syntaxique.
759
forme plus facilement manipulable, afin de l’analyser, l’optimiser et finalement le
traduire. Cette représentation est appelée arbre de syntaxe abstraite, qui constitue
la version pratique de l’objet théorique suivant.
Définition 65 (Arbre de dérivation)
Un arbre de dérivation d’une grammaire G est un arbre étiqueté T tel que :
• la racine est étiquetée par l’axiome ;
• les feuilles sont étiquetées par des terminaux ;
• les nœuds internes sont étiquetés par des non-terminaux ;
• pour tout nœud interne étiqueté par N , si w est la concaténation des
étiquettes de ses fils (lus de gauche à droite) alors N → w est une règle
de G.
En lisant les étiquettes des feuilles de T dans l’ordre d’un parcours en profondeur,
on obtient un mot w ∈ L(G). On dit que T est un arbre de dérivation de w.
S E
a S b E + T
a S b T T × F
a S b F F v
ε v v
Définition 66 (Ambiguité)
Une grammaire G est ambiguë s’il existe un mot de L(G) possédant au moins
deux arbres de dérivation distincts.
Un langage algébrique est inhéremment ambigu si toutes les grammaires qui le
reconnaissent sont ambiguës.
760
Langages réguliers et algébriques
S S
S + S S + S
a S + S S + S a
a a a a
761
Langages réguliers et algébriques
a) Soient u, v ∈ Σ∗ et a ∈ Σ.
(i) Montrer que si u @ v, alors σ(u) 6 σ(v).
(ii) Montrer que σ(ua) 6 σ(u) + 1.
(iii) En déduire que σ(ua) = σ(Mσ(u) a).
b) Soit A = (Q, Σ, I, F, δ) l’automate déterministe complet défini par les
ensembles Q = J0, kK, I = {0}, F = {k} et, pour tout q ∈ Q et a ∈ Σ, la
fonction de transition est donnée par δ(q, a) = σ(Mq a).
(i) Montrer que pour tout mot u ∈ Σ∗ , on a δ ∗ (0, u) = σ(u). En déduire que
L(A) = Σ∗ M .
(ii) Montrer que si i, j ∈ Q vérifient i > j, alors le mot mi+1 · · · mk est
accepté dans A à partir de i, mais pas à partir de j. En déduire que A
est minimal.
c) En déduire un algorithme qui, après un pré-traitement en temps polynomial
en k, permet de déterminer si M est un facteur de T en temps O(n).
Correction.
a) (i) Si u @ v, tout suffixe de u est un suffixe de v. En particulier, on a
Mσ(u) @ u @ v,
763
119. Recherche de motif
764
Langages réguliers et algébriques
Commentaires.
© L’algorithme naïf de recherche de motif consiste à parcourir les positions i
dans T et tester si pour tout j ∈ J1, kK, on a mj = ti+j . Cet algorithme est alors
de complexité temporelle O(kn) dans le pire des cas.
Pour améliorer cet algorithme, on utilise l’observation suivante : à chaque fois que
la condition mj = ti+j n’est pas satisfaite (c’est-à-dire qu’on échoue à trouver M
à la position i dans T ), on peut parfois utiliser la valeur de j pour recommencer
la recherche à une position i + sj au lieu de i + 1. Cette idée est celle utilisée
dans l’algorithme de Knuth-Morris-Pratt fonctionnant en temps O(n + k). L’idée
consiste à effectuer un pré-traitement calculant les sj pour tout j ∈ J1, kK.
L’algorithme présenté ici utilise aussi cette approche, mais de manière moins
évidente. Lors de son exécution, lorsqu’on lit la lettre ti à partir de l’état q dans
l’automate A, on teste si Mq ti est un suffixe que t1 · · · ti , ce qui revient en fait à
tester si Mq ti est un facteur de T commençant à la position i − q. Si ti = mq+1 ,
on a σ(Mq ti ) = q + 1 et la recherche de M dans T à la position i − q se poursuit.
Sinon, on sait que M n’est pas un facteur de T commençant à la position i − q.
On connaît en revanche σ(Mq ti ), à savoir la taille du plus grand préfixe de M
dans Mq ti . On sait alors qu’on peut chercher M à la position i − σ(Mq ti ) au lieu
de i − q + 1. Ainsi, les sj de l’algorithme de Knuth-Morris-Pratt peuvent en fait
être déduits des transitions de l’automate A.
© Lorsqu’on considère la complexité d’algorithmes de recherche de motifs, il est
plus pratique de considérer le problème où on cherche toutes les occurrences du
motif dans le texte. En effet, ceci permet de considérer la complexité dans le
meilleur et le pire cas sans se préoccuper de la répartition des occurrences du motif
dans le texte. L’algorithme présenté ici est alors toujours en O(n + P (k)) où P
est un polynôme ne dépendant pas de n. L’algorithme de Knuth-Morris-Pratt
utilise une complexité en O(n + k) dans tous les cas. De plus, ce dernier est
moins gourmand en mémoire car on doit seulement retenir les sj au lieu de tout
l’automate A.
Parmi les nombreux algorithmes connus pour résoudre le problème de recherche
de motifs, un autre exemple est fourni par l’algorithme de Boyer-Moore. Sa
complexité est de l’ordre de O( nk ) dans le meilleur cas et de O(n + k) dans le pire.
765
119. Recherche de motif
Questions.
1. Justifier que l’automate A est déterministe et complet.
2. Construire l’automate A sur l’alphabet {a, b} quand M = aba et M = ak .
3. Donner l’algorithme construisant la table des transitions de A. Quelle est sa
complexité ?
4. Modifier l’algorithme pour rechercher toutes les occurrences de M dans T .
5. Comment modifier l’algorithme pour chercher le même motif dans plusieurs
textes, plusieurs motifs dans le même texte ?
6. Proposer des structures de données pour représenter des automates détermi-
nistes (resp. non nécessairement déterministes).
7. Soit L un langage sur l’alphabet Σ et u ∈ Σ∗ . Le résiduel (à gauche) u−1 L est
défini par {v ∈ Σ∗ | uv ∈ L}. Montrer qu’un langage est rationnel si et seulement
si l’ensemble {u−1 L | u ∈ Σ∗ } est fini.
8. Montrer que l’ensemble des résiduels d’un langage rationnel est en bijection
avec l’ensemble des états de son automate minimal.
9. En déduire l’unicité (à renommage des états près) d’un automate déterministe
complet minimal en nombre d’états reconnaissant un langage donné. Est-ce
toujours vrai si on ne requiert plus que cet automate soit déterministe ?
766
Langages réguliers et algébriques
767
120. Problème de séparation par automate
CnfSat
ϕ tr(ϕ) oui
traduction PSA non
768
Langages réguliers et algébriques
(iv) Soit n o
T4 = an+i ban+v+i b : i ∈ J0, v − 1K .
Correction.
a) Si A est un automate déterministe à k états et w est un mot de taille n, on
peut déterminer en temps polynomial en k et n si w est accepté ou non par A.
Ainsi, on peut tester en temps polynomial en |S| et |T | si A sépare S de T .
Autrement dit, on peut fournir un certificat polynomial (l’automate A) pour les
instances positives (S, T, k) de PSA. Ce problème est donc dans NP.
b) (i) Comme ak ∈ S1 , l’automate A accepte le mot ak . Il existe donc un chemin
a a
q0 −
→ ··· −
→ qk dans A, avec q0 initial et qk final.
Comme A a au plus k états, il existe deux entiers i 6= j tels que qi = qj . On
obtient alors que A reconnaît ak−(j−i) , d’où k − (j − i) = 0, sinon A reconnaitrait
un mot de T1 . On obtient donc i = 0 et j = k, d’où q0 = qk et q1 , . . . , qk sont
deux à deux distincts. Ainsi les transitions étiquetées par a induisent un cycle de
longueur k = n + 2v dans A.
On remarque aussi que pour i ∈ J1, k − 1K, l’état qi ne peut être initial ou final,
autrement A reconnaît ak−i ou ai , qui sont des mots de T1 . Ainsi, q0 est le
seul état initial et le seul état final de A. On peut alors renommer les états en
C0 , . . . , Cn−1 , x0 , . . . , xv−1 , x0 , . . . , xv−1 de sorte que l’automate A soit de la forme
suivante :
769
120. Problème de séparation par automate
a a a a
C0 C1 ··· Cn−2 Cn−1
a a
a a a xv−1 a · · · a
xv−1 ··· x0 x0
b
(ii) • Par l’absurde, supposons que A contient une transition Ci →
− Cj . Alors
le mot ai bak−j est accepté par A via
ai b ak−j
C0 −→ Ci →
− Cj −−−→ C0 .
est un chemin acceptant le mot an+j bak−i ∈ T3 dans A, ce qui est impossible
puisque k − i > 2v.
• Si q = `i avec i 6= v, alors, puisque q 6= x0 ,
an+j b a2v−i
C0 −−−→ `j →
− q −−−→ C0
est un chemin acceptant le mot an+j ba2v−i ∈ T3 dans A, ce qui est aussi
impossible.
Ainsi, toute transition issue de `j et étiquetée par b arrive dans l’état C0 ou x0 .
(iv) Comme pour les questions précédentes, on procède par l’absurde. Sup-
b b
posons que A contient les transitions xi →
− C0 et xi →
− C0 pour un certain
entier i ∈ J0, v − 1K. Alors
an+i b an+v+i b
C0 −−−→ xi →
− C0 −−−−→ xi →
− C0
est un chemin acceptant le mot an+i ban+v+i b ∈ T4 dans A, ce qui est impossible.
b b
Ainsi, A contient au plus une transition parmi xi →
− C0 et xi →
− C0 .
770
Langages réguliers et algébriques
dans A.
D’après b)(ii), q = `j où `j est un littéral de Ci . L’automate A contient donc
b
bien une transition `j →
− C0 avec `j un littéral de Ci .
(vi) Il est facile de constater que les ensembles S := S1 ∪S2 , T := T1 ∪T2 ∪T3 ∪T4
et l’entier k sont calculables en temps polynomial par rapport à ϕ. Il reste à
montrer que la réduction est valide, c’est-à-dire que ϕ est satisfiable si et seulement
si S et T sont séparés par un automate déterministe à au plus k états.
Pour le sens indirect, s’il existe un automate déterministe A à au plus k états
séparant S de T , la question b)(i) permet d’étiqueter ses états par C0 , . . . , Cn−1
et `0 , . . . , `2v−1 .
On définit la valuation v par :
> b
si A contient `i →
− C0 ,
v(`i ) = b
⊥ si A contient `i →
− x0 .
D’après la question b)(iii), v est définie sur toutes les variables x0 , . . . , xv−1 .
Elle est de plus valide par b)(iv). Enfin, d’après b)(ii) et b)(v), la valuation v
satisfait ϕ.
Réciproquement, supposons que ϕ soit satisfaite par une valuation v. On définit
alors un automate A tel que :
• son alphabet est {a, b} ;
• ses états sont C0 , . . . , Cn−1 , `0 , . . . , `2v−1 ;
• C0 est l’unique état initial ;
• C0 est l’unique état final ;
• les transitions étiquetées par a forment un cycle C0 , . . . , Cn−1 , `0 , . . . , `2v−1 , C0 ;
b
• les transitions étiquetées par b sont les Ci →
− `j si `j apparaît dans Ci ,
b b
les `i →
− C0 si v(`i ) = > et les `i →
− x0 si v(`i ) = ⊥.
On peut alors vérifier que A sépare S de T .
Ainsi, l’application tr est bien une réduction en temps polynomial, ce qui assure
que PSA est NP-dur. La question a) assure qu’il est alors NP-complet.
Commentaires.
© Le problème étudié ici est la version de décision d’un problème d’optimisation :
quelle est la taille minimale d’un automate déterministe séparant deux langages
finis ? Informellement, il s’agit de quantifier à quel point les langages sont difficiles
à séparer : à quel point l’automate doit être « expressif » pour séparer les deux
langages ?
771
120. Problème de séparation par automate
772
Langages réguliers et algébriques
Questions.
1. Montrer qu’un langage L est reconnu par une expression régulière n’utilisant
que l’union et la concaténation si et seulement si L est fini.
2. Soient u, v deux mots. On note u ∼ v si pour toute lettre a, elle apparaît autant
de fois dans u que dans v. Montrer que le problème suivant est NP-complet :
(
entrée : deux langages réguliers L1 et L2 ;
sortie : oui s’il existe u1 ∈ L1 et u2 ∈ L2 tels que u1 ∼ u2 , non sinon.
773
121. Universalité d’un automate
w Aw oui
traduction co-UnivAut non
Soit P ∈ R[X] tel que pour tout n ∈ N, la machine M s’arrête en au plus P (n)
étapes sur tout mot de longueur n. On représente une configuration de M par
un mot de taille P (n) + 1, constitué des lettres présentes sur les P (n) cases
utiles du ruban et où on insère l’état courant à gauche de la position de la
tête de lecture. Un calcul de M sur w est représenté par la suite des mots
associés aux configurations, séparés par un nouveau symbole $. Déterminer :
(i) Les mots représentant un calcul de M non acceptant.
(ii) Les mots représentant un calcul de M ne commençant pas sur w.
(iii) Les mots représentant un calcul invalide.
c) En déduire que le problème d’universalité UnivAut est PSpace-complet.
774
Langages réguliers et algébriques
Correction.
a) (i) Soit w un mot non accepté par A et de longueur minimale. Soit B
l’automate des parties de A. Rappelons que B est un automate déterministe et
complet, reconnaissant le même langage que A, et ayant 2n états puisque A en
a n.
Comme w n’est pas accepté par A, il n’est pas non plus accepté par B. Soit γ la
suite d’états obtenue en lisant w dans B. Comme B est déterministe et complet,
cette suite est unique et de taille |w|. Si |w| > 2n , le principe des tiroirs assure
que γ passe deux fois par le même état. Dans ce cas, soit w0 le mot obtenu à partir
de w en enlevant le facteur correspondant au mot lu entre les deux occurrences
de cet état dans γ. On a donc |w0 | < |w|.
Par construction de γ, la lecture de w0 dans B aboutit au même état que w. Ainsi,
le mot w0 est rejeté par B, ce qui contredit la minimalité de w. On a donc bien
l’inégalité |w| 6 2n .
(ii) Une approche naïve consiste à déterminiser A, puis à tester l’existence d’un
chemin d’un état initial à un état non-final. Cependant, ceci ne fournit pas un
algorithme en espace polynomial, car l’automate déterminisé peut avoir une taille
exponentielle. En revanche, on peut construire l’automate des parties à la volée,
et deviner une par une les transitions à prendre pour atteindre un état non-final
(en utilisant du non-déterminisme).
Considérons l’algorithme suivant :
8 renvoyer vrai
775
121. Universalité d’un automate
i=1
P (n)
Σi (Σ \ {#})Σ∗ ∪ ΣP (n)+1 (Σ \ {$})Σ∗ .
[
∪
i=n+1
(iii) La validité d’un calcul peut être testée en observant des contraintes locales,
de manière similaire à la preuve du Théorème de Cook-Levin (voir Dévelop-
pement 124). Dans le cas présent, un calcul est valide si tous les facteurs de
taille P (n) + 4 sont cohérents. Plus précisément, chaque facteur
ABCDΣP (n)−1 B 0
776
Langages réguliers et algébriques
Autrement dit, les calculs invalides sont les éléments d’une union de langages de
la forme
Σ∗ ABCDΣP (n)−1 B 0 Σ∗ ,
où A, B, C, D, B 0 ne vérifient pas l’une des conditions précédentes.
c) Soit Aw un automate reconnaissant l’union des langages définis en question b).
On peut facilement vérifier que Aw peut être construit en temps polynomial à
partir des expressions régulières ci-avant. Il reste à montrer l’équivalence
w ∈ L ⇐⇒ L(Aw ) 6= Σ∗ .
Commentaires.
© On a préféré montrer ici que UnivAut est co-PSpace-dur. Ce détour est justifié
par le fait que la validité d’un calcul est équivalente à une conjonction de conditions
(la première configuration contient w, chaque configuration est obtenu à partir
de la précédente en effectuant un pas de calcul, et la dernière configuration
contient un état final), ce qui se traduit par une intersection des (complémentaires
des) langages décrits en question b). Or, obtenir un automate reconnaissant
l’intersection de deux langages nécessite de passer par l’automate produit, ce
qui pourrait poser problème pour obtenir une réduction en temps polynomial
si on considère trop d’intersections. Il est alors plus pratique de considérer des
complémentaires : les intersections deviennent des unions, et cette opération est
nettement plus facile à mettre en œuvre sur des automates.
On aurait pu se passer de cette étape intermédiaire, et montrer directement la
PSpace-complétude de UnivAut, mais ceci nécessite de construire explicitement
(et en temps polynomial) un automate reconnaissant l’intersection des complé-
mentaires des langages de la question b), ce qui serait beaucoup plus technique et
cacherait l’idée de la preuve.
© Les expressions régulières étendues sont obtenues en permettant l’utilisation
de l’opération de complément dans les expressions régulières. Ces expressions
777
121. Universalité d’un automate
Questions.
1. Expliquer comment représenter un ensemble E ⊂ J1, nK avec au plus n bits.
2. Montrer que le problème d’universalité d’un automate déterministe fini peut
être résolu en temps polynomial.
3. Montrer que le problème d’équivalence (deux automates donnés reconnaissent-
ils le même langage ?) est PSpace-complet. Et si les automates sont déterministes ?
4. Montrer que le problème suivant est PSpace-complet : existe-t-il un mot accepté
par n automates donnés ? et si les n automates sont déterministes ?
5. Justifier qu’on peut construire en temps polynomial un automate reconnaissant
le langage décrit par une expression régulière donnée. Donner un automate
reconnaissant les langages des questions b)(i) et (ii).
6. Montrer que NPSpace = PSpace = co-PSpace.
7. Montrer que pour tout automate donné, il existe un automate reconnaissant le
même langage et ayant un nombre minimal d’états. Cet automate est-il unique ?
Et dans le cas déterministe ?
778
Langages réguliers et algébriques
Ei,j = {A ∈ N : A →∗ wi · · · wj } .
Ei,i = {A ∈ N : A → wi ∈ R}.
779
122. Algorithme de Cocke-Younger-Kasami
Correction.
a) La grammaire étant sous forme de Chomsky, les non-terminaux ne peuvent
pas se dériver en le mot vide. En particulier, en utilisant les règles A → BC,
on obtient des mots d’au moins deux lettres. Ainsi le seul moyen pour qu’un
non-terminal A ∈ N engendre la lettre wi est d’avoir une règle A → wi dans la
grammaire G. Ce qui montre immédiatement le résultat voulu.
b) Montrons l’inclusion indirecte. Soient B1 , B2 ∈ N et k ∈ Ji, j − 1K tels que
B1 →∗ wi · · · wk , B2 →∗ wk+1 · · · wj et A → B1 B2 ∈ R.
E1,1 · · · E1,i · · · E1,j · · · E1,n
.. .. .. ..
. . . .
Ei,i → Ei,j · · · Ei,n
..
..
. ↑ .
Ej,j · · · Ej,n
.. ..
∅ . .
En,n
780
Langages réguliers et algébriques
12 renvoyer S ∈ E1,n
Pour implémenter les ensembles Ei,j , on voudrait une structure de données qui
permette d’ajouter les non-terminaux et vérifier si des non-terminaux sont dans
un certain ensemble Ei,j en temps constant. Pour faire cela, on peut construire
une matrice qui contient en case (i, j) un tableau indexé par les non-terminaux et
valant « vrai » si le non-terminal est dans Ei,j et « faux » sinon.
La complexité temporelle de l’algorithme est donc en O(n3 |R|) et sa complexité
spatiale est en O(n2 |N |).
Commentaires.
© Dans notre problème de départ, on a une grammaire sous forme normale de
Chomsky. Pour éviter cette précondition, il faut savoir transformer n’importe
quelle grammaire en grammaire sous forme de Chomsky. Pour faire cela, une
méthode consiste à suivre ces transformations :
• on remplace tous les terminaux a en des nouveaux non-terminaux Aa . Puis
on ajoute les règles Aa → a ;
781
122. Algorithme de Cocke-Younger-Kasami
Questions.
1. Que se passe-t-il si on exécute l’algorithme sur le mot vide ε ?
2. Donner un algorithme qui vérifie si ε appartient au langage engendré par une
grammaire G ou non.
3. Puisqu’on considère un mot w et une grammaire G, quelle est la taille de
l’entrée ? Cela change-t-il la complexité ?
4. Expliciter l’algorithme de mise sous forme normale de Chomsky.
5. Après avoir mis sous forme normale de Chomsky la grammaire suivante G =
(Σ, N , T , S, R) où Σ = {a, b, c, d}, N = {S, A, B, C}, T = Σ et R est décrit par
S → AB | Ca
A → aAb | ε
B → bB | b
C → cC | d,
appliquer l’algorithme CYK afin de savoir si les mots aabbbb, ccdddda et aabb sont
dans L(G). Comprendre l’intérêt de l’analyse LL(1), voir Développement 123.
6. Écrire la boucle « Pour (i, j) sur la d-diagonale supérieure » avec seulement
des boucles « Pour · · · allant de · · · à · · · ».
7. En réduisant le problème de Post, montrer l’indécidabilité de Inter, Univ et
Egal.
782
Langages réguliers et algébriques
Premier = {(~
α, a), (~
α, +), (~
α, ./)}.
~ →n aβ~ alors a ∈ P (~
« si α α) » et ~ →n ε alors ./ ∈ P (~
« si α α). »
783
123. Caractérisation de Premier en analyse LL(1)
L’analyse LL(1) est une analyse syntaxique descendante sur une grammaire al-
gébrique dite LL(1). Cette analyse repose en partie sur le calcul de la fonction
Premier, qui est utilisée lors de la construction de la table d’analyse LL(1). Ce
développement entre donc naturellement dans la leçon 923.
Correction.
a) Montrons que Premier vérifie les propriétés (i) − (vi).
(i) Comme a →0 a, on a a ∈ Premier(a).
(ii) Comme ε →0 ε, on est dans le deuxième cas de la définition de Premier et
ainsi ./ ∈ Premier(ε).
(iii) Supposons que N → α1 α2 · · · αn . Soit a ∈ Premier(α1 · · · αn ). Il existe donc
β~ ∈ (N ∪ T )∗ tel que α1 · · · αn →∗ aβ,
~ donc, par hypothèse, N →∗ aβ, ~ ce
qui permet de conclure que a ∈ Premier(N ).
(iv) Supposons que N → ε. On est dans le deuxième cas de la définition de
Premier et ainsi
./ ∈ Premier(N ).
(v) Soit a ∈ Premier(α1 ) \ {./}. Il existe donc β~ ∈ (N ∪ T )∗ tel que α1 →∗ aβ.
~
Ainsi
α1 α2 · · · αn →∗ aβα
~ 2 · · · αn .
Donc a ∈ Premier(α1 · · · αn ).
(vi) Supposons que ./ ∈ Premier(α1 ), donc par définition α1 →∗ ε.
• Si a ∈ Premier(α2 · · · αn ) \ {./}, alors il existe β~ ∈ (N ∪ T )∗ tel qu’on
~ Ainsi
ait α2 · · · αn →∗ aβ.
α1 α2 · · · αn →∗ εα2 · · · αn →∗ aβ.
~
Donc a ∈ Premier(α1 · · · αn ).
• Si ./ ∈ Premier(α2 · · · αn ), alors α2 · · · αn →∗ ε. Ainsi
α1 α2 · · · αn →∗ εα2 · · · αn →∗ ε.
Donc ./ ∈ Premier(α1 · · · αn ).
Ainsi Premier(α2 · · · αn ) ⊂ Premier(α1 · · · αn ).
b) Notons HRn l’hypothèse de récurrence au rang n. Montrons l’hypothèse de
récurrence au rang n = 0.
• Si α ~ alors α
~ →0 aβ, ~ = aβ.~ D’où a ∈ P (a) \ {./} ⊂ P (~
α) par (i) et (v).
~ →0 ε, alors α
• Si α ~ = ε. D’où ./ ∈ P (~
α) par (ii).
Soit n ∈ N∗ . Supposons que HR` soit vraie pour tout ` < n et montrons HRn .
~ →n aβ,
• Si α ~ on veut montrer que a ∈ P (~
α).
+ Si le premier caractère de α
~ est un terminal, il s’agit de a. D’où
784
Langages réguliers et algébriques
On a donc
∈ P (xi ) \ {./} |{z}
a |{z} ⊂ P (xi · · · xk ).
par HR par (v)
Ainsi
a ∈ P (x1 · · · xk ) \ {./} |{z}
⊂ P (N ) \ {./} |{z}
⊂ P (N~γ ) = P (~
α).
par (iii) par (v)
785
123. Caractérisation de Premier en analyse LL(1)
c) Soit P la plus petite partie qui vérifie les propriétés (i) à (vi). La question a)
montre que Premier vérifie les propriétés (i) à (vi). Donc P ⊂ Premier.
La question b) nous permet de voir que P ⊂ Premier. En effet, si a ∈
Premier(~ α), alors il existe β~ ∈ (N ∪ T )∗ tel que α ~ →∗ aβ. ~ En utilisant le
résultat de la récurrence, on obtient a ∈ P (~α).
Commentaires.
© Ce théorème sert en pratique à calculer la fonction Premier par un algorithme
de saturation :
Algorithme 32 : Calcul_Premier.
~ ∈ (N ∪ T )∗ .
Entrée : un élément α
α).
Sortie : l’ensemble Premier(~
1 pour a ∈ T faire
2 Premier(a) ← {a}
3 Premier(ε) ← {./}
4 pour N → ε ∈ R faire
5 Premier(N ) ← {./}
6 tant que Premier est modifié faire [
7 Premier(N ) ← Premier(N ) ∪ Premier(α1 · · · αn )
N →α1 ···αn
8 si ./ ∈
/ Premier(α1 ) alors
9 Premier(α1 · · · αn ) ← Premier(α1 · · · αn ) ∪ (Premier(α1 ) \ {./})
10 sinon
11 Premier(α1 · · · αn ) ← Premier(α1 · · · αn ) ∪ Premier(α2 · · · αn )
12 renvoyer Premier
Cet algorithme est correct en raisonnant par double inclusion. Pour différentier les
deux ensembles que l’on considère, on note Premieralgo l’ensemble renvoyé par
l’algorithme. Par construction, Premieralgo vérifie les propriétés (i) à (vi). D’après
le résultat du développement, on a Premier ⊂ Premieralgo . Réciproquement,
l’ensemble Premieralgo vérifie la définition de la fonction Premier car on rajoute
seulement des premiers terminaux de dérivations possibles à partir des α ~ ∈
∗
(N ∪ T ) , ainsi Premieralgo ⊂ Premier.
© Le symbole ./ permet de faire la différence entre les non-terminaux qui ne
se dérivent en rien et les non-terminaux qui se dérivent en ε. Par exemple, la
grammaire qui contient uniquement la règle S → S engendre le langage vide. On
a Premier(S) = ∅. Alors que la grammaire qui contient la règle S → ε engendre
le langage contenant que le mot vide ε. On a Premier(S) = {./}.
© La partie importante du développement est la deuxième inclusion. Il peut être
intéressant de traiter qu’une des six propriétés pour l’inclusion directe afin d’avoir
du temps pour la récurrence de l’inclusion réciproque.
786
Langages réguliers et algébriques
787
123. Caractérisation de Premier en analyse LL(1)
Questions.
1. Calculer la fonction Premier pour la grammaire suivante G = (Σ, N , T , S, R)
où Σ = {a, b, c, d}, N = {S, A, B, C}, T = Σ et R est décrit par
S → AB | Ca
A → aAb | ε
B → bB | b
C → cC | d.
S → ε | aSb.
788
Logique et preuves
44. Est-ce que l’ensemble des ensembles ne se contenant pas eux-mêmes se contient lui-même ?
Ou moins formellement : si un barbier rase tous les hommes qui ne se rasent pas eux-mêmes,
doit-il se raser ?
Logique et preuves
w ϕw oui
traduction Sat non
791
124. Théorème de Cook-Levin
(ii) Écrire une formule E ∧ U qui est vraie si et seulement si pour tout
(i, j) ∈ J0, P (n)K2 , il existe un unique a ∈ A tel que xi,j,a est vraie.
Lorsque les formules E et U sont vraies, on dit que xi,j,a encode la proposition
« la case (i, j) contient a ».
(iii) Écrire une formule I qui est vraie si et seulement si la première ligne du
tableau correspond à la configuration initiale de M .
(iv) Écrire une formule F qui est vraie si et seulement si la dernière ligne du
tableau contient l’état final de M .
(v) Écrire une formule T qui encode les transitions de la machine M .
On pose la formule
E ∧ |{z}
ϕw = |{z} U ∧ I
|{z} ∧ |{z}
F ∧ |{z}
T .
existence unicité initialisation état final transition
Correction.
a) On peut vérifier en temps polynomial qu’une valuation satisfait ou non une
formule ϕ, par exemple par induction sur l’arbre représentant la formule. Donc
une valuation est un certificat polynomial, ce qui prouve que Sat est dans NP.
b) (i) Comme on représente les configurations sous la forme gqd où q ∈ Q et
g, d ∈ Γ∗ , on va avoir un tableau de la forme
q0 w1 w2 · · · wn # · · · #
γ1 q1 w2 · · · wn # · · · #
.. .. .. .. .. .. . . ..
. . . . . . . .
γ10 · · · γ`0 qf γ`+1
0 · · · · · · γP0 (n)+1
792
Logique et preuves
qui est de taille O(P (n)2 |A|). En effet, la conjonction permet de représenter un
quantificateur universel pour traiter toutes les cases (i, j) et la disjonction sur A
permet de donner l’existence d’un symbole a dans la case (i, j). Donc cette formule
encode que pour tout i, j ∈ J0, P (n)K2 , il existe a ∈ A tel que xi,j,a est vraie.
Pour encoder l’unicité des symboles dans toutes les cases du tableau, on pose
^
^
U := ¬(xi,j,a ∧ xi,j,a0 )
0
i,j a,a ∈A
a6=a0
qui est de taille O(P (n)2 |A|2 ). En effet, pour tout i, j ∈ J0, P (n)K2 , pour toute
paire (a, a0 ) d’éléments distincts de A, on ne peut pas avoir xi,j,a et xi,j,a0 vraies.
(iii) Pour encoder l’initialisation de la machine de Turing M , on pose
n P (n)
^ ^
I := x0,0,q0 ∧ x0,j,wj ∧ x0,j,# ,
j=1 j=n+1
qui est de taille O(P (n)). En effet, la configuration initiale de la machine de Turing
est q0 w puisque la tête de lecture est sur la première case du ruban et que le mot
est écrit sur le ruban. Ainsi, la première case doit contenir q0 , les n suivantes
contiennent le mot w et on finit en remplissant avec des symboles blancs #.
(iv) Pour encoder le fait d’être dans un état final à la fin de l’exécution, on pose
P (n)
_
F := xP (n),j,qf ,
j=0
qui est de taille O(P (n)). En effet, comme M boucle sur son état final, il suffit de
regarder si l’état qui est sur la dernière ligne est bien final. Il suffit donc de faire
une disjonction sur les variables propositionnelles de la dernière ligne du tableau.
(v) Pour encoder les transitions, il va falloir vérifier que deux lignes successives
représentent deux configurations successives dans l’exécution de la machine M .
On considère les deux cas suivants au niveau des lignes i et i + 1 et des colonnes
d’indices j − 1, j et j + 1 :
793
124. Théorème de Cook-Levin
• Soit il n’y a aucun état ni en (i, j − 1), ni en (i, j), ni en (i, j + 1) et dans ce
cas le contenu de la case (i, j) est égal au contenu de la case (i + 1, j).
j−1 j j+1
i γ1 γ2 γ3
i+1 γ10 γ2 γ30
où γ1 , γ2 , γ3 ∈ Γ et γ1 , γ30 ∈ A.
• Soit il y en a un état en case (i, j) et dans ce cas on a respecté une règle de
transition :
qui est de taille O(|Γ|2 |Q||δ|) et qui est vraie si les six cases (i, j − 1), (i, j),
(i, j + 1), (i + 1, j − 1), (i + 1, j) et (i + 1, j + 1) respectent une transition où
la tête de lecture se déplace vers la gauche ;
• δ → (i, j) :=
_
xi,j−1,γ1 ∧ xi,j,q ∧ xi,j+1,γ2 ∧ xi+1,j−1,γ1 ∧ xi+1,j,γ3 ∧ xi+1,j+1,q0
γ1 ,γ2 ∈Γ
q∈Q
δ(q,γ2 )=(q 0 ,γ3 ,→)
qui est aussi de taille O(|Γ|2 |Q||δ|) et qui est vraie si les six cases (i, j − 1),
(i, j), (i, j + 1), (i + 1, j − 1), (i + 1, j) et (i + 1, j + 1) respectent une transition
où la tête de lecture se déplace vers la droite.
794
Logique et preuves
P (n)−1 P (n)
^ ^
T := (¬xi,j−1,∈Q ∧ ¬xi,j,∈Q ∧ ¬xi,j+1,∈Q ) → [xi,j = xi+1,j ]
i=0 j=0
∧ xi,j,∈Q → [δ → (i, j) ∨ δ ← (i, j)] .
Sa taille est donc polynomiale par rapport à n donc la réduction est de taille
polynomiale.
Vérifions que ϕw est satisfiable si et seulement si w ∈ L.
Dans le sens direct, supposons que ϕw est satisfaite par une valuation ν. D’après E
et U , pour tout i, j ∈ J0, P (n)K, il existe un unique a ∈ A tel que ν(xi,j,a ) = >.
En remplissant chaque case (i, j) du tableau avec ce caractère a, les formules I, F
et T montrent que le tableau représente bien un calcul acceptant de M sur w,
donc w ∈ L.
Réciproquement, si w ∈ L, il existe un calcul acceptant de taille au plus P (n) + 1.
On définit alors ν(xi,ja ) = > si et seulement si la case (i, j) du tableau associé à
ce calcul contient la lettre a. Par construction, cette valuation satisfait ϕw .
Ainsi, on a obtenu une réduction polynomiale du problème L au problème Sat,
donc Sat est bien NP-dur.
Commentaires.
© Pour être à l’aise sur ce développement, il faut être sûr de bien avoir compris
les formules et leur sens, ainsi il sera plus facile de les retrouver pendant les 15
minutes devant le jury. Mais il faut faire attention au temps que l’on a pour bien
mettre en avant la structure du développement (NP puis NP-dur) tout en veillant
à conserver du temps pour écrire les formules de ϕw et de souligner leur sens
devant le jury, en particulier en ne s’attardant pas sur le début (question a)) du
développement. Il peut être envisageable de ne pas dessiner le tableau lors de la
présentation, l’explication avec des phrases pouvant suffire.
© Le théorème de Cook-Levin a été démontré par Stephen Cook et par Leonid
Levin au début des années 1970. Cependant, la guerre froide n’aidant pas à la
communication, les deux chercheurs (le premier américain, le second russe) ont
démontré le résultat indépendamment.
© À partir de ce problème, on peut prouver que CnfSat et 3Sat sont NP-complets,
voir Développement 125.
795
124. Théorème de Cook-Levin
© Le problème 3Sat est important car c’est généralement à partir de lui que
l’on prouve la NP-complétude d’autres problèmes comme des problèmes sur les
graphes, des problèmes de paquets, etc. Voir [GJ79] et page 863.
entrée :
une formule ϕ en logique propositionnelle sous forme
CnfSat normale conjonctive ;
sortie : oui si ϕ est satisfiable, non sinon.
entrée :
une formule ϕ en logique propositionnelle sous forme
3Sat normale conjonctive avec 3 littéraux par clause ;
sortie : oui si ϕ est satisfiable, non sinon.
Questions.
1. Le problème Sat est-il décidable ?
2. Une machine de Turing non déterministe qui décide un problème s’arrête-t-elle
sur toutes ses entrées ?
3. Montrer que l’on peut faire les hypothèses imposées sur la machine M .
4. Montrer que le problème CnfSat est NP-complet.
5. Montrer que le problème 3Sat est NP-complet.
796
Logique et preuves
Correction.
a) Soit une formule propositionnelle ϕ. On va construire la formule ϕb par induction
sur la structure de ϕ. Si ϕ est de la forme :
• x une variable, alors on pose ϕb := x ;
• ¬φ, alors on pose ϕb := ¬φb ;
797
125. Transformation de Tseitin
• φ ∧ ψ, alors on pose ϕb := φb ∧ ψb ;
• φ ∨ ψ, alors on pose ϕb := ¬(¬φb ∧ ¬ψ)
b ;
a¬ψ ↔ ¬aψ
≡ (a¬ψ → ¬aψ ) ∧ (¬aψ → a¬ψ )
≡ (¬a¬ψ ∨ ¬aψ ) ∧ (aψ ∨ a¬ψ ).
On pose donc t(¬ψ) = (¬a¬ψ ∨ ¬aψ ) ∧ (aψ ∨ a¬ψ ) qui est sous CNF et de taille 5.
Maintenant, on donne la formule sous CNF de t(ψ1 ∧ ψ2 ).
On pose donc t(ψ1 ∧ψ2 ) = (¬aψ1 ∧ψ2 ∨aψ1 )∧(¬aψ1 ∧ψ2 ∨aψ2 )∧(¬aψ1 ∨¬aψ2 ∨aψ1 ∧ψ2 )
qui est sous CNF et de taille 10.
#t(ψ) 6 10
798
Logique et preuves
En conclusion, on a
^
#T (ϕ) 6 # aϕ ∧ t(ψ)
ψ∈Fϕ \Vϕ
^
61+# t(ψ)
ψ∈Fϕ \Vϕ
X
6 1 + |Fϕ \Vϕ | + #t(ψ)
ψ∈Fϕ \Vϕ
6 1 + 11|Fϕ |
6 1 + 22#ϕ
Considérons le cas ψ1 ∧ ψ2 ∈ Fϕ .
(iv) Supposons que T (ϕ) est satisfiable, il existe donc une valuation ν̃ telle que
ν̃(T (ϕ)) = >.
On définit la valuation ν en posant pour tout p ∈ Vϕ , ν(p) = ν̃(ap ). Montrons par
induction que pour tout ψ ∈ Fϕ , ν(ψ) = ν̃(aψ ).
• Le cas de base est donné par la définition de la valuation ν.
• Soit ψ ∈ Fϕ s’écrivant ψ1 ∧ ψ2 . Comme ν̃(T (ϕ)) = >, on a ν̃(t(ψ1 ∧ ψ2 )) = >.
Par définition de t(ψ1 ∧ ψ2 ), on a donc ν̃(aψ1 ∧ψ2 ↔ aψ1 ∧ aψ2 ) = >. Cela se
traduit par ν̃(aψ1 ∧ψ2 ) = ν̃(aψ1 ∧ aψ2 ). On a alors
799
125. Transformation de Tseitin
Soit ψ ∈ Fϕ s’écrivant ¬φ. On sait que ν̃(T (ϕ)) = >, ainsi ν̃(t(¬φ)) = >.
Par définition de t(¬φ), on a donc ν̃(a¬φ ↔ ¬aφ ) = >. Cela se traduit par
ν̃(a¬φ ) = ν̃(¬aφ ). On a alors
Commentaires.
© Pour mieux comprendre, on peut interpréter les variables propositionnelles aψ
comme étant « ψ est vraie ».
© Il faut faire attention au fait que les deux formules ϕ et T (ϕ) sont équisatisfiables
et non équivalentes. En effet, comme elles ne sont pas définies sur le même ensemble
de variables, on ne peut pas parler d’équivalence.
© On peut aussi voir cette transformation comme une réduction du problème Sat
au problème CnfSat afin de prouver que CnfSat est NP-complet.
(
entrée : une formule ϕ en logique propositionnelle ;
Sat
sortie : oui si ϕ est satisfiable, non sinon.
(
entrée : une formule ϕ en logique propositionnelle sous CNF ;
CnfSat
sortie : oui si ϕ est satisfiable, non sinon.
Sat
ϕ T (ϕ) oui
traduction CnfSat non
x ≡ (x ∨ y ∨ z) ∧ (x ∨ ¬y ∨ z) ∧ (x ∨ y ∨ ¬z) ∧ (x ∨ ¬y ∨ ¬z),
x ∨ y ≡ (x ∨ y ∨ z) ∧ (x ∨ y ∨ ¬z),
800
Logique et preuves
x1 ∨· · ·∨xn ≡ (x1 ∨x2 ∨y2 )∧(¬y2 ∨x3 ∨y3 )∧(¬y3 ∨x4 ∨y4 )∧· · ·∧(¬xn−2 ∨xn−1 ∨xn ),
où toutes les nouvelles variables que l’on utilise sont des variables fraîches, i.e.
qui n’apparaissent pas dans la formule initiale.
© Le problème 3Sat est fondamental dans les réductions classiques pour montrer
que certains problèmes sont NP-durs. Voir page 863.
© Pour plus d’exemples de restrictions de Sat et leur complexité, on pourra se
référer au Développement 126.
© Pour toute formule ϕ, on peut trouver une formule équivalente sous CNF en
utilisant les lois de De Morgan pour faire sortir les ∧ et rentrer les ∨, cependant
cette construction peut donner une taille exponentielle en la taille de ϕ. Donc cela
ne pourrait pas amener à une réduction de Sat à CnfSat, puisque la traduction
ne serait pas polynomiale.
© On a pu se ramener à des formules contenant que des ∧ et des ¬ car le système
{∧, ¬} est complet. Il existe d’autres systèmes complets, par exemple {→, ⊥}.
Questions.
1. Montrer l’équivalence des formules ϕ et ϕb de la question a).
2. Que se passe-t-il si ϕ est juste une variable propositionnelle ?
3. Montrer que l’on a en fait la majoration plus fine
801
126. 2Sat est NL-dur
Soit ϕ une formule du calcul propositionnel. On dit que ϕ est une formule
2Cnf si elle est sous forme normale conjonctive, et que chaque clause est la
disjonction de deux littéraux. Autrement dit,
p
^
ϕ= (`i,1 ∨ `i,2 )
i=1
802
Logique et preuves
Correction.
a) (i) Montrons les deux directions de l’équivalence.
• Soit v une valuation qui ne satisfait pas ϕ. Il existe donc une clause ` ∨ `0 non
satisfaite par v, c’est-à-dire v(`) = v(`0 ) = ⊥. Par définition, il y a un arc ``0
dans Gϕ . Cet arc est en particulier un chemin de longueur 1 entre ` et `0 , et
on a v(`) = > et v(`0 ) = ⊥.
• Réciproquement, raisonnons par contraposée et supposons que v soit une
valuation satisfaisant ϕ. Soit ``0 un arc de Gϕ tel que v(`) = >.
Par définition, la clause ` ∨ `0 apparaît dans ϕ, elle est donc satisfaite par v.
Comme v(`) = >, on a v(`0 ) = >. Ainsi, par une récurrence immédiate, pour
tout chemin `1 , . . . , `n de Gϕ avec v(`1 ) = >, on a v(`n ) = >. En particulier,
il n’existe aucun chemin partant d’un littéral évalué à > par v et arrivant en
un littéral évalué à ⊥ par v.
Ainsi, ϕ est satisfaite par v si et seulement s’il n’existe pas de chemin d’un
littéral `1 vers un littéral `n avec v(`1 ) = > et v(`n ) = ⊥.
(ii) Soient v une valuation satisfaisant ϕ, et x une variable de ϕ. Quitte à
échanger les littéraux x et x, on peut supposer que v(x) = >.
Si x et x sont dans une même composante fortement connexe de Gϕ . Alors il existe
un chemin de x à x dans Gϕ . D’après la question précédente, comme v(x) = >,
on a aussi v(x) = >, ce qui est impossible. Ainsi, si ϕ est satisfiable, alors pour
toute variable x, les littéraux x et x ne sont pas dans les mêmes composantes
fortement connexes de Gϕ .
(iii) Par construction de Gϕ , pour tout arc ``0 dans Gϕ , l’arc `0 ` est aussi
un arc de Gϕ . A fortiori, pour tout chemin `1 , . . . , `n dans Gϕ , il y a aussi un
chemin `n , . . . , `1 dans Gϕ .
Soit C une composante fortement connexe de Gϕ et ` un sommet de C. On définit
C comme la composante fortement connexe de Gϕ contenant ` (on peut avoir
C = C).
Si `0 est un autre sommet de C, il existe un chemin de ` à `0 et de `0 à ` dans Gϕ
par forte connexité de C. Le graphe Gϕ contient donc aussi un chemin de `0 à `
et de ` à `0 , ce qui assure que C contient `0 . On obtient donc que C 0 contient tous
les sommets `0 où `0 ∈ C. De manière similaire, on peut montrer que C contient
tous les sommets `0 où `0 ∈ C.
Ainsi, C est une composante fortement connexe dont les sommets sont exactement
les négations des littéraux de C.
803
126. 2Sat est NL-dur
(iv) Supposons que pour toute variable x, les littéraux x et x ne sont pas dans
la même composante fortement connexe de Gϕ .
D’après la question a)(i), toute valuation satisfaisant ϕ est constante sur les
composantes fortement connexes de Gϕ . Il suffit donc de définir la valuation
recherchée sur chacune de ces composantes. Soit Hϕ le graphe quotient de Gϕ ,
c’est-à-dire le graphe dont les sommets sont les composantes fortement connexes
de Gϕ , et tel qu’il y a un arc entre deux composantes C et C 0 s’il existe un arc xy
dans Gϕ avec x ∈ C et y ∈ C 0 .
Par définition des composantes fortement connexes, le graphe Hϕ est acyclique.
On peut donc lui appliquer un tri topologique (voir Développement 117). On
définit alors une valuation v en considérant les composantes connexes dans l’ordre
inverse d’un tri topologique de Hϕ . Soit C la composante courante. Si v est déjà
définie sur C, on passe à la composante suivante. Sinon, on définit v comme >
sur (chaque littéral de) C et comme ⊥ sur (chaque littéral de) C, puis on passe à
la composante suivante.
Par hypothèse, pour toute variable x, les sommets x et x̄ sont dans des composantes
connexes de Gϕ distinctes. En particulier, on a C 6= C à chaque étape, donc la
valuation v est bien définie. D’après a)(i), pour montrer que v satisfait ϕ, il suffit
de montrer qu’il n’y a pas de chemin d’un littéral vrai vers un littéral faux dans
Gϕ . Comme v est constante sur chaque composante fortement connexe de Gϕ , il
suffit de montrer cette propriété dans Hϕ .
Supposons qu’il existe un tel chemin. Alors il existe un arc CC 0 avec v|C = > et
v|C 0 = ⊥. Comme v|C = >, on a considéré C avant C dans l’algorithme définissant
v. De même, on a aussi considéré C 0 avant C 0 . Ainsi, si < est un ordre topologique
sur Hϕ , on obtient
C < C < C 0 < C 0.
Comme Hϕ contient l’arc CC 0 , il contient aussi C 0 C, d’où C 0 < C, ce qui est
impossible car Hϕ est acyclique.
Finalement, on obtient que v satisfait ϕ.
(v) Étant donnée une formule 2Cnf ϕ, on peut construire une représentation du
graphe Gϕ sous forme de listes d’adjacence en temps linéaire : il suffit de parcourir
les clauses de ϕ et d’ajouter les deux arcs correspondants à Gϕ .
On peut déterminer les composantes fortement connexes de Gϕ en temps linéaire
via l’algorithme de Tarjan ou de Kosaraju. Après cette procédure, on obtient un
tableau T associant à chaque sommet de Gϕ sa composante fortement connexe.
D’après a)(ii) et (iv), il suffit alors de tester pour chaque variable x de ϕ si x
et x sont dans la même composante de Gϕ , i.e. si x et x sont associés à la même
valeur dans le tableau T .
b) (i) Montrons les deux directions de l’équivalence.
• Supposons que ϕG ∧ s ∧ t est satisfaite par une valuation v. On a en particulier
les égalités v(s) = > et v(t) = ⊥.
Soit s0 un sommet de G tel que s → s0 est un arc de G. Alors s ∨ s0 est
une clause de ϕG , qui est donc satisfaite par v. Comme v(s) = >, on a
804
Logique et preuves
nécessairement v(s0 ) = >. Par une récurrence immédiate on obtient que, pour
tout chemin s1 , . . . , sn avec s1 = s, on a v(sn ) = >. Comme v(t) = ⊥, le
graphe G ne peut donc pas contenir un chemin de s à t.
• Réciproquement, supposons que ϕG ∧ s ∧ t ne soit pas satisfiable. Soit S 0
l’ensemble des sommets de G accessibles par un chemin issu de s. On définit
une valuation v par (
> si x ∈ S 0 ,
v(x) =
⊥ sinon.
Commentaires.
© Les problèmes de satisfiabilité sont monnaie courante en informatique. En
effet, d’une part, une des premières questions considérées lors de l’étude d’un
fragment logique est de déterminer la complexité du problème de satisfiabilité (ou
de validité) associé. D’autre part, ces problèmes sont souvent de bons représentants
de la difficulté des problèmes d’une classe donnée. C’est par exemple le cas de
2Sat (NL-complet), 3Sat (NP-complet), ou de QbfSat (PSpace-complet).
© Un problème NL-complet « canonique » est le problème Access d’accessibilité
dans un graphe orienté, que l’on utilise dans ce développement. Le problème
2Sat n’en est finalement pas si éloigné : tout le développement repose sur le
fait qu’une clause x ∨ y peut être interprétée comme une implication x ⇒ y
(ou y ⇒ x). Il s’agit alors de relier la satisfiabilité d’une formule 2Cnf à des
propriétés d’accessibilité dans le graphe orienté représentant ces implications.
© Le célèbre théorème de Cook-Levin (voir Développement 124) établit que le
problème Sat est NP-complet , tout comme ses variantes CnfSat et 3Sat (voir
Développement 125). D’un autre côté, 2Sat peut être résolu en temps polynomial.
On peut alors constater la finesse de la frontière entre P et NP, ce qui est renforcé
par l’étude du problème Max2Sat défini dans les questions.
© Dans ce développement, on montre que 2Sat est NL-dur. Il est en fait NL-
complet. Pour établir l’appartenance de 2Sat à la classe NL, on utilise encore le
805
126. 2Sat est NL-dur
Questions.
1. Écrire explicitement l’algorithme présenté en a)(v).
2. Dans la question b), on utilise des formules ayant des clauses de taille 1, ce
qui n’est normalement pas possible dans une formule 2Cnf. Comment peut-on
gérer le cas des clauses de taille 1 ?
3. Le problème d’optimisation MaxnSat est le suivant :
entrée :
une formule nCnf ϕ ;
MaxnSat sortie : le nombre maximum de clauses de ϕ
satisfiables simultanément.
4. Montrer que le choix d’une valuation aléatoire uniforme (chaque variable ayant
probabilité 12 d’être vraie ou fausse) fournit une 34 -approximation du problème
Max2Sat ? Quel est le ratio d’approximation pour Max3Sat ? MaxnSat ?
806
Logique et preuves
v0 v0
v1 v1 v1 v1
807
127. Compacité de la logique propositionnelle
Correction.
a) (i) On procède par induction structurelle sur la formule propositionnelle ϕ.
• Si ϕ = v ∈ VF , alors [ϕ] = {1}× w∈VF \{v} {0, 1}. Comme l’ensemble {0, 1} est
Q
muni de la topologie discrète, {1} est ouvert et fermé. Ainsi, comme {0, 1}VF
est muni de la topologie produit, [ϕ] est bien ouvert et fermé.
• Si ϕ = ¬ψ, alors [ϕ] = {0, 1}VF \ [ψ] est ouvert et fermé dès que [ψ] l’est.
• Si ϕ = ψ ∧ ξ, alors [ϕ] = [ψ] ∩ [ξ] est ouvert et fermé dès que [ψ] et [ξ] le sont.
• Si ϕ = ψ ∨ ξ, alors [ϕ] = [ψ] ∪ [ξ] est ouvert et fermé dès que [ψ] et [ξ] le sont.
Ainsi, par induction, on obtient que [ϕ] est ouvert et fermé dans {0, 1}VF .
(ii) Si F est satisfiable, alors toute valuation le satisfaisant satisfait aussi n’im-
porte quel sous-ensemble fini de F. Ceci montre le sens direct du théorème.
Montrons le sens indirect par contraposée. Supposons que F ne soit pas satisfiable.
Alors ∩ϕ∈F [ϕ] = ∅. Observons que l’ensemble {0, 1} est compact pour la topologie
discrète. Par le théorème de Tychonov, l’ensemble produit {0, 1}VF est aussi
compact.
Comme tous les ensembles [ϕ] sont fermés, la propriété de Borel-Lebesgue (pour
les fermés) assure qu’il existe un sous-ensemble fini F 0 de F tel que ∩ϕ∈F 0 [ϕ] = ∅.
Autrement dit, F 0 est un ensemble fini non satisfiable. Ainsi, par contraposée, si
tous les sous-ensembles finis de F sont satisfiables alors F est satisfiable.
b) (i) On construit par récurrence une branche (xn )n∈N telle que pour tout n,
le sous-arbre de T enraciné en xn est infini.
• L’arbre T étant infini, on peut choisir x0 comme la racine r.
• Si x0 , . . . , xn sont construits pour un certain n ∈ N, alors l’arbre enraciné
en xn est infini par hypothèse de récurrence. Comme xn a un degré fini, il
a un nombre fini de fils, donc au moins un de ses sous-arbres est infini. On
définit alors xn+1 comme un fils de xn ayant un nombre infini de descendants.
On a donc construit par récurrence une branche infinie de T , ce qui conclut.
(ii) Supposons que tout sous-ensemble fini de F est satisfiable. Tout d’abord, on
remarque que tout sommet de l’arbre TF a un degré fini (puisque chaque sommet
a au plus deux fils). D’après la question précédente, il suffit de montrer que TF est
infini pour obtenir le résultat. Pour ce faire, on va montrer que pour tout entier
n > 0, l’arbre TF contient un sommet au niveau n.
Soit n ∈ N∗ . Alors {ϕ0 , . . . , ϕn−1 } est un sous-ensemble fini de F, donc satisfiable.
Soit ν une valuation satisfaisant cet ensemble. Par construction de TF , il existe
donc une branche de hauteur n où, pour i ∈ J1, nK, le i-ème sommet est vi−1 dans
le cas où ν(vi−1 ) est vrai et vi−1 sinon. L’arbre TF est donc infini, et la question
précédente conclut.
(iii) Le sens direct provient du même argument qu’en question a)(ii).
Réciproquement, supposons que tout sous-ensemble fini de F est satisfiable. La
question précédente assure que l’arbre TF a une branche infinie (xn )n∈N de TF .
On définit alors la valuation ν par ν(vi ) = 1 si xi+1 = vi et ν(vi ) = 0 si xi+1 = vi .
Par construction de TF , cette valuation satisfait toutes les formules de F. Ainsi, F
est donc satisfiable, ce qui conclut le sens réciproque du théorème de compacité.
808
Logique et preuves
Commentaires.
© Le nom « théorème de compacité » provient du lien entre la satisfiabilité d’un
ensemble et la satisfiabilité de ses sous-ensembles finis, ce qui est un analogue de la
propriété de Borel-Lebesgue. La question a) montre que c’est en fait exactement
la propriété de Borel-Lebesgue dans le bon espace topologique.
© Dans un compact K, la propriété de Borel-Lebesgue assure que si K est
recouvert par une famille d’ouverts, alors il est recouvert par une sous-famille
finie. On parle de compacité dénombrable lorsqu’on restreint cette propriété à des
familles dénombrables d’ouverts. Dans un compact, toute suite admet une sous-
suite convergente (un ensemble vérifiant cette propriété est dit séquentiellement
compact). La réciproque est fausse en général : un ensemble séquentiellement
compact, ou dénombrablement compact n’est pas nécessairement compact. C’est
en revanche le cas dans des espaces métriques — il s’agit du théorème de Bolzano-
Weierstrass.
© Le résultat de la question b)(i) est connu sous le nom de « lemme de König ».
Ce lemme est utile dans d’autres situations, comme on le verra dans les questions.
En revanche, on peut s’en passer dans le cadre de ce développement, soit en
appliquant la preuve du lemme de König directement sur l’arbre TF , ou bien sans
même construire TF en montrant par récurrence qu’il existe une suite (εn )n∈N
à valeurs dans {0, 1} telle que pour tout n ∈ N et toute partie finie F 0 ⊂ F, il
existe une valuation ν satisfaisant F 0 et telle que ν(vi ) = εi pour i ∈ J0, nK. Cette
méthode revient en fait à construire le niveau n + 1 de TF en montrant l’hérédité.
© L’approche via le lemme de König fonctionne dans le cas où VF et F sont
dénombrables. On utilise ici de façon cachée l’axiome du choix dénombrable. Cette
démonstration s’étend au cas non dénombrable, en utilisant l’axiome du choix
(général). Dans ce dernier cas, on remplace le lemme de König par le lemme de
Zorn pour construire une valuation maximale en un certain sens. Notons aussi
que la méthode développée dans la question a) fait aussi intervenir l’axiome
du choix, puisqu’il est utilisé dans la démonstration du théorème de Tychonov.
Le théorème de Tychonov n’est en revanche pas équivalent à l’axiome du choix.
En fait, l’axiome du choix est équivalent au fait qu’un produit d’espaces quasi-
compacts (i.e. satisfaisant la propriété de Borel-Lebesgue, mais pas forcément
séparés) est quasi-compact.
© Le théorème de compacité est un résultat majeur sur la logique propositionnelle.
Il se généralise au cas de la logique du premier ordre. Une démonstration assez
simple de ce fait se base sur le théorème de complétude des règles de déduction
en logique classique (ou de n’importe quel système de preuve au premier ordre
qui soit correct et complet). En effet, en supposant qu’un ensemble F de formules
du premier ordre ne soit pas satisfiable, le théorème de complétude affirme qu’il
existe une preuve d’une contradiction qui utilise les éléments de F comme axiomes.
Cette preuve étant finie, elle n’utilise qu’un nombre fini de formules de F. Comme
ce système de preuve est complet, l’ensemble (fini) de ces formules est alors
contradictoire, ce qui montre le sens non-trivial du théorème de compacité au
premier ordre.
809
127. Compacité de la logique propositionnelle
Questions.
1. Énoncer la propriété de Borel-Lebsegue pour les fermés.
2. Dans la question a)(i), pourquoi a-t-on besoin de montrer que [f ] est ouvert
et fermé alors que la question suivante n’utilise que la fermeture ? Peut-on s’en
passer ?
3. Soit G un graphe infini et k un entier. Montrer que G est k-coloriable si et
seulement si tout sous-graphe fini de G est k-coloriable. En déduire que tout
graphe (infini) planaire est 4-coloriable.
4. Une tuile est un objet de la forme
h
g d
b
810
Logique et preuves
811
128. Indécidabilité du problème ValidFO
On se place sur l’alphabet Σ = {a, b}. Soit T une instance de Post, i.e. un
u
ensemble fini de n tuiles de la forme i , pour i allant de 1 à n avec ui et vi
vi
ε
des mots sur l’alphabet Σ. On suppose que la tuile n’est pas dans T .
ε
On se fixe la signature S = {F, P} avec l’ensemble des fonctions défini
par F = {ε(0), a(1), b(1)} et l’ensemble des prédicats P = {p(2)}.
a) Sur la signature S, écrire une formule close ψ qui est vraie si et seulement
s’il existe un mot non vide w vérifiant p(w, w) ; et une formule close ϕ vraie si
et seulement si p est vrai sur les couples (x, y) que l’on peut obtenir à partir
des tuiles de T .
On pose alors tr(T ) = ϕ → ψ. On va montrer que tr(·) est une réduction.
b) Montrer que si tr(T ) est valide, alors T est une instance positive de Post.
c) Montrer que si T est une instance positive de Post, alors tr(T ) valide.
d) Conclure à l’indécidabilité du problème ValidFO.
On utilise ici un schéma de preuve classique (la réduction) pour montrer l’indé-
cidabilité de la validité en logique du premier ordre, ce qui permet d’illustrer la
leçon 914. Ce problème s’intègre aussi dans la leçon 924 puisque d’une part, la
preuve de la réduction met en jeu des manipulations de modèles et d’autre part,
ce résultat montre l’indécidabilité de la théorie vide.
812
Logique et preuves
Correction.
a) On cherche une fonction de traduction tr : T 7→ tr(T ) correspondant au schéma
suivant :
Post
T tr(T ) oui
traduction ValidFO non
x
• on notera une succession de tuiles de T telle que le mot du haut soit x et
y
x
celui du bas y. Cela sous-entend qu’en écrivant , il existe une succession
y
de tuiles de T qui forme les mots x en haut et y en bas.
Pour bien comprendre cette formule, il faut penser au prédicat p avec la sémantique
suivante : p(x, y) est vrai s’il existe une succession de tuiles ayant x en haut et y
en bas. Dans ce cas, une récurrence immédiate assure que la formule ϕ traduit
que p a bien cette sémantique. De plus, lorsque p a cette sémantique, la validité
de ψ correspond à l’existence d’une instance positive de Post.
b) La formule ϕ → ψ est valide donc, pour tout modèle M, on a M (ϕ → ψ).
On choisit le modèle M suivant :
• le domaine est DM = Σ∗ ,
• εM correspond au mot vide sur l’alphabet Σ ;
(
Σ∗ → Σ∗
• aM (·) :
x 7→ xa;
813
128. Indécidabilité du problème ValidFO
(
Σ∗ → Σ∗
• bM (·) :
x 7→ xb;
(Σ∗ )2 → {0, 1}
x
• pM (·, ·) :
1 si existe,
(x, y) 7→ y
0 sinon.
c) On suppose que T est une instance positive de Post. Il existe donc m > 1 et
des indices i1 , . . . , im ∈ J1, nK tels que ui1 ui2 · · · uim = vi1 vi2 · · · vim .
On notera u(k) (resp. v (k) ) pour ui1 ui2 · · · uik (resp. vi1 vi2 · · · vik ).
Soit M un modèle. On suppose que M ϕ, montrons que M ψ.
" #
x := u(k) (ε)
Prouvons, par récurrence sur k, que M p(x, y).
y := v (k) (ε)
814
Logique et preuves
On sait que, pour tout i ∈ J1, nK, M ∀x∀y p(x, y) → p(ui (x), vi (y)) . En
particulier, pour i = ik+1 , on a M ∀x∀y p(x, y) → p(uik+1 (x), vik+1 (y)) .
Donc " #
x := u(k) (ε)
M (k) p(x, y) → p(uik+1 (x), vik+1 (y)) .
y := v (ε)
" # " #
x := u(k) (ε) x := u(k+1) (ε)
Ainsi, comme M (k) p(x, y), on a M p(x, y).
y := v (ε) y := v (k+1) (ε)
• On a donc, pour tout k ∈ J1, mK,
" #
x := u(k) (ε)
M p(x, y).
y := v (k) (ε)
Sans perte de généralité, on suppose que ui1 ui2 · · · uim finit par un a. On écrit
l’égalité ui1 ui2 · · · uim = u(m) = ũa et vi1 vi2 · · · vim = v (m) = ṽa. On veut prouver
que M ψ et on a " #
x := u(m) (ε)
M p(x, y),
y := v (m) (ε)
" #
x := ũa(ε)
donc M p(x, y), d’où
y := ṽa(ε)
" #
x := ũa(ε)
M p(x, y).
y := ũa(ε)
h i
De ce fait, il existe ũ tel que M x := ũ(ε) p(a(x), a(x)). Donc M ψ. Ainsi
M (ϕ → ψ). Comme ceci est vrai pour tout modèle M, on en déduit quela
formule tr(T ) = (ϕ → ψ) est valide.
d) Il faut montrer que notre fonction tr(·) est bien calculable. C’est le cas puisque
tr effectue un calcul fini pour toute instance de Post. En effet, il y a toujours un
nombre fini de tuiles, et donc cela prend un nombre fini d’opérations pour créer
la formule ϕ → ψ.
On a réduit le problème Post au problème ValidFO. Donc si ValidFO était
décidable, on rendrait le problème Post décidable, ce qui serait absurde car
on sait que Post est un problème indécidable. Ainsi le problème ValidFO est
indécidable.
Commentaires.
© Il faut bien faire attention aux manipulations syntaxique et sémantique. Le fait
de bien séparer les deux ne peut que vous aider à faire comprendre au jury que
vous ne mélangez pas ces deux notions.
© Le problème de savoir si la validité d’une formule du calcul propositionnel est
décidable est le problème dual du problème Sat que l’on étudie dans le théorème
de Cook. Pour le calcul propositionnel, Sat est un problème NP-complet et Valid
est un problème co-NP-complet.
815
128. Indécidabilité du problème ValidFO
© On rappelle qu’on dit qu’une théorie T satisfait une formule ϕ, que l’on note
T ϕ, si, pour tout modèle M, on a
M T implique M ϕ.
Cela justifie le fait que la validité de ϕ est parfois notée ϕ. Ainsi on peut voir
ce développement comme l’indécidabilité de la théorie vide.
© La fonction tr(·) est même linéaire en le nombre de tuiles, car ψ est de taille
constante et ϕ est de taille linéaire.
Questions.
1. Pourquoi ne définit-on pas la formule ψ par ψ = ∃x, p(x, x) ?
ε
2. Comment définir tr : T 7→ tr(T ) quand T contient la tuile ?
ε
3. Montrer que le problème Post est indécidable.
4. ValidFO est-il dans RE ?
5. Qu’en est-il
( du problème SatFO ?
entrée : une formule ϕ close en logique du premier ordre ;
SatFO
sortie : oui si ϕ est satisfiable, non sinon.
816
Logique et preuves
817
129. Indécidabilité du problème RelSat
Elle traduit le fait que les attributs deb_h et deb_b sont des clés étrangères.
(i) En utilisant la formule ψ(x, y) := ∃z∃t∃sEnc(x, y, z, t, s), donner une
formule ϕEnc qui traduit le fait que
• pos1 et pos2 contiennent le symbole $ mais non simultanément ;
• les arcs pos1 → pos2 forment un cycle contenant $ ;
• les éléments de pos1 sont disjoints.
(ii) Donner avec précision ce que traduit la formule suivante :
N
_
ϕu :=∀x ∃ySync(x, y) → ∃x1 x2 . . . x|ui | x|ui |+1 j1 . . . j|ui |
i=1
hn |u
^i | o
Enc(xk , xk+1 , ui [k], i, jk ) ∧ {x = x1 }
k=1
o n |u
^i |
!!
n oi
∧ ∃zSync(x|ui |+1 , z) ∧ ¬∃ySync(xk , y) .
k=2
Sync($, $)
N
!
_
∧ ∀x∀y Sync(x, y)→ ∃t1 t2 t3 s1 s2 s3 Enc(x, t1 , t2 , i, t3 ) ∧ Enc(y, s1 , s2 , s3 , i)
i=1
!
Sync(x, y) ∧ ¬(x = max(deb_h)) ∧ ¬(y = max(deb_b)) → Sync(x0 , y 0 )
∧
818
Logique et preuves
Correction.
a) On utilise les trois tuiles suivantes
aab b bab
i1 ; i2 ; i3
a abbb ab
et le mot w = aabbbab qui s’écrit alors w = ui1 ui2 ui3 = vi1 vi2 vi3 .
On peut alors remplir la base de données de la manière suivante :
Dans la table Enc, on lit verticalement le mot aabbbab dans la colonne mot.
Dans la colonne u (resp. v), on trouve l’indice de la tuile sur laquelle la lettre
correspondante se situe en haut (resp. en bas). Dans la table Sync, on lit dans la
colonne deb_h (resp. deb_b) le numéro qui apparait dans la colonne pos1 qui
est le début de chaque tuile pour le mot du haut (resp. du bas) dans la succession
de tuiles
aab b b ab
.
a abbb ab
Par exemple, le premier b du haut de la troisième tuile est sur le tuple de la table
Enc qui a un 4 dans la colonne pos1 et est indiqué comme début de tuile dans la
table Sync.
b) (i) On utilise la formule ψ(x, y) := ∃z∃t∃sEnc(x, y, z, t, s) pour faciliter
l’écriture de ϕEnc . On peut alors poser pour ϕEnc la formule suivante :
∃t ψ($, t) ∧ ¬(t = $) ∧ ∃t ψ(t, $) ∧ ¬(t = $) existence $
∧ ∀x∀y∃z ψ(x, y) → ψ(y, z) cycle
∧ ∀x∀y∃z ψ(y, x) → ψ(z, y) cycle
∧ ∀xt1 t2 t3 t4 s1 s2 s3 s4 (Enc(x, t1 , t2 , t3 , t4 )
∧ Enc(x, s1 , s2 , s3 , s4 )) → (t1 = s1
∧ t2 = s2
∧ t3 = s3
∧ t4 = s4 ) unicité pos1.
819
129. Indécidabilité du problème RelSat
hx1 , x2 , z1 , i, ∗i ∈ Enc
hx2 , x3 , z2 , i, ∗i ∈ Enc
..
.
hxk , xk+1 , zk , i, ∗i ∈ Enc
où x1 , xk+1 ∈ deb_h et x2 , . . . , xk ∈
/ deb_h. Les ∗ peuvent être choisies indiffé-
remment.
Cette formule permet de dire que pour chaque indice de début de tuile dans Sync,
u
on a une tuile i et que (dans l’ordre imposé par la formule ϕEnc ) on a bien
vi
u
une succession de tuples qui correspond au mot ui de la tuile i puis que les
vi
lettres du mot correspondent bien à ui entre les indices x = x1 et xk . De plus, on
n’autorise pas les indices intermédiaires x2 à xk à être des débuts de tuile, mais
on impose à l’indice xk+1 d’en être un.
(iii) La formule ϕSync_u_v traduit le fait que h$, $i ∈ Sync, qu’il existe un
indice i ∈ J1, N K tel que
et permet de vérifier que hx0 , y 0 i ∈ Sync avec x0 et y 0 les indices qui suivent x
et y pour l’ordre défini à la question b)(i).
Cette formule permet d’imposer le bon début d’une succession S de tuiles (puisque
Sync($, $)). Les deuxième et troisième sous-formules permettent de synchroniser
le reste des tuiles. En effet, la deuxième sous-formule exprime le fait que l’on a
u
bien des tuiles licites (car il faut que ce soit une tuile i où l’indice du haut est
vi
820
Logique et preuves
u3
le même que l’indice du bas et non qui ne serait pas nécessairement dans
v4
l’instance de Post) et la troisième sous-formule traduit le fait qu’après chaque
tuile, on accède à une nouvelle tuile.
c) (i) On va utiliser les notations suivantes :
• on note u(k) pour ui1 · · · uik avec k ∈ J1, rK ;
• on note v (k) pour vi1 · · · vik avec k ∈ J1, rK.
Soit une instance I telle que I qT . La formule ϕT est donc satisfaite par
la base de données I. On pose r = |Sync| qui sera le nombre de tuiles de la
succession S associée à I. En utilisant les conditions imposées par les sous-formules
constituant ϕT , on peut montrer par récurrence sur k ∈ J1, rK que
(
u(k) = mot[1 · · · |u(k) |],
HRk :
v (k) = mot[1 · · · |v (k) |],
821
129. Indécidabilité du problème RelSat
est aussi indécidable puisque si RelSat était décidable, Post sans ε le serait
aussi (voir le schéma ci-après).
Post sans ε
oui
T qT
traduction RelSat non
Commentaires.
© Il existe d’autres problèmes indécidables sur les bases de données comme :
entrée :
deux requêtes q et q 0 du calcul relationnel ;
RelEqu sortie : oui si q et q 0 sont sémantiquement équivalentes,
non sinon.
Il suffit de réduire co-RelSat à RelEqu. En effet, une requête est insatisfiable
si et seulement si elle est équivalente à la requête vide.
© Dans la question b)(i), on a besoin d’imposer un ordre car une relation est un
ensemble de tuples (donc sans ordre prédéfini) et on veut pouvoir lire le mot de
la colonne mot avec des lettres qui sont dans le bon ordre.
© On a montré que le problème RelSat est indécidable, cependant il est dans RE.
En effet, on peut énumérer les bases de données qui sont des ensembles finis
de tuples sur un domaine dénombrable et tester pour chacune d’entre elles si la
requête est satisfaite. Ceci fournit un énumérateur pour RelSat, ainsi ce problème
est RE.
© Dans l’énoncé, il est dit que la formule ϕv est similaire à la formule ϕu . Pour
être précis, la formule ϕv est la suivante
N
_
ϕv :=∀x ∃ySync(y, x) → ∃x1 x2 . . . x|vi | x|vi |+1 j1 . . . j|vi |
i=1
hn |v
^ i| o
Enc(xk , xk+1 , vi [k], jk , i) ∧ {x = x1 }
k=1
n |v i|
!!
n o ^ oi
∧ ∃zSync(z, x|vi |+1 ) ∧ ¬∃ySync(y, xk ) .
k=2
822
Logique et preuves
que de toutes les écrire. Pour cela, on peut imaginer écrire la base de données à
droite du tableau quand on introduit Enc et Sync en expliquant comment la
remplir et en s’y référant pendant tout le développement pour expliquer le sens
des formules. Ainsi quand on explique l’équivalence entre la satisfiabilité de ϕT
et l’instance positive T de Post sans ε, la base de données est déjà dessinée au
bon endroit. Il peut être judicieux d’appeler le problème Post sans ε simplement
Post puisque c’en est une variante afin de gagner du temps dans l’exposition au
jury. Par contre, il faut bien avoir à l’esprit qu’on ne pourrait pas réduire de cette
façon le problème Post classique car les attributs deb_h et deb_b ne seraient
plus des clés étrangères (puisque non disjoint deux à deux).
Questions.
1. Montrer que le problème de Post sans ε est indécidable.
2. Écrire explicitement la récurrence de la question c)(i).
3. Écrire les formules qui donnent x = max(deb_h), x < y et x0 = min a où
a∈deb_h
a>x
< est l’ordre défini par les colonnes pos1 et pos2.
823
130. Complétude de la logique de Hoare
824
Logique et preuves
On peut parler de logique de Hoare dans plusieurs leçons. Elle vient naturellement
apparaître dans la leçon 927 puisqu’elle permet de montrer la correction de pro-
grammes informatiques (et parfois même la terminaison, cela dépend des règles
que l’on se donne). De plus, on a un théorème de correction et complétude entre
la sémantique opérationnelle à grands pas et les règles de la logique de Hoare. La
correction consiste à vérifier que les règles de la logique de Hoare sont bien compa-
tibles avec celles de la sémantique à grands pas. La complétude consiste à trouver,
pour tout programme ayant une certaine sémantique, un arbre de dérivation des
règles qui démontre le résultat (c’est ce que l’on va faire dans ce développement).
Cela justifie donc le placement de ce développement dans la leçon 930.
Correction.
a) Soit s un état tel que P s = >, on veut montrer que wlp(S, Q) s = >. Soit s0
un état tel que hS, si → s0 , par définition de p , on a Q s0 = >. Par définition
de wlp, on a bien wlp(S, Q) s = >.
b) (i) On suppose que wlp(skip, Q) s = >. Par la règle skip de sémantique
opérationnelle à grands pas [skip ns ], on a hskip, si → s. Donc par définition
de wlp, on a Q s = >. Ainsi,
wlp(skip, Q) ⇒ Q.
`p {wlp(skip, Q)}skip{Q}.
hx := a, si → s[x 7→ AJaKs ].
Donc par définition de wlp, on a Q[x → AJaK] s = Q s[x 7→ AJaKs ] = >. Ainsi,
825
130. Complétude de la logique de Hoare
(iv) Soit s un état tel que wlp(if b then S> else S⊥ , Q) s = >. On veut alors
montrer que P s = >.
Soit ./ ∈ {>, ⊥}. Si BJbK s = ./, montrer que P s = > revient à montrer que
wlp(S./ , Q) s = >. Soit s0 tel que hS./ , si → s0 et montrons que Q s0 = >. Par la
règle [if ./
ns ], on a
hif b then S> else S⊥ , si → s0
et par définition de wlp(if b then S> else S⊥ , Q), on a Q s0 = >. Ainsi, par
définition de wlp(S./ , Q), on a wlp(S./ , Q) s = >. Donc P s = >, d’où l’implication
souhaitée.
De plus, par hypothèse d’induction, on a
P s0 = wlp(while b do S, Q) s0 = >.
826
Logique et preuves
wlp(S, P ) s = >.
`p {P }while b do S{¬BJbK ∧ P }.
`p {P }while b do S{Q}.
Commentaires.
© On appelle la plus faible précondition « wlp » pour weakest liberal precondition, il
faut voir wlp(S, Q) comme le prédicat le plus faible donnant Q après avoir exécuté
le programme S. Si on remplace wlp par un prédicat trop faible, l’hypothèse
d’induction ne suffira pas à conclure dans certains cas. À l’inverse, si on considère
un prédicat trop fort, le résultat de la question a) n’est plus valide.
© On ne parle ici que de correction partielle, d’où le p en indice du symbole `, c’est-
à-dire que l’on n’a pas d’information sur la terminaison. Cependant, il existe des
règles légèrement différentes pour donner à la fois la correction et la terminaison
de programmes, on parle alors de correction totale (voir [NN07, p.191]). La seule
instruction qui pourrait ne pas terminer est la boucle while, on va alors rajouter
un prédicat qui encode le variant de la boucle (qui décroît strictement dans N).
La règle usuelle [while H ] sera remplacée alors par
(
{P (z + 1)} S {P (z)} P (z) ⇒ BJbK pour tout z ∈ N∗ ,
avec
{∃zP (z)} while b do S {P (0)} P (0) ⇒ ¬BJbK.
827
130. Complétude de la logique de Hoare
828
Logique et preuves
Questions.
1. Justifier que Q[x → AJaK] s = Q s[x 7→ AJaKs ].
2. Représenter l’arbre de Factorielle(2) pour la sémantique à grands pas.
Algorithme 33 : Factorielle(n).
Entrée : un entier n > 0.
Sortie : l’entier n!.
1 x←n
2 y ←1
3 tant que x > 0 faire
4 y ←y×x
5 x←x−1
6 renvoyer y
829
131. Équivalence entre deux sémantiques
On veut montrer que ces deux sémantiques sont équivalentes, c’est-à-dire que
pour toute instruction S et pour tous états s, s0 , on a
a) Sens direct.
(i) Montrer que, pour toute instruction S1 , S2 et pour tous états s, s0 tels
que hS1 , si ⇒∗ s0 , on a hS1 ; S2 , si ⇒∗ hS2 , s0 i.
(ii) Montrer par induction sur l’arbre de dérivation le sens direct.
b) Sens indirect.
(i) Montrer que, pour toute instruction S1 , S2 , pour tout s, s0 et pour tout
k > 2, si hS1 ; S2 , si ⇒k s0 alors il existe k1 , k2 ∈ N∗ tels que k1 + k2 = k,
hS1 , si ⇒k1 s00 et hS2 , s00 i ⇒k2 s0 .
(ii) Montrer par récurrence sur le nombre de pas le sens indirect.
L’équivalence entre les différentes sémantiques est un point clé de la leçon 930,
puisqu’elle justifie la cohérence des différentes sémantiques que l’on peut donner
à un langage de programmation.
Correction.
a) (i) On procède par récurrence sur le nombre de pas. On pose
hS10 ; S2 , s00 i ⇒∗ s0 .
d’où HRk+1 .
830
Logique et preuves
• cas if : pour ./ ∈ {>, ⊥}, supposons que hif b then S> else S⊥ , si → s0 soit
obtenu à partir de la règle [if ./
ns ], c’est-à-dire
hS./ , si → s0
où BJbKs = ./ .
hif b then S> else S⊥ , si → s0
./
Par hypothèse d’induction, on a hS./ , si ⇒∗ s0 . Or la règle [if sos ] nous donne
hif b then S> else S⊥ , si ⇒ hS./ , si, d’où
hif b then S> else S⊥ , si ⇒ hS./ , si ⇒∗ s0 .
831
131. Équivalence entre deux sémantiques
D’où
ce qui donne
hS1 , si ⇒ hS10 , s00 i ⇒k1 s000 .
On a donc
hS1 , si ⇒k1 +1 s000 et hS2 , s000 i ⇒k2 s0
avec (k1 + 1) + k2 = k − 1 + 1 = k, ce qui conclut l’hérédité et la preuve
par récurrence.
(ii) On procède par récurrence forte sur le nombre de pas. On pose
• Pour k = 1, les seuls cas possibles sont skip et l’affectation qui ont les mêmes
règles dans les deux sémantiques, ce qui montre HR1 .
• Pour k > 1, on suppose que HR` est vraie pour tous les rangs ` < k. On
distingue différents cas selon la forme de l’instruction S.
832
Logique et preuves
833
131. Équivalence entre deux sémantiques
Commentaires.
© Il y a aussi une équivalence entre la sémantique dénotationnelle et la sémantique
opérationnelle à petits pas. Le résultat de ce développement fournit alors aussi une
équivalence entre la sémantique dénotationnelle et la sémantique opérationnelle à
grands pas.
© Dans le sens direct, on décompose les grands pas en petit pas et dans le sens
indirect, on essaye de regrouper ensemble les petits pas qui correspondent à un
même grand pas.
© Il peut être judicieux de donner les résultats des questions a)(i) et b)(i) sous
forme de lemmes écrits dans le plan et donc de s’affranchir de cette partie lors du
développement. De plus, dans un souci de temps, on pourrait admettre certains
points des cas inductifs (surtout s’ils ressemblent à des cas déjà traités).
© On ne peut pas faire l’induction de la question a)(ii) sur la structure de
l’instruction, puisque la même instruction peut apparaître à différents endroits
dans l’arbre de dérivation (par exemple dans le cas du while). En revanche, chacune
de ces occurrences apparaît dans la racine d’un sous-arbre de dérivation de plus
petite hauteur, ce qui justifie l’induction sur la structure de l’arbre.
© On a prouvé que les deux sémantiques sont équivalentes, mais chacune possède
ses propres avantages. Par exemple, la sémantique à grands pas permet d’être plus
concis car on n’explicite pas chaque pas de calcul. En revanche, la sémantique à
petits pas permet une localisation plus précise des erreurs : l’erreur est localisée à
l’instruction près, alors que la sémantique à grands pas localisera uniquement la
boucle où se situe l’erreur.
Questions.
1. Montrer que les instructions while b do S et if b then S; while b do S else skip
sont équivalentes pour la sémantique opérationnelle à grands pas.
2. Écrire des règles de sémantique à grands et petits pas pour gérer les instructions
repeat S until b, et montrer que l’équivalence est préservée.
3. Montrer que le langage IMP muni de la sémantique opérationnelle à petits
pas (ou à grands pas) est déterministe, i.e. il y a unicité de l’état sortant s0 après
exécution d’une instruction S à partir d’un état s.
834
Compléments d’informatique
Schémas algorithmiques
n/2 n/2
2 Programmation dynamique
Le terme de « programmation dynamique » est introduit par Richard Bellman
dans les années 1940, le mot « programmation » voulait faire référence à l’origine
à un programme optimal dans un sens militaire (logistique, emploi du temps) et
le mot « dynamique » serait, selon certains, introduit pour impressionner et pour
surpasser le terme « programmation linéaire ». Le paradigme de programmation
dynamique consiste à résoudre des sous-instances du problème initial puis de
reconstruire une solution du problème global. Les solutions intermédiaires sont
alors stockées en mémoire afin de ne pas recalculer des solutions aux problèmes
déjà rencontrés. Ce procédé est appelé mémoïsation. Ainsi on part des plus petites
instances pour construire une solution du problème global, contrairement au
paradigme diviser pour régner où on part du problème global qu’on découpe en
sous-instances.
solutions des sous-sous-instances
837
3 Algorithmique gloutonne
Le paradigme d’algorithmique « gloutonne » consiste à choisir, à chaque pas de
calcul, un choix optimal localement en espérant atteindre un optimum global. En
général, on parle alors d’heuristique puisqu’on n’atteint pas toujours un optimum
global. Un exemple de cas non optimal est le rendu de monnaie avec le minimum
de pièces, si on a comme choix de pièces 5, 10, 20 et 25 et que l’on veut atteindre
la somme 40, un algorithme glouton donnera 40 = 25 + 10 + 5, alors qu’on
peut trouver une meilleure solution : 40 = 20 + 20. Cependant, pour les pièces
50, 20, 10, 5, 2, 1, l’algorithme glouton renvoie une solution optimale. La coloration
d’un graphe admet un algorithme glouton qui n’est pas optimal.
Voici quelques exemples d’utilisation de ce paradigme :
• algorithme de Dijkstra,
• algorithme de Prim,
• algorithme de Kruskal,
• codage de Huffman,
• problème de rendu de monnaie.
838
Bases de données
Une base de données est une structure qui permet d’organiser un grand nombre de
données. Elles seront répertoriées par catégorie, appelée attribut, dans différents
tableaux, appelés relations, ce qui formera la base de données. Cette dernière
permettra de faire des liens entre les différentes informations qui y sont présentes.
Voici un exemple de base de données qui nous servira tout au long de cette annexe :
1 Formalisme
Soient des ensembles au plus dénombrables distincts suivants :
• de variables Var = {x, y, z, . . .},
• d’attributs Att (ici, Cinéma, Titre, Acteur,...),
• de domaines Dom (ici, Didier, Q. Dupieux, 20h 50, Réalité, Exnior,...),
• de noms de schéma de relation RelName (ici, Films et Séances).
Définition 71 (Tuple)
Un tuple sur un schéma de relation R[U ] est une fonction u : U → Dom. On
notera le tuple par
u : U → Dom ∪ Var.
840
Bases de données
Définition 73 (Relation)
Une relation I (appelée parfois table) sur un schéma de relation R[U ] est un
nombre fini de tuples sur R[U ].
Exemple : l’ensemble des tables de l’exemple considéré est une base de données.
On veut maintenant pouvoir effectuer des requêtes sur les bases de données afin
d’en extraire des informations. Pour cela, on va donner plusieurs approches qui
sont de plus en plus expressives. Autrement dit, on pourra exprimer de plus en
plus de types différents de questions.
2 Requêtes conjonctives
Règles conjonctives
Définition 75 (Règle conjonctive)
Une règle conjonctive sur R est une expression de la forme
ans(u) ← R(1) u(1) , . . . , R(n) u(n)
où u, u(1) , . . . , u(n) sont des tuples libres sur des relations R(i) ∈ R et ans ∈
/ R.
Définition 76 (Valuation)
Une valuation ν sur Var est une fonction ν : Var → Dom. On la prolonge sur
les tuples libres en imposant que ν|Dom = Id|Dom .
Définition 77 (Sémantique d’une
règleconjonctive)
Soit q = ans(u) ← R (1) u(1) , . . . , R(n) u(n) une règle conjonctive. La sé-
mantique de la règle conjonctive q est l’application I 7→ q(I) où I est une base
de données sur R et
n o
q(I) = ν(u) : ν une valuation sur Var(q) et ∀i ∈ J1, nK , ν(ui ) ∈ I I (i)
841
On a demandé l’information x des tuples hx, A. Chabat, yi de la table Films. Les
entrées de cette forme dans la table Films sont hDidier, A. Chabat, A. Chabati et
hAstérix, A. Chabat, E. Baeri et on ne garde que la première composante dans q(I).
On a donc répondu à la question Q1 .
Définition 78 (Domaine actif)
Le domaine actif de I (resp. de q, q(I)), noté adom(I) (resp. adom(q),
adom(q(I))) est l’ensemble des éléments de Dom qui sont présents dans I
(resp. q, q(I)).
Calcul conjonctif
Définition 79 (formule du calcul conjonctif)
Soit un schéma de base de données R. Une formule du calcul conjonctif est de
la forme
• R[u], avec u un tuple libre sur R[U ] et R[U ] ∈ R ;
• φ ∧ ψ avec φ et ψ des formules du calcul conjonctif ;
• ∃x φ, avec x ∈ Var et φ une formule du calcul conjonctif.
Définition 80 (requête du calcul conjonctif)
Une requête du calcul conjonctif q sur R est une expression de la forme
q = {e1 , . . . , en | ϕ}
842
Bases de données
Théorème 8
Le calcul conjonctif et les règles conjonctives sont équivalentes, i.e. pour toute
règle conjonctive, il existe une requête en calcul conjonctif ayant la même
sémantique et pour toute requête en calcul conjonctif, il existe une règle
conjonctive ayant la même sémantique.
Toutes les requêtes conjonctives sont finies, i.e. leur sémantique sur toute base de
données est un ensemble fini.
3 L’algèbre SPC
Définition 83 (Algèbre SPC)
On définit les trois opérations suivantes sur I, J ∈ I qui formeront l’algèbre SPC
pour « Selection-Projection-Cartesian product ».
• Sélection :
σj=a (I) = {t ∈ I : t(j) = a}
où j est un attribut, a un élément du domaine et t un tuple. On peut aussi
définir σj=k (I) = {t ∈ I : t(j) = t(k)} où j, k ∈ Att et t est un tuple.
On sélectionne seulement les tuples qui vérifient certaines propriétés.
• Projection : Y
(I) = {ht(j1 ), . . . , t(jn )i : t ∈ I}
j1 ,...,jn
où n = arité(I) et m = arité(J).
Définition 84 (Requête de l’algèbre SPC)
On appelle requête de l’algèbre SPC un enchaînement fini de ces trois opérations.
843
Cinéma Horaires Titre Réalisateur Acteur
La place 20h 50 Didier A. Chabat A. Chabat
Exnior 13h 30 Didier A. Chabat A. Chabat
Trianon 12h 00 Au Poste Q. Dupieux G. Ludig
Exnior 13h 30 Réalité Q. Dupieux A. Chabat
Définition 86 (Satisfiabilité)
On dit qu’une requête q est satisfiable s’il existe une base de données I telle
que q(I) soit non vide.
Toutes les requêtes de l’algèbre SPC sont finies mais pas forcément satisfiables.
Q
Exemple : la requête A σA=0 σA=1 (I) est insatisfiable.
Théorème 9
Il y a équivalence entre les requêtes par règles conjonctives, le calcul conjonctif
et les requêtes satisfiables de l’algèbre SPC.
Cette requête renvoie le titre des films présents dans la relation Films dont le
réalisateur est A. Chabat ou Q. Dupieux.
Remarque : cependant, l’ajout de l’union entraîne l’apparition de requêtes infinies.
Exemple : la requête {x, y | R(x) ∨ R(y)} où R(x0 ) = 1 pour un certain x0 ∈ Dom
est infinie. En effet, pour tout y ∈ Dom, on a R(x0 ) ∨ R(y) = 1. Ainsi, pour un
domaine fini, on a une requête infinie.
844
Bases de données
Ajout de la négation
Définition 89 (Algèbre SPCUD)
On ajoute la différence ensembliste dans l’algèbre SPCU, notée \, qui devient
alors l’algèbre relationnelle SPCUD avec D pour « Difference ».
Définition 90 (Calcul relationnel)
Le calcul relationnel est obtenu à partir des formules du calcul conjonctif en
ajoutant le connecteur logique de négation, noté ¬.
Cette requête renvoie le titre des films présents dans la relation Films dont le
réalisateur est Q. Dupieux et qui n’a pas pour acteur A. Chabat.
Remarque : la négation apporte d’autres requêtes infinies.
Exemple : la requête {x | ¬R(x0 )} pour x0 ∈ Dom est infinie. En effet, pour tout
x ∈ Dom \ {x0 }, on a ¬R(x0 ) = 1. Ainsi, pour un domaine infini, on a une requête
infinie.
Pour une base de données I sur R, on restreint le domaine au domaine actif ainsi,
pour une requête et une relation fixées, la requête sera finie.
Théorème 10
Restreints au domaine actif, l’algèbre relationnelle SPCUD et le calcul rela-
tionnel sont équivalents.
845
Commentaires.
© On peut chercher à optimiser les opérations d’écriture et de lecture dans la
base de données. On peut par exemple utiliser des B-arbres comme il est montré
dans le Développement 107.
© L’intérêt des différentes relations dans une base de données est de pouvoir
coupler les informations. On dit qu’un attribut (ou un ensemble d’attributs)
est une clé s’il n’y a pas deux tuples avec cet attribut identique (ou l’ensemble
d’attributs identique). On parle de clé primaire si la clé est choisie pour identifier
(rôle d’identifiant dans la table) et de clé étrangère si elle est clé primaire d’une
autre table de la base de données. Par exemple, dans la base de données que
l’on considère, on pourrait se demander « Dans quel cinéma peut-on voir un film
réalisé par A. Chabat ? », il va falloir utiliser les informations des deux relations
et les associer sur l’attribut « Titre », cet attribut est une clé primaire de la table
Film et une clé étrangère de la table Séances.
© En pratique, on utilise les bases de données pour modéliser des situations
concrètes. On peut identifier des objets comme les plaques d’immatriculation pour
les voitures, les numéros de sécurité sociale pour des clients, etc.
© Notamment utilisée dans les années 1970 et 1980, la méthode MERISE permet
de concevoir et de gérer des projets informatiques. En partant d’une situation
réelle, on la modélise en un schéma (ou modèle) conceptuel des données (MCD)
en associant des entités et des notions d’association, par exemple, les entités
enseignant et cours sont associées par le lien enseigner. Une fois le MCD créé,
il faut le transformer en un schéma (ou modèle) logique des données (MLD),
c’est-à-dire que les entités deviennent des relations de base de données et les
identifiants des clés d’identification dans les différentes relations. Enfin, on peut
coder la base de données afin d’obtenir le modèle physique des données (MPD).
© Pour manipuler les bases de données, il faut un système de gestion de bases
de données, dit SGBD, qui est un logiciel qui manipule le langage des bases de
données, dit SQL, pour « Structured Query Language ». Les principaux SGBD
sont Oracle, MySQL et Microsoft SQL Server.
846
Sémantiques des langages de
programmation
Une sémantique d’un langage de programmation est une fonction S qui à une
instruction S et un état mémoire s associe un état mémoire s0 . Ce dernier état
mémoire est interprété comme un état mémoire sortant après exécution de l’ins-
truction S sur l’état mémoire initial s.
On peut définir une fonction de sémantique S de différentes manières. Nous
verrons deux manières différentes :
• la sémantique « opérationnelle », qui décrit la suite des pas de calcul pendant
l’exécution du programme.
• la sémantique « dénotationnelle », qui décrit le programme informatique
comme une fonction au sens mathématique du terme.
On va étudier trois sémantiques différentes (deux sémantiques opérationnelles
et une sémantique dénotationnelle) d’un langage de programmation « jouet »
dénoté IMP pour langage « IMPératif ». Tous les résultats sont détaillés dans le
livre [NN07].
1 Le langage IMP
Le langage IMP modélise un langage de programmation basique manipulant uni-
quement des entiers et des variables, et possédant des instructions conditionnelles.
Les instructions instruc du langage IMP sont définies par la grammaire dont les
règles sont :
où
• skip représente l’instruction vide (qui ne fait rien),
• x := a représente l’affectation de la valeur a à la variable x où a est une
expression arithmétique,
• S1 ; S2 représente la séquence d’instructions (on va faire l’instruction S1 puis
l’instruction S2 ),
• if b then S1 else S2 représente la conditionnelle,
• while b do S représente la boucle non bornée où b est une expression boo-
léenne.
On a ainsi besoin d’introduire des expressions arithmétiques Aexp pour manipuler
les entiers, et des expressions booléennes Bexp pour exprimer des conditions.
Variables et mémoire
On définit les variables Var par un ensemble de symboles {x, y, z, . . .}. Chaque
état de la mémoire est une fonction qui à chaque variable associe sa valeur. On
pose donc
mem = ZVar = (Var → Z).
On notera les états de la mémoire sous la forme s = [x 7→ 2, y 7→ 7, . . . ]. On peut
supposer que la mémoire est totale, i.e. toutes les variables sont affectées à une
valeur, par exemple en initialisant toutes les variables à 0.
Expressions arithmétiques
Les expressions arithmétiques, notées Aexp, sont les mots sur
A → (A + A) | A × A | (A − A),
A → n, pour tout n ∈ Z,
A → x, pour tout x ∈ Var.
AJnKs = n;
AJxKs = s(x);
AJ(a1 + a2 )Ks = AJa1 Ks + AJa2 Ks ;
AJa1 × a2 Ks = AJa1 Ks × AJa2 Ks ;
AJ(a1 − a2 )Ks = AJa1 Ks − AJa2 Ks .
Remarque : la division n’a pas été considérée dans les opérations arithmétiques
pour éviter l’exception de la division par 0.
Ainsi, A est une fonction qui à une expression a ∈ Aexp associe sa sémantique,
c’est-à-dire une fonction AJaK qui à un état s ∈ mem associe la valeur AJaKs .
Expressions booléennes
Les expressions booléennes, notées Bexp, sont les mots sur
848
Sémantiques des langages de programmation
B → ¬B | (B ∧ B),
B → a1 = a2 , pour tout a1 , a2 ∈ Aexp,
B → a1 6 a2 , pour tout x ∈ Aexp.
BJ¬bKs = ¬BJbKs ;
BJ(b1 ∧ b2 )Ks = BJb1 Ks ∧ BJb2 Ks ;
(
> si AJa1 Ks = AJa2 Ks ,
BJa1 = a2 Ks =
⊥ si AJa1 Ks 6= AJa2 Ks ;
(
> si AJa1 Ks 6 AJa2 Ks ,
BJa1 6 a2 Ks =
⊥ si AJa1 Ks > AJa2 Ks .
Ainsi, B est une fonction qui à une expression b ∈ Bexp associe sa sémantique,
c’est-à-dire une fonction BJbK qui à un état s ∈ mem associe le booléen BJbKs .
Substitution
La substitution est une opération syntaxique consistant à remplacer une variable x
par une expression a2 dans une expression a1 . Elle est notée a1 [x → a2 ] et définie
inductivement par :
2 Sémantiques opérationnelles
Pour définir les sémantiques opérationnelles à grands pas et à petits pas, on va
procéder par induction sur les instructions du langage IMP. Ainsi, pour chaque
instruction S ∈ instruc et chaque état mémoire s ∈ mem, il faut définir dans
quel état mémoire s0 ∈ mem on se trouve après avoir exécuté S dans l’état s, si S
termine. On donnera les différentes règles des sémantiques opérationnelles par
849
règle d’inférence, i.e. d’un certain nombre de prémisses, on déduira des conclusions.
On représentera ces règles sous la forme
Prémisse1 · · · Prémissen
ou Axiome (s’il n’y a pas de prémisse).
Conclusion
[skip ns ] hskip, si → s
[aff ns ] hx := a, si → s [x 7→ AJaKs ]
> hS1 , si → s0
[if ns ] si BJbKs = >
hif b then S1 else S2 , si → s0
⊥ hS2 , si → s0
[if ns ] si BJbKs = ⊥
hif b then S1 else S2 , si → s0
Afin d’obtenir une fonction totale pour la sémantique à grands pas, on peut définir
(
s0 si on a hS, si → s0 ,
Sns JSKs =
undef sinon.
850
Sémantiques des langages de programmation
1 ] hS1 , si ⇒ hS10 , s0 i
[comp sos
hS1 ; S2 , si ⇒ hS10 ; S2 , s0 i
2 ] hS1 , si ⇒ s0
[comp sos
hS1 ; S2 , si ⇒ hS2 , s0 i
>
[if sos ] hif b then S1 else S2 , si ⇒ hS1 , si si BJbKs = >
⊥
[if sos ] hif b then S1 else S2 , si ⇒ hS2 , si si BJbKs = ⊥
[while sos ] hwhile b do S, si ⇒ hif b then (S; while b do S) else skip, si.
Afin d’obtenir une fonction totale pour la sémantique à petits pas, on peut définir
(
s0 si on a hS, si ⇒∗ s0 ,
Ssos JSKs =
undef sinon.
L’acronyme sos vient de l’anglais pour « structural operational semantic » qui est
un autre nom pour la sémantique opérationnelle à petits pas.
On a besoin de mettre ⇒∗ ici, alors qu’on n’avait besoin que de → pour la
sémantique à grands pas, puisque, pour la sémantique à grands pas, chaque
règle aboutit à l’état de mémoire à la fin de l’exécution de S, alors que pour la
sémantique à petits pas, il faut parfois plusieurs étapes de calcul pour arriver à
l’état de mémoire de fin d’exécution de l’instruction.
On remarque que les sémantiques « à grands pas » et « à petits pas » portent
bien leurs noms, puisque par exemple pour la sémantique à grands pas la règle
[comp ns ] donne les états d’arrivée des instructions S1 et S2 directement alors que
pour la sémantique à petits pas, on va faire un petit pas de calcul pour l’instruction
S1 qui donne l’instruction S10 qu’il faut continuer d’exécuter avant de passer à
l’instruction S2 . Par exemple, supposons qu’on adjoigne l’opérateur de division
au langage IMP, et considérons un programme S contenant une boucle while dont
l’exécution amène à une division par 0. Les deux sémantiques opérationnelles ne
seront alors toutes les deux pas définies (Sns JSK = Ssos JSK = undef), mais si on
regarde de plus près comment ces sémantiques sont calculées, on remarque que le
calcul de Sns JSK bloque dès le début de la boucle (autrement dit on sait qu’un
problème apparaît lors de l’exécution de la boucle), alors que pour Ssos JSK, on a
une estimation plus précise du problème puisque le calcul de Ssos JSK se poursuit
jusqu’à l’itération où la division par 0 se produit.
851
Théorème 11 (Équivalence des sémantiques opérationnelles)
Pour toute instruction S du langage IMP, on a Sns JSK = Ssos JSK.
3 Sémantique dénotationnelle
Pour définir la sémantique dénotationnelle, on procède différemment de la séman-
tique opérationnelle. Au lieu d’avoir une approche par pas de calcul (petit ou
grand), on va définir une sémantique qui, pour chaque instruction S, donne une
fonction qui décrit mathématiquement comment la mémoire est modifiée pendant
l’exécution de S. On note cette sémantique
852
Sémantiques des langages de programmation
Ainsi les trois sémantiques que l’on a vues sont équivalentes sur le langage IMP.
Cependant, il existe d’autres langages pour lesquels ces sémantiques ne sont pas
équivalentes.
4 Logique de Hoare
On va étudier la correction partielle de programmes sur le langage IMP grâce à la
logique de Hoare.
Définition 91 (Triplet de Hoare)
On appelle triplet de Hoare le triplet {P }S{Q} où P et Q sont des prédicats
de la logique du premier ordre et S une instruction du langage IMP.
[skip H] {P }skip{P }
{BJbK ∧ P }S{P }
[while H]
{P }while b do S{¬BJbK ∧ P }
{P 0 }S{Q0 }
[cons H] si P ⇒ P 0 et Q0 ⇒ Q.
{P }S{Q}
853
et hS, si → s0 , on a Q s0 = >.
Théorème 13 (Correction et complétude)
Pour tous prédicats P et Q et pour toute instruction S du langage IMP, on a
`p {P }S{Q} ⇐⇒ p {P }S{Q}.
854
Problèmes indécidables
Rappel : on dit qu’un problème A est indécidable s’il n’existe pas de machine de
Turing qui décide le problème A.
A
f (ω) oui
ω
traduction f B non
Machines de Turing
Accept RiceP
Problèmes de Post
Dé
v
Légende :
.1
Post
29
8
A
12
Inter On réduit
v.
le problème A
Dé
RelSat
au problème B
Univ
ValidFO B
RelEqu
Egal
On dresse ci-après la liste des problèmes indécidables qui sont présents dans le
schéma de réductions.
(
entrée : une machine de Turing M déterministe et un mot w ;
Arrêt
sortie : oui si M (w) s’arrête, non sinon.
(
entrée : une machine de Turing M et un mot w ;
Accept
sortie : oui si M accepte w, non sinon.
Soit ∅ ( P (
( RE.
entrée : une machine de Turing M ;
RiceP
sortie : oui si L(M ) ∈ P, non sinon.
(
entrée : une machine de Turing M ;
Vide
sortie : oui si L(M ) = ∅, non sinon.
(
entrée : une formule close ϕ en logique du premier ordre ;
ValidFO
sortie : oui si ϕ est valide, non sinon.
856
Problèmes indécidables
entrée :
une formule close ϕ en logique du premier ordre sur la
Peano signature {0, 1, +, ×, =} ;
sortie : oui si N ϕ, non sinon.
(
entrée : deux grammaires algébriques G et G0 ;
Inter
sortie : oui si L(G)∩L(G0 ) = ∅, non sinon.
(
entrée : une grammaire algébrique G ;
Univ
sortie : oui si L(G) = Σ∗ où Σ est l’alphabet utilisé, non sinon.
(
entrée : deux grammaires algébriques G et G0 ;
Egal
sortie : oui si L(G) = L(G0 ), non sinon.
entrée :
deux requêtes q et q 0 du calcul relationnel ;
RelEqu sortie : oui si q et q 0 sont sémantiquement équivalentes,
non sinon.
entrée :
une requête q en calcul relationnel ;
RelSat sortie : oui s’il existe une base de données I telle que q(I) 6= ∅,
non sinon.
entrée :
un
alphabet
fini Σ, un ensemble fini de tuiles
ui
avec ui , vi ∈ Σ∗ ;
Post vi
i=1,...,n
oui s’il existe i1 , . . . , ip ∈ J1, nK tels que
sortie :
ui1 ui2 · · · uip = vi1 vi2 · · · vip , non sinon.
entrée : un
alphabet
fini Σ, un ensemble fini de tuiles
ui
avec ui , vi ∈ Σ∗ ;
Post marqué vi
i=1,...,n
oui s’il existe i2 , . . . , ip ∈ J1, nK tels que
sortie :
u1 ui2 · · · uip = v1 vi2 · · · vip , non sinon.
entrée : un
alphabet
fini Σ, un ensemble fini de tuiles
ui
avec ui , vi ∈ Σ∗ \{ε} ;
Post sans ε vi
i=1,...,n
oui s’il existe i1 , . . . , ip ∈ J1, nK tels que
sortie :
ui1 ui2 · · · uip = vi1 vi2 · · · vip , non sinon.
857
Commentaires.
© Le schéma des réductions des problèmes indécidables n’est qu’un exemple, on
pourrait en imaginer d’autres. Contrairement aux problèmes NP-complets, on
ne peut pas forcément réduire toute paire de problèmes indécidables entre eux.
Emil Post a défini notamment le degré de Turing d’un problème qui caractérise la
difficulté de celui-ci. Deux problèmes A et B ont le même degré de Turing si et
seulement s’ils sont Turing-équivalents, i.e. on peut réduire A à B et B à A. De
plus, à partir de tout problème indécidable, on peut en construire un de degré
strictement plus grand (c’est-à-dire strictement plus difficile) grâce au saut de
Turing.
© Tous les problèmes mentionnés ci-avant sont récursivement énumérables (i.e.
dans RE) sauf Peano et RelEqu. Cependant, RelEqu est co-RE.
© Rappelons que le point de départ des problèmes d’indécidabilité est le problème
de l’Arrêt. On montre qu’il est indécidable en raisonnant par l’absurde et en
construisant une machine paradoxale. Supposons qu’il existe une machine de
Turing A qui prend en argument une machine de Turing M et un mot w et qui
accepte (M, w) si et seulement M (w) s’arrête. On note hM i un codage de la
machine de Turing M . On construit alors la machine paradoxe qui prend en
entrée une machine M et qui boucle si A accepte (M, hM i) ou qui accepte sinon.
On a alors paradoxe(paradoxe) ne s’arrête pas si et seulement si A accepte
(paradoxe, hparadoxei) si et seulement si paradoxe(paradoxe) s’arrête, ce qui
contredit l’existence de A qui décide Arrêt.
© La réduction du problème Post au problème ValidFO est explicitée dans le
Développement 128.
© La réduction du problème Post sans ε au problème RelSat est explicitée dans
le Développement 129. On y explique en commentaire la réduction vers RelEqu.
© L’indécidabilité de RiceP est fournie par le théorème de Rice :
Théorème 14
Soit ∅ ( P ( RE. Le problème RiceP est indécidable.
858
Réductions classiques
On peut classifier les problèmes décidables par difficulté (que l’on définit à l’aide
des machines de Turing, voir page 666). Par exemple, les problèmes qui sont
décidés par une machine de Turing déterministe ou non déterministe, en temps ou
espace polynomial ou exponentiel, etc. Pour caractériser les problèmes canoniques
d’une classe X, on introduit la notion de problème X-dur et X-complet. Ces notions
reposent sur le concept de réduction, chaque classe X utilisant un type de réduction
spécifique.
wA wB = f (wA ) oui
f B non
Les classes de complexités étudiées dans ce livre utilisent deux types de réductions :
en espace logarithmique et en temps polynomial.
1 Réduction en espace logarithmique
Quand on parle de problèmes NL-complets et P-complets, la réduction associée
est une réduction en espace logarithmique.
Classe X NL P
[
NSpace (ln n) Time nk
k>0
Définition
Problèmes décidés par Problèmes décidés par
une machine de Turing une machine de Turing
non déterministe en es- déterministe en temps
pace logarithmique polynomial
entrée :
une formule ϕ de la logique propositionnelle sous forme
2Sat normale conjonctive avec 2 littéraux par clause ;
sortie : oui si ϕ est satisfiable, non sinon.
(
entrée : un graphe orienté G, deux sommets s et t ;
Access
sortie : oui s’il existe un chemin de s à t dans G, non sinon.
(
entrée : une grammaire algébrique G ;
VideGram
sortie : oui si L(G) = ∅, non sinon.
(
entrée : une formule propositionnelle ϕ en clauses de Horn ;
HornSat
sortie : oui si ϕ est satisfiable, non sinon.
entrée :un graphe G orienté pondéré, deux sommets s et t
et une valeur k ;
FlotMax
sortie : oui s’il existe un flot de capacité supérieure à k entre
les sommets s et t dans G, non sinon.
(
entrée : un automate A ;
VideAut
sortie : oui si L(A) = ∅, non sinon.
860
Réductions classiques
Classe X NP PSpace
[
Space nk
[
k
NTime n
k>0 k>0
Définition
Exemples de
problèmes • QbfSat
Voir page 863.
X-complets • UnivAut (Dév. 121)
Pour la classe PSpace, on n’a pas besoin de spécifier si la machine de Turing est
déterministe ou non, puisque le théorème de Savitch nous donne
PSpace = NPSpace.
(
entrée : une formule ϕ booléenne quantifiée ;
QbfSat
sortie : oui si ϕ est satisfiable, non sinon.
(
entrée : un automate A sur l’alphabet Σ ;
UnivAut
sortie : oui si L(A) = Σ∗ , non sinon.
861
Problèmes NP-complets
f (w) oui
w
traduction f B non
Définition 97 (NP-dur)
On dit qu’un problème A est NP-dur (ou NP-difficile) si, pour tout pro-
blème L ∈ NP, L se réduit en temps polynomial à A.
Proposition 8
Si A est un problème NP-dur et qu’il existe une réduction de A à B, alors B
est un problème NP-dur.
Définition 98 (NP-complet)
On dit qu’un problème A est NP-complet s’il est à la fois dans NP et NP-dur.
Dév. 125
Graphes A
On réduit
le problème A
Packing
PVC au problème B
B
Automates CnfSat
HamCirc Max2Sat
3Sat
VertexCover
SubsetSum
3Col
IndepSet BinPacking
Clique
Partition
SacÀDos
On dresse ci-après la liste des problèmes NP-complets qui sont présents dans le
schéma de réductions.
(
entrée : une formule ϕ en logique propositionnelle ;
Sat
sortie : oui si ϕ est satisfiable, non sinon.
entrée :
une formule ϕ en logique propositionnelle sous forme
CnfSat normale conjonctive ;
sortie : oui si ϕ est satisfiable, non sinon.
entrée :
une formule ϕ en logique propositionnelle sous forme
3Sat normale conjonctive avec 3 littéraux par clause ;
sortie : oui si ϕ est satisfiable, non sinon.
864
Problèmes NP-complets
entrée : une formule ϕ en logique propositionnelle sous forme
normale conjonctive avec 2 littéraux par clause, k ∈ N ;
Max2Sat
sortie : oui si on peut trouver au moins k clauses de ϕ qui
peuvent être satisfaites simultanément, non sinon.
entrée :
deux langages finis S et T et un entier k ∈ N ;
PSA sortie : oui s’il existe un automate A déterministe à au plus k états
tel que S ⊂ L(A) et T ∩ L(A) = ∅, non sinon.
entrée :
un ensemble fini A ⊂ N et un entier t ∈ N ;
X
SubsetSum sortie : oui s’il existe A0 ⊂ A tel que a = t, non sinon.
0 a∈A
entrée : un ensemble fini A, w : A → N et c, k ∈ N ;
sortie : oui s’il existe une application r : A → J1, kK telle
BinPacking X
que ∀j ∈ J1, kK, w(a) 6 c, non sinon.
a∈r−1 (j)
865
entrée :
un graphe G = (S, A) non orienté et j 6 |S| ;
VertexCover sortie : oui s’il existe S 0 ⊂ S avec |S 0 | 6 j telle que
pour tout uv ∈ A, u ∈ S 0 ou v ∈ S 0 , non sinon.
(
entrée : un graphe G = (S, A) non orienté et un entier j 6 |S| ;
Clique
sortie : oui s’il existe une clique de taille j dans G, non sinon.
entrée :
un graphe G = (S, A) non orienté et j 6 |S| ;
IndepSet sortie : oui si G contient un ensemble indépendant de
taille j, non sinon.
(
entrée : un graphe G = (S, A) non orienté ;
HamCirc
sortie : oui si G admet un cycle hamiltonien, non sinon.
entrée :un graphe G = (S, A) non orienté complet pondéré par
des entiers relatifs et un entier j ∈ N ;
PVC
sortie : oui s’il existe un cycle hamiltonien de poids inférieur à j,
non sinon.
Commentaires.
© Le schéma de réduction proposé ci-avant n’est qu’une suggestion de réductions
puisque, comme tous les problèmes que l’on considère ici sont NP-complets, il existe
une réduction de n’importe quel problème vers n’importe quel autre problème,
ainsi si l’on voulait dessiner toutes les réductions possibles, le graphe obtenu serait
complet.
© La NP-complétude du problème Sat vient du théorème de Cook-Levin, voir
Développement 124.
© La transformation de Tseitin, voir Développement 125, donne la réduction de
Sat à CnfSat. On y explique en commentaire la réduction vers 3Sat.
© Pour le problème PSA, on dit que l’automate A sépare les langages S et T ,
d’où le nom « Problème de Séparation par Automates », puisque l’automate A
accepte tous les mots de S et rejette tous les mots de T . La réduction de Sat à
PSA est détaillée dans le Développement 120.
© Pour le problème 3Col, on dit que l’application c est une 3-coloration de G,
on dit qu’un graphe G est 3-coloriable si on peut colorier tous les sommets avec
seulement 3 couleurs sans que deux sommets d’une même couleur soient reliés par
une arête, voir Développement 113.
© Pour le problème VertexCover, on veut colorier certains sommets (corres-
pondant à ceux dans S 0 ) de sorte que chaque arête ait une de ses extrémités
coloriée. On peut imaginer que le graphe représente une ville avec des places (les
866
Problèmes NP-complets
sommets) et des rues (les arêtes) et on veut mettre des lampadaires sur certaines
places afin que toutes les rues soient éclairées.
© Pour le problème IndepSet, on veut sélectionner certains sommets de sorte
qu’aucune paire des sommets sélectionnés ne soient reliés par une arête.
© Les problèmes VertexCover, IndepSet et Clique sont équivalents, et cha-
cun se déduit de l’autre en complémentant le graphe ou en prenant le complé-
mentaire de l’ensemble S 0 dans S. On peut résumer cela dans la proposition
suivante :
867
Annexes
Liste des leçons
873
162 Systèmes d’équations linéaires ; opérations élémentaires, aspects algorithmiques et
conséquences théoriques.
170 Formes quadratiques sur un espace vectoriel de dimension finie. Orthogonalité,
isotropie. Applications.
171 Formes quadratiques réelles. Coniques. Exemples et applications.
181 Barycentres dans un espace affine réel de dimension finie, convexité. Applications.
190 Méthodes combinatoires, problèmes de dénombrement.
191 Exemples d’utilisation des techniques d’algèbre en géométrie.
874
Liste des leçons
239 Fonctions définies par une intégrale dépendant d’un paramètre. Exemples et appli-
cations.
241 Suites et séries de fonctions. Exemples et contre-exemples.
243 Séries entières, propriétés de la somme. Exemples et applications.
245 Fonctions d’une variable complexe. Exemples et applications.
246 Séries de Fourier. Exemples et applications.
250 Transformation de Fourier. Applications.
253 Utilisation de la notion de convexité en analyse.
261 Loi d’une variable aléatoire : caractérisations, exemples, applications.
262 Convergences d’une suite de variables aléatoires. Théorèmes limite. Exemples et
applications.
264 Variables aléatoires discrètes. Exemples et applications.
265 Exemples d’études et d’applications de fonctions usuelles et spéciales.
266 Illustration de la notion d’indépendance en probabilités.
267 Exemples d’utilisation de courbes en dimension 2 ou supérieure.
875
Liste des leçons
877
228 Continuité, dérivabilité, dérivation faible des fonctions réelles d’une variable réelle.
Exemples et applications.
229 Fonctions monotones. Fonctions convexes. Exemples et applications.
230 Séries de nombres réels ou complexes. Comportement des restes ou des sommes
partielles des séries numériques. Exemples.
233 Analyse numérique matricielle. Résolution approchée de systèmes linéaires, recherche
d’éléments propres, exemples.
236 Illustrer par des exemples quelques méthodes de calcul d’intégrales de fonctions
d’une ou plusieurs variables.
239 Fonctions définies par une intégrale dépendant d’un paramètre. Exemples et appli-
cations.
241 Suites et séries de fonctions. Exemples et contre-exemples.
243 Séries entières, propriétés de la somme. Exemples et applications.
246 Séries de Fourier. Exemples et applications.
250 Transformation de Fourier. Applications.
262 Convergences d’une suite de variables aléatoires. Théorèmes limite. Exemples et
applications.
264 Variables aléatoires discrètes. Exemples et applications.
265 Exemples d’études et d’applications de fonctions usuelles et spéciales.
878
Liste des leçons
Leçons d’informatique
901 Structures de données. Exemples et applications.
903 Exemples d’algorithmes de tri. Correction et complexité.
907 Algorithmique du texte. Exemples et applications.
909 Langages rationnels et automates finis. Exemples et applications.
912 Fonctions récursives primitives et non primitives. Exemples.
913 Machines de Turing. Applications.
914 Décidabilité et indécidabilité. Exemples.
915 Classes de complexité. Exemples.
916 Formules du calcul propositionnel : représentation, formes normales, satisfiabilité.
Applications.
918 Systèmes formels de preuve en logique du premier ordre. Exemples.
921 Algorithmes de recherche et structures de données associées.
923 Analyses lexicale et syntaxique. Applications.
924 Théories et modèles en logique du premier ordre. Exemples.
925 Graphes : représentations et algorithmes.
926 Analyse des algorithmes : complexité. Exemples.
927 Exemples de preuve d’algorithme : correction, terminaison.
928 Problèmes NP-complets : exemples et réduction.
929 Lambda-calcul pur comme modèle de calcul. Exemples.
930 Sémantique des langages de programmation. Exemples.
931 Schémas algorithmiques. Exemples et applications.
932 Fondements des bases de données relationnelles.
879
Correspondances entre
leçons et développements
01 02 03 04 05 06 07 08 20 21 22 23 25 26 41 42 44 50 N° dvp.
Heisenberg 1 1 1
Dixon 1 1 1 2
Gén. SL2 (Z) 1 1 1 1 1 1 1 3
CNS transpo. 1 1 4
Groupes trans. 2 2 2 2 5
Landau 2 2 2 2 6
Permut. commutant 2 2 2 7
Groupes pq 1 1 1 8
Groupes 105 3 3 3 3 9
Caractères diédraux 1 1 1 1 10
Burnside 3 3 3 3 3 11
Cohn 1 1 1 12
Hensel 1 1 1 1 13
Chevalley-Warning 2 2 14
d’Alembert-Gauss 1 1 1 15
Krull 2 16
Cyclicité F∗p 2 2 2 2 17
Autom. Fq 1 1 1 18
Morphismes cyclo. 1 1 1 1 1 1 1 19
Autom. C 3 3 3 20
Artin 3 3 3 21
Entier carré-cube 2 2 2 22
Val. abs. Q 2 2 23
Fermat cyclo. 3 3 3 3 3 3 3 24
Waring mod. 3 3 3 3 3 25
Sherman-Morrison 26
Quaternions 1 1 1 1 27
Schwartz-Zippel 2 2 28
Faddeev 1 29
Consv. det 1 1 30
Consv. rg 31
Chebotarev 3 3 3 32
Image exp. 33
Décomp. polaire 1 1 34
01 02 03 04 05 06 07 08 20 21 22 23 25 26 41 42 44 50 N° dvp.
882
Correspondances entre leçons et développements
51 52 53 54 55 56 57 58 59 60 61 62 70 71 81 90 91 N° dvp.
Heisenberg 1
Dixon 1 1 1 2
Gén. SL2 (Z) 3
CNS transpo. 4
Groupes trans. 2 5
Landau 6
Permut. commutant 2 7
Groupes pq 8
Groupes 105 3 9
Caractères diédraux 10
Burnside 11
Cohn 12
Hensel 13
Chevalley-Warning 2 14
d’Alembert-Gauss 15
Krull 16
Cyclicité F∗p 17
Autom. Fq 18
Morphismes cyclo. 19
Autom. C 20
Artin 3 21
Entier carré-cube 22
Val. abs. Q 23
Fermat cyclo. 24
Waring mod. 3 25
Sherman-Morrison 1 1 1 26
Quaternions 1 1 1 1 27
Schwartz-Zippel 2 2 28
Faddeev 1 1 1 29
Consv. det 1 1 30
Consv. rg 2 31
Chebotarev 3 32
Image exp. 2 2 33
Décomp. polaire 1 1 1 1 34
51 52 53 54 55 56 57 58 59 60 61 62 70 71 81 90 91 N° dvp.
883
01 02 03 04 05 06 07 08 20 21 22 23 25 26 41 42 44 50 N° dvp.
Réduc. nilp. 35
Décomp. Dunford 36
Smith 2 2 37
Sous-alg. réd. 38
Engel 39
Billard 1 1 40
Plongeoirs 41
Carathéodory 42
Trois réflexions 1 43
Killing-Hopf 1 1 44
Solides Platon 2 2 2 2 45
Hermite 46
Semi-réduites 47
Minkowski FQ 48
Brouwer 2 53
Cartan-Neumann 1 55
Liapounov 56
Extrema liés 57
Suite polygones 69
Choquet-Birkhoff 71
Gauss-Seidel 75
Relaxation 76
Kaczmarz 77
Jordan 80
Formes mod. 81
Minkowski réseau 89
Lagrange 2 91
Approx. polyn 2 2 92
Penney 94
Pólya dén. 98
Fourier rapide 2 106
Polyn. chrom. 113
Turán 114
Formule d’Euler 115
01 02 03 04 05 06 07 08 20 21 22 23 25 26 41 42 44 50 N° dvp.
884
Correspondances entre leçons et développements
51 52 53 54 55 56 57 58 59 60 61 62 70 71 81 90 91 N° dvp.
Réduc. nilp. 1 1 1 1 1 35
Décomp. Dunford 1 1 36
Smith 2 2 37
Sous-alg. réd. 2 2 38
Engel 3 3 3 39
Billard 1 40
Plongeoirs 2 2 41
Carathéodory 1 1 42
Trois réflexions 1 1 43
Killing-Hopf 1 1 1 44
Solides Platon 2 2 2 2 45
Hermite 1 1 46
Semi-réduites 2 2 2 47
Minkowski FQ 3 3 3 3 48
Brouwer 53
Cartan-Neumann 1 55
Liapounov 1 1 1 1 56
Extrema liés 2 2 57
Suite polygones 2 69
Choquet-Birkhoff 2 71
Gauss-Seidel 1 75
Relaxation 1 1 1 76
Kaczmarz 1 1 77
Jordan 3 3 3 3 80
Formes mod. 3 81
Minkowski réseau 2 89
Lagrange 91
Approx. polyn 92
Penney 1 1 1 94
Pólya dén. 2 98
Fourier rapide 106
Polyn. chrom. 1 113
Turán 2 114
Formule d’Euler 2 115
51 52 53 54 55 56 57 58 59 60 61 62 70 71 81 90 91 N° dvp.
885
01 03 04 05 07 08 09 13 14 15 19 20 21 22 23 26 28 29 30 N° dvp.
Heisenberg 1
Autom. C 3 20
Val. abs. Q 2 23
Schwartz-Zippel 28
Image exp. 2 2 33
Décomp. polaire 1 34
Plongeoirs 2 41
Op. compacts 2 2 2 2 50
Compacts Hilbert 2 2 2 49
Mityagin 2 51
Isom. non surj. 2 2 2 52
Brouwer 2 53
Riesz-Fischer 1 1 1 54
Cartan-Neumann 1 1 55
Liapounov 1 1 1 56
Extrema liés 2 2 2 57
Cauchy-Peano 2 2 2 2 2 58
Solow-Swan 1 1 1 59
Logistique 1 1 60
Modèle SIS 2 2 61
Modèle SIR 2 2 62
Riccati 2 2 2 63
Lotka-Volterra 3 3 3 64
Ondes 1 1 65
Bien posé 2 2 2 2 2 66
Contrôlabilité 3 3 3 3 3 67
Archimède 1 1 68
Suite polygones 2 2 69
Fractions continues 2 2 70
Choquet-Birkhoff 2 2 71
Nash 2 2 72
Frenet-Serret 73
01 03 04 05 07 08 09 13 14 15 19 20 21 22 23 26 28 29 30 N° dvp.
886
Correspondances entre leçons et développements
33 34 35 36 39 41 43 45 46 50 53 61 62 64 65 66 67 N° dvp.
Heisenberg 1 1
Autom. C 20
Val. abs. Q 23
Schwartz-Zippel 2 28
Image exp. 33
Décomp. polaire 34
Plongeoirs 41
Op. compacts 50
Compacts Hilbert 49
Mityagin 51
Isom. non surj. 2 52
Brouwer 2 53
Riesz-Fischer 1 1 54
Cartan-Neumann 55
Liapounov 56
Extrema liés 2 57
Cauchy-Peano 2 58
Solow-Swan 59
Logistique 60
Modèle SIS 2 61
Modèle SIR 62
Riccati 63
Lotka-Volterra 3 3 64
Ondes 1 65
Bien posé 2 2 66
Contrôlabilité 67
Archimède 1 68
Suite polygones 69
Fractions continues 70
Choquet-Birkhoff 2 71
Nash 2 2 72
Frenet-Serret 1 73
33 34 35 36 39 41 43 45 46 50 53 61 62 64 65 66 67 N° dvp.
887
01 03 04 05 07 08 09 13 14 15 19 20 21 22 23 26 28 29 30 N° dvp.
Descente grad. 1 1 1 1 1 1 74
Gauss-Seidel 1 1 75
Relaxation 1 76
Kaczmarz 1 77
Monodromie 1 1 78
Holomorphie 2 2 79
Jordan 80
Formes mod. 3 81
Fresnel 1 1 1 82
1
Primitiv. /2 1 1 1 83
Phase stat. 1 84
Paley-Wiener 1 85
Plancherel 2 2 2 2 2 86
Prolong. ζ 2 87
Fejér-Cesàro 1 1 1 1 88
Minkowski réseau 2 89
Taubérien 1 1 1 90
Lagrange 2 91
Approx. polyn 2 92
Buffon 93
Penney 1 1 94
Stirling TCL 95
Marche aléa. 2 2 96
LGN 97
Pólya dén. 2 98
Pólya ana. 2 99
Grandes dévia. 100
Cramér-Chernoff 3 3 3 101
Tirage population 105
Turán 114
Compacité logique 1 127
01 03 04 05 07 08 09 13 14 15 19 20 21 22 23 26 28 29 30 N° dvp.
888
Correspondances entre leçons et développements
33 34 35 36 39 41 43 45 46 50 53 61 62 64 65 66 67 N° dvp.
Descente grad. 1 74
Gauss-Seidel 1 75
Relaxation 1 76
Kaczmarz 1 77
Monodromie 1 78
Holomorphie 2 79
Jordan 3 80
Formes mod. 3 3 3 81
Fresnel 1 1 1 1 1 1 82
1
Primitiv. /2 1 1 1 83
Phase stat. 1 84
Paley-Wiener 1 1 1 85
Plancherel 2 2 2 86
Prolong. ζ 2 2 2 2 2 87
Fejér-Cesàro 1 1 1 1 88
Minkowski réseau 2 2 89
Taubérien 1 90
Lagrange 2 91
Approx. polyn 92
Buffon 1 1 1 93
Penney 1 1 1 1 94
Stirling TCL 1 1 1 95
Marche aléa. 2 2 2 2 96
LGN 2 2 2 97
Pólya dén. 2 2 2 98
Pólya ana. 2 2 2 2 2 2 99
Grandes dévia. 2 2 2 2 100
Cramér-Chernoff 3 3 3 3 101
Tirage population 2 2 105
Turán 2 114
Compacité logique 127
33 34 35 36 39 41 43 45 46 50 53 61 62 64 65 66 67 N° dvp.
889
901 903 907 909 912 913 914 915 916 918 921 N° dvp.
Chevalley-Warning 14
Tri rapide 2 102
Tri par tas 1 1 103
Kendall 2 104
Tirage population 105
Fourier rapide 2 106
B-arbres 2 2 107
Palindromes 1 108
Turing-calc. =⇒ µ-réc. 2 2 109
Caractérisation RE 2 2 2 110
µ-réc. =⇒ λ-déf. 2 111
Scott-Curry 112
Polyn. chrom. 113
Turán 114
Formule d’Euler 115
Voyageur commerce 116
Tri topo. 1 117
Graphe Bruijn 1 1 118
Recherche motifs 2 2 2 119
Sépar. automate 1 1 120
Univ. automate 2 2 121
CYK 1 1 122
Fonction Premier LL(1) 123
Cook-Levin 1 1 1 124
Transfo. Tseitin 1 1 125
2Sat est NL-dur 2 2 126
Compacité logique 1 1 127
Indécid. ValidFO 2 128
Indécid. RelSat 3 129
Logique Hoare 130
Sémantiques 131
901 903 907 909 912 913 914 915 916 918 921 N° dvp.
890
Correspondances entre leçons et développements
923 924 925 926 927 928 929 930 931 932 N° dvp.
Chevalley-Warning 2 14
Tri rapide 2 2 102
Tri par tas 1 1 103
Kendall 2 2 104
Tirage population 2 2 105
Fourier rapide 2 106
B-arbres 2 107
Palindromes 108
Turing-calc. =⇒ µ-réc. 109
Caractérisation RE 110
µ-réc. =⇒ λ-déf. 2 111
Scott-Curry 2 112
Polyn. chrom. 1 113
Turán 2 114
Formule d’Euler 2 115
Voyageur commerce 1 1 116
Tri topo. 1 1 117
Graphe Bruijn 1 118
Recherche motifs 119
Sépar. automate 1 120
Univ. automate 121
CYK 1 1 122
Fonction Premier LL(1) 2 123
Cook-Levin 1 124
Transfo. Tseitin 1 125
2Sat est NL-dur 2 2 126
Compacité logique 1 127
Indécid. ValidFO 2 128
Indécid. RelSat 3 129
Logique Hoare 3 3 130
Sémantiques 3 131
923 924 925 926 927 928 929 930 931 932 N° dvp.
891
157
154
159
181 204
892
Plongeoirs Carathéodory Décomp. Dunford Engel
214
Réduc. nilp.
219
Sherman-Morrison
Krull 162
153 Image exp. Semi-réduites
Faddeev 171
Entier carré-cube 151 170
Sous-alg. réd.
Val. abs. Q Minkowski FQ
Consv. rg
Chebotarev 152
Fermat cyclo. Hermite
207 223 Hensel
Smith Consv. det 156
155 203
Artin 158
126 122 142
Autom. C 264
150 Décomp. polaire
Schwartz-Zippel
120 Quaternions 106
144
141
160
125 102
121 Billard
d’Alembert-Gauss Gén. SL2 (Z) 191
Chevalley-Warning
123
101 Killing-Hopf
190 108
925 Burnside
103 104
Groupes pq
107 105
246
Heisenberg
191 221
220 159 267
106 Logistique
Extrema liés
229 Lotka-Volterra
Choquet-Birkhoff Brouwer
Gauss-Seidel Liapounov 219 101
Ondes
Cauchy-Peano
181
215 228 Mityagin
Fractions continues
233 223 Modèle SIS Contrôlabilité
213
226 Archimède Nash
160 154
157 Bien posé 204
Kaczmarz 222
246 Cramér-Chernoff 203 234
162 Op. compacts
153 265 Phase stat.
Formes mod.
Pólya ana. 208
Grandes dévia.
Relaxation
236 Isom. non surj.
201
152 Jordan Fejér-Cesàro 241
Compacts Hilbert
155 1
261 Marche aléa. Primitiv. /2
Fresnel
Penney 245 Monodromie Riesz-Fischer
235 266
239
264 Prolong. ζ Plancherel
262
Buffon Holomorphie
209 207
Pólya dén.
Correspondances entre leçons et développements
230 205
LGN Paley-Wiener
Minkowski réseau
141
893
924
Compacité logique
894
918 Indécid. ValidFO
931
Tri topo. Turán
Tri par tas
102
Sémantiques
Tri rapide Kendall 930
264
927
926
261
Tirage population
898
BIBLIOGRAPHIE
[RMS01] RMS. Épreuves orales des concours d’entrée aux grandes écoles, No
110. RMS, 2001.
[Rou03] François Rouvière. Petit guide de calcul différentiel à l’usage de la
licence et de l’agrégation. Cassini, 2003.
[Sam67] P. Samuel. Théorie algébrique des nombres. Hermann, 1967.
[Ser67] J.-P. Serre. Représentations linéaires des groupes finis. Hermann,
1967.
[Sha92] A. Shamir. Ip = pspace. J. ACM, 39(4) :869–877, October 1992.
[SKV04] M. G. Sergei, V. K. Kira, and V. K. Vladislav. On a quaternionic
maxwell equation for the time-dependent electromagnetic field in a
chiral medium. Journal of Physics A : Mathematical and General,
37(16) :4641–4647, apr 2004.
[SvdW28] O. Schreier and B. L. van der Waerden. Die automorphismon der
projektiven gruppen. In Abhandlungen aus dem Mathematischen
Seminar der Universität Hamburg, volume 6, pages 303–322. Springer,
1928.
[Tau08] P. Tauvel. Corps commutatifs et théorie de Galois. Calvage & Mounet,
2008.
[Ten08] G. Tenenbaum. Introduction à la théorie analytique et probabiliste des
nombres. coll. Échelles. Belin, 2008.
[Tes12] F. Testard. Analyse mathématique - la maîtrise de l’implicite. Calvage
& Mounet, 2012.
[Tis10] A. Tissier. R502 : Une étude qualitative d’équation différentielle. In
Revue de la Filière Mathématiques, number 120–4. 2010.
[Vau97] R. C. Vaughan. The Hardy-Littlewood method. Cambridge University
Press, 1997.
[Wol06] P. Wolper. Introduction à la calculabilité. Dunod, 2006.
899
Index
901
de Tarjan, 714, 749, 804 couvrant minimal, 738
de Thompson, 757, 778 de dérivation, 760, 787, 824, 830,
de Wiedemann, 159 850
α équilibré, 663
conversion, 678 quasi-complet, 638
analycité de recherche, 625, 663
des intégrales à paramètres, 523 rouge/noir, 663
analyse arc, 298, 481, 492, 713, 742, 743, 747,
ascendante, 783 755, 803
descendante, 783 entrant, 714, 748, 755
harmonique abélienne, 5 sortant, 714, 744, 748
lexicale, 753 Archimède
syntaxique, 753, 759, 779, 784 méthode d’, 409, 569
angle arête, 19, 77, 152, 705, 729, 731, 739,
d’Euler, 145 751, 866
orienté, 11, 220, 240 incidente, 706
anneau Artin
des entiers, 71, 95, 119, 120 théorème d’, 103
euclidien, 17, 67, 109, 201 attribut, 658, 817, 839
factoriel, 109, 126 automate, 665, 754, 763, 836, 858,
local, 81 863
noethérien, 81 calcul d’un, 755
complet, 755, 763, 775
principal, 83, 110
déterministe, 755, 763, 768, 775
apériodique
fini, 763, 768
matrice, 416
langage reconnu, 755
approximation
minimal, 757, 763, 836
algorithme d’, 366, 412, 656, 738
des parties, 756, 775
diophantienne, 420
à pile, 758
de fonctions, 290, 421, 430, 532,
universalité d’un, 774, 858
539, 545, 552, 655
automorphisme
de fonctions par densité, 547
de corps, 92, 96, 103, 122
de l’identité, 519
axiome, 101, 758, 783, 809, 850
d’un irrationnel, 417
du choix, 101, 809
de π, 409, 565
polynomiale, 536, 547, 552, 557 B-arbre
des solutions d’un système structure de, 658, 846
linéaire, 445, 453 Babai
de l’unité, 535, 543 théorème de, 26
arbre, 625, 634, 658, 709, 729, 738, Banach
787, 791, 798, 806, 807, 824, théorème d’isomorphisme de,
830, 837, 850 398
AVL, 663 barycentre, 226, 413
B-arbre, 658, 846 base
complet, 638 adaptée, 206
couvrant, 710, 738, 806 incomplète, 101, 168
902
INDEX
903
théorème de, 158, 179, 195, 208, classe
210 de complexité, 671, 741, 774, 859
central limite classes
théorème, 563, 568, 580, 613, 620 formule des, 54, 255
centralisateur, 10, 48, 57 classe C 1 , 323
centre, 10, 57, 138, 212 classification
d’une algèbre de Lie, 212 des formes quadratiques, 217
cercle des groupes finis, 26, 47, 58
caustique, 219 des groupes simples, 47
méthode du, 131 clique, 706, 724, 734, 867
Cesàro clôture algébrique, 79, 89, 93, 96,
moyenne de, 494, 535 106, 135, 198
théorème de, 531 codage
chaîne de Gödel, 689, 700
de Markov, 360, 414, 416, 573, coefficient
588, 599, 606 binomial, 25, 174, 837
récurrente, 599, 606 de Fourier, 383, 487, 531, 657
transiente, 599, 606 multinomial, 26
chaleur coercive, 263, 396
équation de la, 386, 538 forme quadratique, 263
changement de variable, 368, 479, cofacteur, 157
499, 537, 540 colonne
Chebotarev d’une matrice, 167, 260
théorème de, 172 coloration, 717, 730, 736, 741, 838,
chemin, 18, 145, 179, 285, 298, 416, 866
461, 477, 510, 706, 725, 738, de graphes, 77, 709
745, 747, 769, 802 comatrice, 136, 162, 470
eulérien, 710, 747 formule de la, 136, 470
hamiltonien, 711, 738, 750 combinateur
Chevalley-Warning de point fixe, 681, 696
théorème de, 73 compacité
chinois dénombrable, 809
théorème des restes, 42, 85, 160, séquentielle, 809
161 théorème de, 789, 807
Choquet compact, 186, 230, 238, 249, 263,
théorème de, 423 277, 281, 291, 296, 374, 416,
chromatique 423, 429, 471, 479, 531, 560,
nombre, 709, 721, 727 591, 807
polynôme, 717 ensemble, 277, 423, 429
Church-Rosser d’un espace de Hilbert, 277
théorème de, 679 opérateur, 280, 281
Church-Turing théorème de sortie de tout, 339
thèse de, 665 complet
circuit, 714, 747 espace, 275, 303
eulérien, 747 système de connecteurs, 801
904
INDEX
905
de nombres, 54, 61, 95, 119, 122, De Bruijn
543 graphe de, 747
p-adique, 118 De Morgan
correction, 634, 640, 644, 743, 825, lois de, 798
853 décomposition
correspondance corps de, 78, 89, 106, 199
de Galois, 91, 107 de Dunford, 183, 192, 194, 317,
couplage parfait, 152 476
courbe, 328, 342, 358, 461, 535 en éléments simples, 356, 492
elliptique, 71, 111 en facteurs premiers, 30, 84, 94,
paramétrée, 437 116
courbure, 437 de Jordan, 133, 192, 198, 469
Cramér-Chernoff en produit de cycles, 35
théorème de, 615, 617 degré, 20, 64, 70, 73, 78, 82, 87, 89,
creuse 95, 103, 111, 120, 132, 143,
matrice, 449 147, 164, 173, 199, 211, 217,
critère 300, 341, 417, 472, 555, 557,
d’Abel, 387 651, 665, 706, 724, 731, 742,
de Cauchy, 304, 495 749, 796, 807, 858
critique entrant, 714, 749
point, 232, 367–370, 442, 618 d’un sommet, 20, 731
crochet sortant, 714, 749
de dualité, 402 Delta-méthode, 569
de Lie, 212 dense
croissance sous-groupe, 220
économique, 341 densité, 96, 136, 277, 426, 497, 507,
logistique, 347, 359 583, 588, 597, 621, 649, 728
Csanky des matrices inversibles, 136
algorithme de, 160 dérivation, 309, 347, 383, 409, 485,
cuspidale 498, 509, 618, 759, 780, 783,
forme modulaire, 482 824, 830, 850
cycle, 19, 29, 35, 706, 725, 734, 738, des intégrales à paramètres, 510
745, 768, 806 terme à terme, 383
eulérien, 710 dérivée
hamiltonien, 669, 711, 738 faible, 388, 396
orienté, 714 descente
cyclique de gradient, 441
espace, 190 déterminant, 11, 53, 133, 135, 140,
groupe, 41, 47, 84, 91, 95, 128 152, 157, 163, 170, 173, 182,
sous-espace, 190, 474 201, 217, 247, 262, 267, 270,
cyclotomique 383, 451, 470, 499, 657, 709
corps, 92, 120 de Vandermonde, 177
polynôme, 94, 121, 174, 657 déterminisme, 151, 353, 433, 627,
CYK 668, 687, 763, 768, 834, 860,
algorithme, 779 863
906
INDEX
907
nilpotent, 190, 212 de Nérode, 757, 764
trigonalisable, 183, 211 ergodique
Engel chaîne de Markov, 416
théorème d’, 212 Erlangen
ensemble programme d’, 258
inductif, 98 espace
de Kakeya, 147 complet, 275, 303
ensemble indépendant, 708, 724, 867 cyclique, 190
entier de Hilbert, 277, 281, 285, 388,
algébrique, 54, 61, 120 396
de Barendregt, 681, 702 propre, 139, 207, 416, 475
de Church, 680 vectoriel normé, 184, 189, 280,
énumérateur, 669 281, 303, 423, 459, 560, 597
enveloppe convexe, 68, 236, 428, 467 espérance, 436, 567, 572, 580, 589,
épidémie, 350, 353, 361 594, 617, 627, 649, 725
équation d’une variable aléatoire, 580,
de Bachet, 112 617, 649
bien posée, 388, 397 estimation
de la chaleur, 386, 538 paramétrique, 565
aux dérivées partielles, 306, 309, étoilé, 238, 296
381, 388, 397, 532 étoile
différentielle, 133, 309, 341, 347, lemme de l’, 757
353, 361, 367, 372, 381, 494, Euclide
502, 512, 620 algorithme d’, 17, 111, 161, 206,
différentielle autonome, 342, 354, 421, 625
374 Euclide étendu
différentielle de Bernoulli, 341, algorithme d’, 161
351 euclidien
diophantienne, 3, 70, 109, 118, anneau, 17, 67, 109, 201
128, 217 Euler
fonctionnelle, 527 fonction Γ d’, 495, 524, 590
de Navier-Stokes, 404 formule d’, 258, 532, 713, 731
des ondes, 381 eulérien
de transport, 385, 388, 396 chemin, 710, 747
équidistribution, 594 circuit, 747
équilibre, 133, 225, 341, 347, 372 explosion
attractif, 341 théorème d’, 321, 339, 348, 354,
de Nash, 133, 429 363, 370, 374
d’un système dynamique, 341, exponentielle
355 de matrice, 178, 188
équiprobabilité, 35 expression
équisatisfiabilité, 797 régulière, 754, 766, 772, 777
équivalence extension
logarithmique, 621 algébrique, 99, 103, 119, 139, 199
de matrices, 163, 165 de corps, 61, 78, 89, 92, 101, 103,
908
INDEX
909
formule Fubini-Tonelli
2Cnf, 802 théorème de, 499, 540, 573, 585
de Binet-Cauchy, 177 fuchsien
du binôme, 69, 91, 123, 129, 195 groupe, 249
des classes, 54, 255 fullerène, 731
de la comatrice, 136, 470
de condensation, 162 Galois
de Duhamel, 391 correspondance de, 91, 107
d’Euler, 258, 532, 713, 731 groupe de, 91, 95, 106, 122, 199
théorème fondamental de la
d’inversion de Fourier, 5, 510
théorie de, 106
de Pascal, 149
théorie de, 57, 61, 94, 106, 199
de Poisson, 8, 512, 539
Γ
du produit, 118
fonction, 495, 524, 590
de réflexion, 527
Gauss
des résidus, 477
intégrale de, 491, 506, 507, 516,
de Sherman-Morrison, 137
523, 583
sommatoire de Poisson, 524, 539
lemme de, 68, 95
de Stirling, 40, 556, 580
pivot de, 137, 160, 204, 459, 652
de Vandermonde, 601
problème du cercle, 543
de Woodbury, 137
Gauss-Lucas
Fourier théorème de, 68
coefficient de, 383, 487, 531, 657 Gauss-Seidel
formule d’inversion de, 5, 510 méthode de, 428, 445, 454, 460
série de, 383, 487, 532, 561 Gelfand
transformée de, 5, 295, 505, 509, formule de, 450
514, 523, 540 gendarmes
transformée rapide, 651, 653 théorème des, 100
fraction générateur, 12, 23, 49, 81, 86, 93,
continue, 417 103, 129, 139, 204, 220, 239,
rationnelle, 119, 353, 421, 468, 243
492, 541, 577 d’un groupe, 14, 49, 239
Fréchet-von Neumann-Jordan de SL2 (Z), 14
théorème de, 280 génératrice
Frenet fonction, 24, 482, 542, 550, 570,
trièdre de, 437 606
Frenet-Serret géométrique
formules de, 437 loi, 570, 649
Fresnel Gershgorin
phase de, 507 disques de, 454
Frobenius théorème de, 451
morphisme de, 91 glouton
théorème de, 139 algorithme, 742, 836
Fubini Gödel
théorème de, 295, 470, 499, 540, codage de, 689, 700
573, 585, 589 Gorenstein, 47
910
INDEX
911
Herbrand d’un groupe, 10
théorème de, 807 induction, 52, 677, 690, 757, 778,
Hermite 792, 797, 807, 831, 848
inégalité d’, 267, 270 inégalité
théorème d’, 260, 270 de Bessel, 277, 286
Hessenberg de Bienaymé-Tchebychev, 567
algorithme de, 159 de Cauchy-Schwarz, 278, 291,
Hilbert 442, 584, 618
espace de, 277, 281, 285, 388, de Hadamard, 161, 162
396 de Jensen, 436
Hille-Yosida de Kolmogorov, 596
théorème de, 389 de Markov, 585, 619
holomorphe, 80, 407, 461, 470, 479, du parallélogramme, 279
487, 509 triangulaire, 55, 64, 114, 244,
fonction, 80, 461, 464, 470, 477, 282, 291, 297, 304, 424, 431,
492, 510 452, 465, 497, 503, 534, 554,
holomorphie 558, 582, 591, 738
domaine d’, 463, 466 ultramétrique, 118
homogène inflexion
fonction, 341 point d’, 367, 368, 370
homotopie, 289, 463 intégrale
Hopcroft sur un contour, 492
algorithme de, 757, 836 de Fresnel, 487
Horner de Gauss, 491, 506, 507, 516,
algorithme de, 652, 653 523, 583
méthode de, 198, 656
de matrices, 473
Hurwitz
à paramètre, 487, 490, 496, 502,
théorème de, 144
505, 510, 532, 539
hyperplan, 339
semi-convergente, 487
idéal intégration
d’une algèbre de Lie, 213 par parties, 32, 290, 396, 488,
d’un anneau, 81 503, 541
engendré par une partie, 82 interpolation
maximal, 81 de Lagrange, 185, 208, 552, 557,
principal, 120, 206 653, 655
Immerman-Szelepcsényi intersection
théorème de, 671, 805 lemme de Krull, 81
incertitude intervalle
de Heisenberg, 5 de confiance, 565
indécidabilité, 702, 782, 812, 817, de vie, 354, 363, 374
845, 855 invariant
indépendance de boucle, 637, 640, 743
de variables aléatoires, 565, 570, inversion
580, 588, 594, 599, 613, 619 de Fourier, 5, 510
indice inversion locale, 181, 301, 314
912
INDEX
913
récursivement énumérable, 668, 313
753 groupe de, 133, 189, 215, 301,
récursivement séparable, 682 309, 315
régulier, 753, 754, 766, 772, 778 Lie-Kolchin
résiduel, 766 théorème de, 211
laplacien ligne
en coordonnées polaires, 537 d’une matrice, 167, 457
Lax-Milgram en ligne
théorème de, 396, 402 algorithme, 648
Le Verrier Lindström
algorithme de, 155 théorème de, 810
Lebesgue linéaire
espace de, 275, 303 forme, 102, 191, 327
intégrale de, 563 Liouville
norme de, 303 théorème de, 512
théorème de, 510 lipschitzienne
Legendre fonction, 441
théorème de, 421 local-global, 70, 118, 132, 217
lemme logarithme, 183, 188, 296, 463, 613,
de Borel-Cantelli, 596 621, 685
de Dirichlet, 420 discret, 86
de l’étoile, 757 d’une matrice, 313
de Fatou, 619 logique
de Gauss, 68, 95 de Hoare, 625, 789, 824, 853
de Hensel, 69, 118, 132 du premier ordre, 101, 807, 812,
de Jordan, 528 817, 853, 855
de König, 809 propositionnelle, 791, 797, 807,
de Kronecker, 122, 596 828, 858, 863
de Nakayama, 81 logistique
d’Ogden, 761 croissante, 347, 359
des poignées de main, 733 modèle, 347
de Riemann-Lebesgue, 505, 512 loi
de Schur, 55, 58 de Bernoulli, 570, 588, 613, 622
de Schwartz-Zippel, 147 β, 588, 648
de Slutsky, 568, 587 faible des grands nombres, 618
de Sperner, 713 forte des grands nombres, 566,
de Zorn, 96, 809 579, 594
Lévy géométrique, 570, 649
théorème de, 592 des grands nombres, 565, 578,
Lewis-Carroll 596, 613
algorithme de, 162 de Poisson, 580, 647
Liapounov simulation, 647
fonction de, 377 uniforme, 599
Lie Lotka-Volterra
algèbre de, 133, 182, 212, 301, modèle de, 372
914
INDEX
915
de croissance, 341, 347, 359 équation de, 404
épidémiologique, 353, 361 Nérode
logistique, 347 équivalence de, 757, 764
de Lotka-Volterra, 372 Neumann
malthusien, 351 théorème de, 313
modélisation, 563 Newton
module, 55, 65, 119, 121, 189, 206, forme du binôme de, 69, 91, 123
219, 314, 453, 472, 505 méthode de, 71, 194, 648
sur un anneau, 81, 112, 201 somme de, 155
de continuité, 298 nilpotent, 166, 171, 183, 194, 207,
moment 212, 469
d’une variable aléatoire, 580 algèbre de Lie, 214
moments, 579, 590 endomorphisme, 190, 212
monodromie, 463 NL
théorème de, 463 complet, 805, 860
monoïde dur, 802
syntaxique, 766 noethérien
monotone anneau, 81
opérateur, 388 nombre
théorème de convergence, 304, algébrique, 54, 71, 103
583 chromatique, 709, 721, 727
Moore de classes, 13, 40, 126, 543
algorithme de, 757 p-adique, 132
morphisme nombres complexes
de corps, 89, 93, 96, 103, 108,
de module 1, 139, 219
122
nombre premier
F -morphisme de corps, 108
régulier, 125
de représentations, 58
théorème des, 33
sauvage, 96
non-déterminisme, 672, 756, 778,
µ-récursive
791, 811, 860, 863
fonction, 676, 682, 687, 692, 696,
non-terminaux, 758, 780, 783
700
normal
multiplicateur
vecteur, 437
de Lagrange, 232, 323
normale
multiplicativité
convergence, 488
des degrés, 91
norme
musée, 238
d’un entier algébrique, 122
nœud de Lebesgue, 303
d’interpolation, 555 noyau
de Tchebychev, 556 de la chaleur, 537
Nakayama de Dirichlet, 531
lemme de, 81 de Fejér, 531
Nash de Landau, 536
équilibre de, 133, 429 régulier, 519, 535
Navier-Stokes NP, 791, 803, 863
916
INDEX
917
Platon 557
solide de, 251, 731 minimal, 55, 90, 92, 100, 103,
plongement 122, 133, 142, 159, 174, 193,
planaire, 712, 731 198, 208, 475
plongeoir, 225 primitif, 68
poignées de main réciproque, 155, 657
lemme des, 733 scindé à racines simples, 207
Poincaré séparable, 106
demi-plan, 16, 477 Post
point problème de, 812, 817, 855
d’accumulation, 243, 313, 464, prédation, 347, 372
558 préfixe, 642, 747, 763
extrémal, 226, 423 Preparata et Sarwate
point d’équilibre, 341, 347, 353, 372 algorithme de, 159
stabilité, 347, 353 présentation
point fixe, 27, 35, 243, 296, 429, 442, d’un groupe, 13, 49, 54
454, 697, 713, 852 Prim
combinateur de, 681, 696 algorithme de, 639, 710, 740, 838
de Curry, 681 primitif
de Turing, 681, 699 élément, 90
Poisson vecteur, 260, 264
famille de, 536 primitif récursif
formule de, 8, 512, 539 fonction, 673
formule sommatoire de, 524, 539 prédicat, 675, 689
pôle primitivation, 496
d’une fonction, 522 principe
d’une rotation, 251 local-global, 70, 118, 132, 217
pôles, 407, 467, 470, 483 des tiroirs, 420, 425, 670
Pólya des zéros isolés, 462, 466, 481,
processus de, 648 510
théorème de, 599, 606 probabiliste
polyèdre, 251, 731 algorithme, 151, 159, 627
polygone, 51, 220, 409, 712, 734 probabilité, 563
régulier, 51, 409, 734 conditionnelle, 153, 592
polynôme problème
annulateur, 94, 159, 177, 207, de l’arrêt, 702, 858
417 bien posé, 385, 388, 397, 538
caractéristique, 155, 178, 193, de Cauchy, 385, 388, 397
195, 208, 210, 452, 469, 575 décidable, 625, 665, 692, 782,
chromatique, 717 815, 855, 859
cyclotomique, 94, 121, 174, 657 de décision, 669, 741, 753, 771,
d’endomorphisme, 156, 207 806
homogène, 82, 150, 154, 217 indécidable, 692, 782, 812, 817,
de Lagrange, 183, 552, 557 828, 855
de meilleure approximation, 555, du mot, 753, 758, 779
918
INDEX
919
en espace logarithmique, 805, intégrabilité, 307, 563
860 théorème de prolongement, 467
de Gauss, 163 Riemann-Lebesgue
en temps polynomial, 740, 768, lemme de, 505, 512
774, 791, 800, 860, 863 Riesz
réflexion, 10, 138, 219, 239, 243 théorème de, 396
formule de, 527 théorème de représentation de,
théorème des trois, 239 306, 401
règle Riesz-Fischer
conjonctive, 841 théorème de, 303
de production, 758, 783 Rolle
régulier théorème de, 369, 370
nombre premier, 125 rotation, 10, 50, 142, 182, 189, 222,
rejet 239, 247, 266, 663, 732
méthode de, 649 pôles d’une, 251
relation Roth
base de données, 841 théorème de, 730
de Bézout, 14, 56, 84, 115, 657 Rouché
d’orthogonalité, 5, 52, 56, 387, théorème de, 68
533 Runge
relaxation phénomène de, 655
méthode de, 451
Samuelson-Berkowitz
répartition
algorithme de, 155
fonction de, 568, 586, 646 Sat, 791, 800, 803
représentation 2Sat, 796, 802
adjointe, 212 3Sat, 796, 801, 805
de groupe, 49, 55 CnfSat, 768, 796, 800, 805
irréductible, 51, 58, 211 Max2Sat, 805
requête, 751, 817, 839 Max3Sat, 806
conjonctive, 842, 858 MaxnSat, 806
sûre, 844 QbfSat, 805
réseau, 16, 249, 542, 710 Sat-solvers, 796
de Bravais, 249 Savitch
maille de, 110 théorème de, 672, 775, 836, 861
résidus, 407, 469, 481, 511 schéma algorithmique, 639, 836
formule des, 477 Schreier et Van der Waerden
théorème des, 407, 469, 481, 511 théorème de, 211
résolvante, 469 Schur
reste lemme de, 55, 58
uniformément petit, 277, 281 Schwartz-Zippel
rétraction, 301 lemme de, 147
Rice Scott-Curry
théorème de, 702, 828, 858 théorème de, 682, 700
Riemann Selmer
fonction ζ de, 522 courbe de, 71
920
INDEX
sémantique, 677, 789, 813, 824, 841, faible, 310, 388, 396
847 forte, 388, 396
dénotationnelle, 834, 847 modale, 384
à grands pas, 825, 830, 850 stationnaire, 386
des langages de programmation, somme
824, 847 de Newton, 155
opérationnelle, 789, 824, 830, sommet, 20, 77, 152, 573, 666, 705,
847 724, 731, 738, 743, 747, 755,
opérationnelle à grands pas, 824, 803, 807
834, 849 accessible, 709
opérationnelle à petits pas, 828, adjacent, 77, 705, 729
834 prédécesseur de, 714
à petits pas, 830, 850 successeur de, 714
semi-convergente voisinage de, 705
intégrale, 487 Sophie Germain
semi-réduite théorème de, 125
forme quadratique, 264, 272 source, 714, 746, 751
matrice, 267, 268 sous-espace
semi-simple cyclique, 190, 474
endomorphisme, 192 vectoriel stable, 459
séparable, 100, 106, 199, 281, 307 sous-graphe, 19, 77, 707, 725, 810
espace de Hilbert, 277, 281, 285 induit, 707, 729
polynôme, 106 sous-groupe
séparation additif de R, 220
par automate, 768 de congruence, 14
de langages, 768 cyclique, 54, 84
séquençage ADN, 711, 747 sous-séquence croissante, 640
série sous-solution, 347, 353, 373
centrale descendante, 214 sous-suite, 278, 284, 304, 415, 424,
entière, 407, 545, 570 432, 462, 542, 683, 809
formelle, 26, 156 spectral
de Fourier, 383, 487, 532, 561 théorème, 133, 185, 260, 267, 283
Sherman-Morrison Sperner
formule de, 137 lemme de, 713
Slutsky spline cubique, 555
lemme de, 568, 587 SQL, 846
Smith stabilisateur, 251
forme normale, 17, 133, 201 stabilité
Snell-Descartes d’un équilibre, 341
loi de, 219 d’un point d’équilibre, 347, 353
Sobolev stathme, 112, 201
norme, 538 Stieltjes
solide intégrale de, 32
de Platon, 251, 731 Stirling
solution formule de, 40, 556, 580
921
stochastique vecteur, 437
matrice, 415, 416 Tarjan
Stone-Weierstrass algorithme de, 714, 749, 804
théorème de, 497, 591 tas, 625, 633, 634
Strassen taubérien
algorithme de, 160, 836 théorème, 545
structure de données, 635, 659, 705, Tchebychev
747, 763, 781, 839 polynômes de, 556, 561
substitution, 678, 849 temps
suffixe, 747, 763 d’attente, 570
suite terme
arithmético-géométrique, 330, de λ-calcul, 677
589 terminaison, 634, 702, 743, 825
de Cauchy, 278, 303, 392 terminaux, 461, 758
convergente, 115, 186, 277, 284, théorème
305, 424, 542, 809 d’Abel, 549
régularisante, 519 d’accélération, 671
superposition de d’Alembert-Gauss, 78
principe de, 381 de l’application ouverte, 398
suppression d’Artin, 103
d’une arête, 706 de Babai, 26
d’un sommet, 706 de la base incomplète, 101, 168
surface
de Bézout, 15, 84, 116, 220
euclidienne, 248
de Birkhoff, 423
Sylow
de Bolzano-Weierstrass, 278,
sous-groupe de, 42, 44
558, 809
théorèmes de, 3, 42, 44, 57
des bouts, 339, 367–370
symétrique
de Brouwer, 296, 429, 713
groupe, 3, 18, 28, 35, 52
de Burnside, 54
matrice, 182, 185, 260, 264, 268,
de Carathéodory, 235, 428
317, 459
de Cartan, 301, 313
syntaxique
de Cauchy, 43, 87, 471
congruence, 767
de Cauchy-Lipschitz, 309, 342,
monoïde, 766
347, 354, 362, 367, 374, 385
système
de congruences, 85 de Cauchy-Peano, 309, 332
dynamique, 342, 347, 355, 365, de Cayley-Hamilton, 158, 179,
372, 594 195, 208, 210
libre, 168, 190 central limite, 563, 568, 580, 613,
linéaire, 105, 133, 135, 173, 206, 620
226, 383, 407, 445, 451, 455 de Cesàro, 531
de Chebotarev, 172
table de Chevalley-Warning, 73
d’analyse, 783 de Choquet, 423
de caractères, 49 de Church-Rosser, 679
tangent de compacité, 789, 807
922
INDEX
923
de Scott-Curry, 682, 700 par insertion, 640
de Sophie Germain, 125 en place, 639
spectral, 133, 185, 260, 267, 283 problème du, 634, 743
de Stone-Weierstrass, 497, 591 rapide, 627, 639, 836
taubérien, 545 par tas, 633, 634
de transfert, 571, 583, 619 topologique, 714, 743, 803
de Turán, 724 triangulation, 713, 731
de Tychonov, 101, 808 trièdre de Frenet, 437
des valeurs intermédiaires, 78, tuple, 840
342, 355, 368, 369, 376, 559 Turán
de Wedderburn, 91 théorème de, 724
de Weierstrass, 465, 536, 547 Turing
de Zermelo, 101 degré de, 858
théorie des jeux, 432 machine de, 665, 676, 683, 687,
Thompson 692, 698, 702, 753, 774, 791,
algorithme de, 757, 778 811, 855, 860, 863
topologie saut de, 858
équivalente, 119 Tychonov
produit, 807 théorème de, 101, 808
torsion, 437 type
totale d’une permutation, 35
famille, 277, 281, 285
uniforme
trace, 55, 133, 135, 156, 316
loi, 599
trajectoire, 133, 219, 374
unité
transfert
racine de l’, 56, 92, 120, 172
théorème de, 571, 583, 619
utilité
transformation
fonction d’, 327, 429
d’Abel, 387
de Fourier, 5, 295, 509, 514, 523 valeur absolue, 14, 65, 72, 78, 114,
de Fourier (groupe abélien), 5 126, 132, 161, 204, 503
de Fourier rapide, 651, 653 archimédienne, 117
de Tseitin, 797, 866 équivalente, 114
transience, 599, 606 p-adique, 117
transitif triviale, 114
sous-groupe, 23 valeur d’adhérence, 186, 303, 430
translation, 16, 130, 144, 185, 213, valeurs intermédiaires
239, 243, 315 théorème des, 78, 342, 355, 368,
transport 369, 376, 559
équation de, 385, 388, 396 valeur propre, 52, 55, 64, 133, 135,
transport optimal, 423 155, 183, 188, 193, 195, 207,
transposition, 18, 170, 191, 316, 725 260, 283, 416, 451, 471, 544,
tri 573
à bulles, 643 validité d’une formule, 812
fusion, 633, 645, 836 van der Corput
hollandais, 633 lemmes de, 505
924
INDEX
Vandermonde voisinage
formule de, 601 entrant, 714
matrice de, 172, 652, 653 d’un sommet, 705
variable sortant, 714
aléatoire, 147, 433, 563, 565, 570,
580, 588, 594, 613, 617, 644, Waring
724 problème de, 128
séparables, 355, 381 Wedderburn
variable aléatoire théorème de, 91
Weierstrass
de Bernoulli, 570
théorème de, 465, 536, 547
i.i.d., 622, 644
théorème du produit de, 466
indépendante, 147, 565, 570, 580,
Wiedemann
594, 599, 613, 617
algorithme de, 159
moments, 590
Wiles
uniforme, 147, 644
preuve de, 124
variance
Woodbury
d’une variable aléatoire, 580
formule de, 137
variationnel
formulation, 388, 396 Zermelo
méthode, 505 théorème de, 101
vecteur zéros isolés
normal, 437 principe des, 462, 466, 481, 510
tangent, 437 ζ
vitesse fonction, 522
de convergence, 409, 442, 458, Zorn
565 lemme de, 96, 809
925