Analyse Convex e

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 135

Analyse Convexe

Cours M1 (4M057)

2017-2018, Période 2

Sorbonne Université
Préface

Objectifs de l’UE : L’analyse convexe est un des piliers des mathématiques


appliquées. Elle intervient dans la modélisation et la résolution numérique de
problèmes dans pratiquement tous les secteurs où la modélisation mathéma-
tique est pertinente : en ingénierie, en statistiques, en physique, en économie,
en finance, dans les sciences de l’information, pour la simulation numérique
et des données. L’objectif de ce cours de fournir les fondements de l’analyse
convexe, ses implications en méthodes algorithmiques et ses applications vers
le traitement des megadonnés (big data).

Le cours “Analyse convexe” constitue une UE d’orientation de M1 ; il est par-


ticulièrement approprié pour des étudiants visant les parcours Mathématiques
fondamentales, Mathématiques de la modélisation ou Ingénierie mathématique.
Dans certains cas il peut également être validé en M2 (à verifier avec son di-
recteur d’études).

Prérequis : Algèbre linéaire, topologie élémentaire. Le cours L3 Optimisation


linéaire et convexité (LM239) n’est pas requis ; pour les étudiants ayant cette
expérience le présent cours servira en tant qu’un complément théorique et
approfondi.

Ces notes sont principalement destinées aux étudiants qui suivent le cours à
distance ; pour les autres elles seront un complément au cours oral, où parfois
les idées essentielles seront présentées. Réciproquement, certains thèmes de
base ont été inclus ici à des fins de référence ; ils seront traités seulement très
succinctement dans le cours oral. Sauf mention explicite à l’effet contraire, les
notes sont complètes et autonomes ; néanmoins, quelques livres sont indiqués
dans la bibliographie pour des lecteurs désirants d’élargir ses connaissances.

Ce polycopié a été développé à partir d’un texte généreusement fourni par


Sylvie Delabrière et Yves Raynaud, à qui je veux adresser mes remerciements.
Cependant, la responsabilité pour tous les défauts et les erreurs est entièrement
mienne.

Stanislaw Szarek

i
Table des matières

1 Convexes, fonctions convexes 1


1.1 Ensembles convexes dans un espace vectoriel, exemples et pre-
mières propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Cônes convexes . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Sous-espaces affines . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Points extrémaux et faces des convexes . . . . . . . . . . . . . . 9
1.5 Fonctions convexes sur un espace vectoriel . . . . . . . . . . . . 11

2 EVNs, topologie et fonctions s.c.i. 15


2.1 Topologie des espaces vectoriels normés . . . . . . . . . . . . . 15
2.2 Topologie des convexes dans les EVN . . . . . . . . . . . . . . . 26
2.3 Fonctions s.c.i. sur un EVN . . . . . . . . . . . . . . . . . . . . 31
2.4 Fonctions convexes s.c.i. sur un EVN . . . . . . . . . . . . . . . 35

3 Structure des convexes 39


3.1 Intérieur d’un convexe en dimension finie . . . . . . . . . . . . . 39
3.2 Théorèmes de séparation en dimension finie . . . . . . . . . . . 42
3.3 Autres théorèmes de séparation . . . . . . . . . . . . . . . . . . 46
3.4 Application aux hyperplans d’appui . . . . . . . . . . . . . . . . 48
3.5 Structure des convexes compacts . . . . . . . . . . . . . . . . . 49
3.6 Structure des cônes convexes fermés . . . . . . . . . . . . . . . 52
3.7 Convexes fermés généraux de dimension finie . . . . . . . . . . 56

4 Structure des convexes polyédraux 61


4.1 Polaire d’une partie . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Représentation des convexes polyédraux . . . . . . . . . . . . . 62
4.3 Convexes ∗-polyédraux et polyédraux . . . . . . . . . . . . . . . 66
4.4 Application : le lemme de Farkas . . . . . . . . . . . . . . . . . 68

5 Programmation linéaire 69
5.1 Programmation linéaire, résolution théorique . . . . . . . . . . 69
5.2 Formes canonique et standard . . . . . . . . . . . . . . . . . . . 73

iii
5.3 Paramétrisation des programmes de base . . . . . . . . . . . . . 74
5.4 L’algorithme du simplexe . . . . . . . . . . . . . . . . . . . . . 79
5.5 L’acquisition comprimée . . . . . . . . . . . . . . . . . . . . . . 82

6 Convexes en dimension quelconque 85


6.1 Convexes dans l’espace de Hilbert . . . . . . . . . . . . . . . . . 85
6.2 Convexes dans les EVNs . . . . . . . . . . . . . . . . . . . . . . 92
6.3 Théorème de Lyapounov . . . . . . . . . . . . . . . . . . . . . . 96

7 Régularité des fonctions Convexes 99


7.1 Convexité et continuité . . . . . . . . . . . . . . . . . . . . . . . 99
7.2 Convexité et différentiabilité . . . . . . . . . . . . . . . . . . . . 102
7.3 Convexité et sous-différentiabilité . . . . . . . . . . . . . . . . . 106

8 Fonctions convexes conjuguées 113


8.1 Enveloppes supérieures de fonctions affines continues . . . . . . 113
8.2 Régularisée convexe sci d’une fonction numérique . . . . . . . . 114
8.3 Conjuguée de Fenchel-Moreau . . . . . . . . . . . . . . . . . . . 114
8.4 Biconjuguée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
8.5 Conjugaison et sous-différentiels . . . . . . . . . . . . . . . . . . 117
8.6 Dualité dans l’optimisation convexe . . . . . . . . . . . . . . . . 119

Bibliographie 125

Index des définitions et des théorèmes 127

iv
Chapitre premier
Convexes, fonctions convexes

1.1 Ensembles convexes dans un espace vectoriel, exemples et


premières propriétés

Soit E est un espace vectoriel réel.


Définition 1.1.1 (Convexes). Une partie C de E est dite convexe si et seule-
ment si
∀x, y ∈ C, ∀θ ∈ [0, 1] : θx + (1 − θ)y ∈ C
Géométriquement, z(θ) = θx + (1 − θ)y est le barycentre des points x et
y affectés des coefficients (ou poids) respectifs θ et 1 − θ. Lorsque θ décrit
l’intervalle [0, 1], z(θ) décrit le segment fermé d’extrémités x et y que l’on
notera [x, y]. Dire que C est convexe, c’est donc dire que C contient un segment
dès qu’elle contient ses extrémités.
En fait un convexe contient toute combinaison convexe de ses points :
Définition 1.1.2 (Combinaison convexe). Pour toute famille finie x 1 , . . . , xn
E et tout système λ1 , . . . , λn de réels positifs ou nuls avec ni=1 λi =
P
de points deP
1, le point ni=1 λi xi s’appelle une combinaison convexe des points x1 , . . . , xn .
Proposition 1.1.3. Soit C un convexe de E. Pour toute famille finie P x1 , . . . , x n
C et tout système λ1 , . . . , λn de réels positifs ou nuls avec ni=1 λi =
de points deP
1, le point ni=1 λi xi appartient à C.
Démonstration : On procède par récurrence sur n. C’est évident Psin n = 1.
Supposons que c’est vrai jusqu’à l’ordre n−1 et considérons le point i=1 λi xi ,
où les xi sont dans C. Si λ1 = 1, les autres coefficients sont nuls et il n’y a rien
λi
à montrer. Si λ1 < 1 alors ni=2 λi = 1 − λ1 > 0. Posons µi =
P
, on a
Pn Pn 1 − λ1
i=2 µi = 1, d’où y := i=2 µi xi est dans C par l’hypothèse de récurrence et
donc x = λ1 x1 + (1 − λ1 )y ∈ C.

La démonstration de la propriété suivante est évidente :

1
2 CHAPITRE 1. CONVEXES, FONCTIONS CONVEXES

Proposition\1.1.4. Si (Ci )i∈I est une famille quelconque de convexes, leur


intersection Ci est convexe.
i∈I

Définition 1.1.5 (Enveloppe convexe). Soit A une partie de E. L’enveloppe


convexe de A, notée conv(A), est l’intersection de tous les convexes contenant
A.

L’enveloppe convexe conv(A) est évidemment un convexe contenant A, et c’est


le plus petit : si C est un convexe contenant A, il contient conv(A).

Proposition 1.1.6. L’enveloppe convexe de A est l’ensemble de toutes les


combinaisons convexes finies d’éléments de A :
n
nX n
X o
conv(A) = λi xi / n ≥ 1, xi ∈ A, λi ≥ 0, λi = 1
i=1 i=1

Démonstration : Comme conv(A) est convexe, cet ensemble contient toutes


les combinaisons convexes finies de ses éléments (Proposition 1.1.3), donc en
particulier celles des éléments de A.
Pn
InversementPn il est facile de voir que l’ensemble C = { i=1 λi xi / n ≥ 1, xi ∈
A, λi ≥ 0, i=1 λi = 1} est convexe ; il contient A, donc aussi conv(A).

Proposition 1.1.7. 1) Si A est fini, soit A = {a1 , . . . , ap }, alors


p
nX p
X o
conv(A) = λi ai /λi ≥ 0, λi = 1
i=1 i=1

2) Plus généralement, si A1 , . . . , Ap sont des convexes de E, alors


p
nX p
X o
conv(A1 ∪ A2 ∪ . . . ∪ Ap ) = λi xi /xi ∈ Ai , λi ≥ 0, λi = 1
i=1 i=1

Démonstration : 1) est évident.


Montrons 2) : l’inclusion
p
nX p
X o
λi xi /xi ∈ Ai , λi ≥ 0, λi = 1 ⊂ conv(A1 ∪ A2 ∪ . . . ∪ Ap )
i=1 i=1

est évidente. Montrons l’autre inclusion dans le cas où p = 2 pour simplifier


les notations :
1.2. CÔNES CONVEXES 3

Si x ∈ conv(A1 ∪A2 ), x s’écrit x = ni=1 λi xi avec λi ≥ 0 , i = 1, . .


P Pn
.,n , i=1 λi =
1. Les xi sont dans A 1 ∪ A ,
2 Psoit I = i ∈ {1, . . . , n} , x i ∈ A 1 , JP i∈
=
{1, . . . , n} , xi ∈ A2 et λ = i∈I λi . Alors, 0 ≤ λ ≤ 1 et 1 − λ = i∈J λi .
Si λ = 0 ou 1, x est alors dans conv(A1 ) ou dans conv(A2 ) et par suite dans
conv(A1 ∪ A2 ). Sinon, on écrit :
X λi X λi
x=λ xi + (1 − λ) xi = λy1 + (1 − λ)y2 , y1 ∈ A1 , y2 ∈ A2
λ (1 − λ)
i∈I i∈J

On en déduit bien que x ∈ conv(A1 ∪ A2 ), d’où l’inclusion

X2 2
X
conv(A1 ∪ A2 ) ⊂ { λi xi /xi ∈ Ai , λi ≥ 0, λi = 1}
i=1 i=1

1.2 Cônes convexes

Dans un espace vectoriel réel E, on va s’intéresser à certains convexes particu-


liers, les cônes convexes, qui joueront un rôle important dans la structure des
convexes :

Définition 1.2.1 (Cône). 1) Une partie Γ de E est un cône de sommet x0


si elle est stable par les homothéties de centre x0 , de rapport λ > 0. Si on ne
précise pas le sommet x0 , ce sera 0.
2) Γ est un cône convexe de sommet x0 si de plus Γ est un convexe.
3) Un cône est pointé s’il contient son sommet, épointé sinon.

Autrement dit, Γ est un cône de sommet x0 si et seulement si quelque soit


x ∈ Γ et λ > 0 alors, x0 + λ(x − x0 ) ∈ Γ.
Dans le cas où x0 = 0 : Γ est un cône si et seulement si λΓ ⊂ Γ, pour tout
λ > 0.
On va maintenant donner une caractérisation des cônes convexes (de sommet
0) :

Notation 1.2.2. Si A et B sont deux parties de E et λ ∈ R, on note :


 
A + B = a + b / a ∈ A, b ∈ B , λA = λa / a ∈ A .

Proposition 1.2.3. Une partie Γ de E est un cône convexe (de sommet 0)


si et seulement si elle est stable par addition et par multiplication par les réels
strictement positifs, c’est à dire, avec la notation précédente, si et seulement si
Γ + Γ ⊂ Γ et λΓ ⊂ Γ pour tout λ > 0.
4 CHAPITRE 1. CONVEXES, FONCTIONS CONVEXES

Démonstration : Si Γ est un cône convexe de sommet 0 et x, y ∈ Γ, on a


x+y x+y
∈ Γ. D’où x + y = 2 ∈ Γ. Donc Γ + Γ ⊂ Γ. La propriété λΓ ⊂ Γ
2 2
est évidente.
La réciproque est immédiate.

Proposition 1.2.4. 1) Soit Γ un cône convexe non vide de sommet 0. Le sous-


espace vectoriel engendré, en bref SEV, par Γ est Γ − Γ.
2) Si 0 ∈ Γ, le plus grand sous-espace vectoriel inclus dans Γ est Γ ∩ (−Γ).

Démonstration : 1) Le sous-espace vectoriel engendré par Γ contient né-


cessairement Γ et −Γ, donc aussi Γ − Γ. Inversement, comme par hypothèse,
Γ est un cône convexe, on vérifie aisément que Γ − Γ est un SEV qui contient
Γ, donc ausssi le SEV engendré par Γ. D’où l’égalité voulue.
2) Notons d’abord que l’hypothèse 0 ∈ Γ est nécessaire dans cette propriété car
tout sous espace vectoriel contient 0. Comme Γ est un cône convexe contenant
0, on vérifie aisément que Γ ∩ (−Γ) est un SEV inclus dans Γ. Inversement,
tout SEV inclus dans Γ est aussi inclus dans −Γ et donc dans Γ ∩ (−Γ). D’où
l’égalité voulue.

Notation 1.2.5. Soit Γ un cône convexe non vide (de sommet 0). On notera
 
N (Γ) = {0} ∪ Γ ∩ (−Γ)

Définition 1.2.6 (Cône convexe engendré). Soit A ⊂ E. Le plus petit cône


convexe pointé de sommet 0 contenant A s’appelle le cône convexe engendré
par A. On le note cone(A).

Proposition 1.2.7. 1) L’intersection d’une famille quelconque de cônes convexes


de même sommet est un cône convexe.
2) Si A ⊂ E, le cône convexe engendré par A est l’ensemble des combinaisons
linéaires finies à coefficients positifs ou nuls d’éléments de A, c’est à dire :
n
nX o
cone(A) = λi xi / n ≥ 1, xi ∈ A, λi ≥ 0
i=1

S
3) Si C ⊂ E est convexe, le cône convexe engendré par C est λC.
λ≥0

Démonstration : 1) est immédiat.


 Pn
2) L’inclusion i=1 λi x i
 Pn/ n ≥ 1, x i ∈ A, λi ≥ 0 ⊂ cone(A)
est claire.
Inversement, l’ensemble i=1 λ i x i / n ≥ 1, xi ∈ A, λi ≥ 0 est un cône
convexe contenant A donc contenant aussi cone(A), d’où l’égalité.
1.3. SOUS-ESPACES AFFINES 5
S
3) L’inclusion λC ⊂ cone(C) est claire. Inversement, grâce à la convexité
λ≥0 S
de C, on vérifie aisément que λC est un cône convexe. Comme il contient
λ≥0
C, il contient aussi cone(C).

1.3 Sous-espaces affines

Dans un espace vectoriel réel E, on va s’intéresser à une deuxième catégorie


de convexes particuliers, les sous-espaces affines, qui joueront aussi un rôle
important dans la structure des convexes :
Définition 1.3.1 (Sous-espaces affines). Un sous-ensemble M ⊂ E est un
sous-espace affine, en bref SEA de E si :
∀x, y ∈ M, ∀θ ∈ R : θx + (1 − θ)y ∈ M
Géométriquement cela signifie que M contient une droite D dès qu’il contient
deux points distincts de D. Un SEA de E est clairement un convexe.
Définition 1.3.2. Si A est une partie de E et x0 ∈ E, le translaté de A par
x0 est 
x0 + A = x0 + a | a ∈ A
Si y0 ∈ E, on a évidement (A + x0 ) + y0 = A + (x0 + y0 ).
Proposition 1.3.3. 1) Si M est un SEA de E, tout translaté x0 + M de M
est un SEA de E.
2) Un SEA est un sous-espace vectoriel de E, en bref SEV, si et seulement
s’il contient 0.
3) Si M est un SEA de E, et x0 ∈ M , alors M − x0 est un SEV de E.
Inversement, s’il existe x0 ∈ E tel que M − x0 soit un SEV de E, alors M est
un SEA de E.
Démonstration : 1) est une conséquence immédiate de la Définition 1.3.2.
2) Un SEV est évidemment un SEA contenant 0. Réciproquement, si M est
un SEA contenant 0, alors :

∀x ∈ M , ∀λ ∈ R , λx = λx + (1 − λ)0 ∈ M
x+y
et si x, y ∈ M , ∈ M , d’où :
2
x+y
x+y =2 ∈M
2
M est donc bien un SEV.
6 CHAPITRE 1. CONVEXES, FONCTIONS CONVEXES

3) Si M est un SEA de E, et x0 ∈ M , alors M − x0 est un SEA de E contenant


0 donc est un SEV. Inversement, s’il existe x0 ∈ E tel que M − x0 soit un SEV
de E, alors 0 ∈ M − x0 d’où x0 = 0 + x0 ∈ (M − x0 ) + x0 ∈ M . Donc M est
un SEA.
Définition 1.3.4 (Direction d’un sous-espace affine). Soit M un SEA et x0 ∈
M . Le SEV : V = M − x0 s’appelle la direction de M .
Remarque 1.3.5. On a aussi V = {x − y , x, y ∈ M }, donc V ne dépend pas
de x0 ∈ M .
Définition 1.3.6 (Sous-espace affine engendré). Si A est une partie de E, le
sous-espace affine engendré par A est le plus petit SEA contenant A c’est à
dire l’intersection des SEA contenant A. On le notera Aff(A).
Proposition 1.3.7. 1) On a
n n
X X
Aff(A) = λi xi / n ≥ 1, xi ∈ A, λi ∈ R, λi = 1 .
i=1 i=1

2) Si x0 ∈ A, alors Aff(A) = x0 + V où V est l’espace vectoriel engendré par


A − x0 . 
3) Si C est convexe, Aff(C) = θx + (1 − θ)y / θ ∈ R, x, y ∈ C .
Démonstration : Le 1) se démontre comme pour l’enveloppe convexe, voir
1.1.6.
2) est évident par construction.
Pour montrer le 3), on prend deux points θ1 x1 + θ2 x2 et θ3 x3 + θ4 x4 avec
xi ∈ C et θi ∈ R, i = 1, . . . , 4, θ1 + θ2 = 1, θ3P + θ4 = 1 et θ ∈ R.
PAlors, le point
θ(θ1 x1 + θ2 x2 ) + (1 − θ)(θ3 x3 + θ4 x4 ) s’écrit i=1,...,4 αi xi où i=1,...,4 αi = 1.
Grâce à la convexité de C, en regroupant les xi tels P que αi ≥ 0 et ceux tels
que αi < 0, on montre facilement que le vecteur i=1,...,4 αi xi est bien de la
X 1 X
forme λx + (1 − λ)y, avec λ = αi ∈ [0, 1] tandis que x = αi xi , y =
λ
αi ≥0 αi ≥0
1 X
αi xi sont deux points de C.
(1 − λ)
αi <0 
On en déduit que l’ensemble θx + (1 − θ)y / θ ∈ R, x, y ∈ C est un SEA qui
contient C donc aussi Aff(C).
L’inclusion inverse est évidente par définition d’un SEA.
Définition 1.3.8 (Indépendance affine). Les points x0 , . . . , xk de E sont dits
affinement indépendants si aucun d’eux n’appartient au sous-espace affine en-
gendré par les k autres.
1.3. SOUS-ESPACES AFFINES 7

Proposition 1.3.9. 1) Les points x0 , . . . , xk sont affinement indépendants si


et seulement si les vecteurs x1 −x0 , . . . , xk −x0 sont linéairement indépendants.
2) Une autre condition nécessaire et suffisante pour que les points x0 , . . . , xk
soientPaffinement indépendants est qu’il n’existe pas α0 , . . . , αk non tous nuls
avec ki=0 αi xi = 0 et ki=0 αi = 0.
P
3) Si E est de dimension finie p, tout système de p + 1 points affinement indé-
pendants x0 , . . . , xp engendre affinement E, c’est à dire E = Aff(x0 , . . . , xp ).

Démonstration : 1) et 3) résultent facilement de 2) de la Proposition 1.3.7.


2) est une conséquence du fait que si ki=0 αi = 0, alors ki=0 αi xi = ki=1 αi (xi −
P P P
x0 ).

Définition 1.3.10 (Repère affine). 1) Si x0 , . . . , xp sont p + 1 points affine-


ment indépendants et si E = Aff(x0 , . . . , xp ), on dit que (x0 , . . . , xp ) est un
repère affine de E. Il revient au même de dire que (x1 − x0 , . . . , xp − x0 ) est
une base de E.
2) On dira qu’un SEA est de dimension k s’il est engendré par k + 1 points
affinement indépendants.
3) Plus généralement, on dira qu’une partie A d’un espace vectoriel E est de
dimension k si Aff(A) est de dimension k.

Une catégorie importante de sous-espaces affines est celle des hyperplans af-
fines.

Définition 1.3.11 (Hyperplan affine). Un hyperplan affine est un sous-espace


affine propre maximal.

Autrement dit M est un hyperplan affine si et seulement si


i) M 6= E
ii) E est le seul SEA contenant strictement M .
Remarque 1.3.12. ii) signifie que pour tout y ∈
/ M , Aff(M ∪ {y}) = E.

Proposition 1.3.13. Le SEA M est un hyperplan affine si et seulement si sa


direction V est un hyperplan vectoriel, c’est à dire que pour tout u ∈ E \ V , on
a E = V ⊕ Ru.

Démonstration : Soit M un hyperplan affine de E et soit V sa direction.


Alors M = x0 + V où x0 ∈ M ⊂ E. Alors V 6= E sinon M serait aussi égal
à E. Supposons que V ne soit pas un hyperplan de E, c’est à dire qu’il existe
un vecteur u ∈ E, tel que u 6∈ V et V ⊕ Ru 6= E. Alors M 0 = x0 + (V ⊕ Ru)
est un SEA contenant M et non égal à E, ce qui contredit la maximalité de
M . Donc V est un hyperplan vectoriel de E.
8 CHAPITRE 1. CONVEXES, FONCTIONS CONVEXES

Réciproquement, supposons maintenant que V est un hyperplan vectoriel de


E et soit u 6∈ V tel que E = V ⊕ Ru. Alors u 6∈ M car sinon M = E et V ne
serait pas la direction de M . De plus, si M 0 est un SEA contenant M et non
égal à E, on peut écrire, M 0 = x0 + W , où W est un SEV contenant V et non
égal à E, ca qui contredit la maximalité de V . M est donc bien un hyperplan
affine de E.

Proposition 1.3.14. Les hyperplans affines


de E sont exactement les en-
sembles de la forme x ∈ E / f (x) = a , où f est une forme linéaire non
nulle sur E et a un réel.

Démonstration : Soit f une forme linéaire non nulle sur E, a ∈ R, H =


{x ∈ E / f (x) = a} et V = {x ∈ E / f (x) = 0}. H est évidemment un SEA de
E et V est sa direction. Soit x0 ∈ E tel que f (x0 ) = 1. Si y ∈ E, y−f (y)x0 ∈ V
d’où y = (y − f (y)x0 ) + f (y)x0 ∈ V ⊕ Rx0 et par suite, E = V ⊕ Rx0 . Donc
V est un hyperplan vectoriel de E et par suite, H un hyperplan affine de E.
Réciproquement, soit H est un hyperplan affine, V sa direction, x0 un point de
E n’appartenant pas à V , on pose f (v + λx0 ) = λ pour tout v ∈ V et λ ∈ R.
Alors f est une forme linéaire sur E, nulle sur V , donc constante sur H : en
effet si y0 ∈ H, on a, pour tout y ∈ H, f (y) = f (y0 ) + f (y − y0 ) = f (y0 )
car y − y0 ∈ V . Si a est cette valeur, l’ensemble {x ∈ E / f (x) = a} est un
hyperplan affine contenant H, donc égal à H.
Remarque 1.3.15. Si {x ∈ E / f (x) = a} et {x ∈ E / g(x) = b} sont deux
équations d’un même hyperplan affine H, alors, il existe α ∈ R tel que g = αf .
Démonstration : En effet, si V est la direction de H, on a V = Ker f =
Ker g.
Soit x0 ∈ E, x0 ∈ / V tel que f (x0 ) = 1 et posons α = g(x0 ). Alors, α 6= 0 car
g 6= 0. Si x = v + λx0 est un point quelconque de E, on a : f (x) = λf (x0 ) = λ
et g(x) = λg(x0 ) = λα donc g(x) = f (x) pour tourt x ∈ E.

Définition 1.3.16 (Demi-espaces). Soit H un hyperplan affine ; soient f une


forme linéaire non nulle sur E et a un réel tels que H = {x ∈ E / f (x) = a}.
On appelle demi-espaces associés à l’hyperplan H les ensembles D+ = {x ∈
E / f (x) ≤ a} et D− = {x ∈ E / f (x) ≥ a}. Les demi-espaces stricts
associés à l’hyperplan H sont les ensembles D+ 0 = {x ∈ E / f (x) < a} et
0
D− = {x ∈ E / f (x) > a}.
0 , D 0 } ne dépendent
Ces ensembles sont convexes. Les paires {D+ , D− } et {D+ −
pas du couple (f, a) tel que H = {x ∈ E / f (x) = a}, à permutation près :
ceci résulte de la Remarque 1.3.15.
On a évidemment D+ 0 = D \ H et D 0 = D \ H.
+ − −
1.4. POINTS EXTRÉMAUX ET FACES DES CONVEXES 9

Remarque 1.3.17. Une conséquence immédiate de la Proposition 1.1.4 est que


toute intersection de demi-espaces affines, respectivement de demi-espaces af-
fines stricts, est un convexe, éventuellement vide.
La question inverse est naturelle : quels sont les convexes représentables comme
intersection de demi-espaces affines ? On y répondra dans les chapitres suivants.

1.4 Points extrémaux et faces des convexes dans un espace


vectoriel

Définition 1.4.1 (Points extrémaux d’un convexe). Soit C un convexe d’un


espace vectoriel réel E. On dit qu’un point x de C est un point extrémal de C
si x n’appartient à aucun segment ouvert dont les extrémités sont dans C.

Proposition 1.4.2. Un point x est un point extrémal de C si et seulement si


y+z
Il n’existe pas y, z ∈ C tels que y 6= z et x =
2
ou encore si et seulement si :
y+z
y, z ∈ C, x = =⇒ x=y=z
2
Démonstration : En effet, on remarque d’abord que la deuxième condition
de la Proposition 1.4.2 est équivalente à la première en passant à la contraposée.
D’autre part, si x est extrémal dans le convexe C, il est clair que la condition
y+z
y, z ∈ C, x = ⇒ x = y = z est vérifiée.
2
Réciproquement, si cette condition est vérifiée et si x appartient à un segment
ouvert dont les extrémités y, z sont dans C, alors le symétrique z 0 de l’une des
deux extrémités, par exemple y, par rapport à x est sur ce segment, donc dans
C ; il s’ensuit que les points, y, z 0 , x, sont confondus d’où contradiction . Donc
x est extrémal dans C.

Notation 1.4.3. On désignera par Ext C l’ensemble des points extrémaux de


C.

Proposition 1.4.4. 1) Le point x du convexe C est extrémal si et seulement


si C \ {x} est encore convexe. 
2) Si A est une partie de E, on a Ext conv(A) ⊂ A.

Démonstration : 1) Supposons que x est extrémal dans C et soient y, z ∈


y+z y+z
C \ {x}, y 6= z. Alors, ∈ C et 6= x par extémalité de x. Donc
2 2
y+z
∈ C \ {x} et C \ {x} est bien convexe.
2
10 CHAPITRE 1. CONVEXES, FONCTIONS CONVEXES

y+z
Réciproquement, si C \ {x} est convexe, supposons = x avec y, z ∈ C.
2
Alors, si y 6= z, on a nécessairement y, z ∈ C \{x} et par convexité, x ∈ C \{x},
ce qui est une contradiction. Donc x est bien extrémal Pk dans C.
2) Posons C = convA et soit x ∈ C \ A. Soit x = i=1 ti xi une combinaison
convexe avec xi ∈ A telle que la longueur k est minimal ; alors ti > 0 pour
tout i et, étant donné que x 6∈ A, P on a forcement k ≥ 2. On déduit que
−1 k
x = t1 x1 + (1 − t1 )y, ou y = (1 − t1 ) i=2 ti xi ∈ C. En particulier, x ∈]x1 , y[,
un segment ouvert avec des extrémités dans C et donc x 6∈ Ext C.

Définition 1.4.5 (Face d’un convexe). 1) Une face d’un convexe C est un
convexe non vide F ⊂ C tel que :
y+z
x ∈ F, y, z ∈ C, x= ⇒ y et z ∈ F
2
2) Une face de dimension 1 est appelée une arête. Si dim F = dim C − 1, on
dit que F est une facette de C.
Proposition 1.4.6. F est une face d’un convexe C si et seulement si F est
convexe et que si x ∈ F appartient à un segment ouvert dont les extrémités
sont dans C, ces extrémités sont en fait dans F .
Démonstration : On passe d’un point quelconque d’un segment de F au
milieu de ce segment en appliquant l’argument de la Proposition 1.4.2.
Proposition 1.4.7. Toute intersection non vide de faces de C est une face de
C.

Exemples 1.4.8. 1) Un exemple trivial de face de C est le convexe C lui


même.
2) Un point x0 ∈ C est extrémal pour C si et seulement si {x0 } est une face
de C.

Dans le cas des cônes, la notion de point extrémal n’a pas d’intérêt car seul
le sommet du cône est un point extémal. Dans ce cas on peut introduire et
étudier un concept d’une génératrice extrémale, (voir Définition 3.6.8).
Définition 1.4.9 (Hyperplan d’appui d’un convexe). On dit qu’un hyperplan
H est un hyperplan d’appui du convexe C si C est inclus dans l’un des deux
demi-espaces définis par H et rencontre H.
Lemme 1.4.10. Si H est un hyperplan d’appui du convexe C alors F = H ∩C
est une face de C.
1.5. FONCTIONS CONVEXES SUR UN ESPACE VECTORIEL 11

Démonstration : En effet soit f (x) = a une équation de H, f étant une


forme linéaire et a ∈ R. On a (par exemple) f (x) ≤ a pour tout x ∈ C. Si
y+z
x= , avec x ∈ F , y, z ∈ C, on a :
2
f (y) ≤ a, f (z) ≤ a (∗)

et
f (y) + f (z)
= f (x) = a
2
  
d’où 0 = 2a − f (y) + f (z) = a − f (y) + a − f (z) .
Or, une somme de nombres réels positifs n’est nulle que si chacun de ces deux
réels est nul, donc les inégalités (*) sont des égalités et par suite y, z ∈ F .

Il est clair que si C1 ⊂ C et x ∈ C1 ∩ Ext C, alors x ∈ Ext C1 . L’inverse


n’est pas toujours vrai mais on a le résultat suivant, qui est une application
immédiate des définitions :

Lemme 1.4.11. Si F est une face de C alors Ext F ⊂ Ext C ; et plus généra-
lement toute face de F est une face de C.

Il faut souligner qu’il existent des faces des convexes qui ne sont pas de la
forme donnée par Lemme 1.4.10 (voir Exemple 1.4.13 ci-dessous), qui justifie
la définition suivante.

Définition 1.4.12 (Points exposés at faces exposées). Une face de la forme


donnée par Lemme 1.4.10 est appelée une face exposée de C. De la même façon,
x ∈ C tel que, pour un certain hyperplan d’appui H de C on a H ∩ C = {x}
est appelé un point exposé de C.

Exemple 1.4.13. Soit D = (x1 , x2 ) ∈ R2 / x21 + x22 ≤ 1 le disque unité




et soit y = (2, 0) ∈ R2 , alors il existent deux points extrémaux du convexe


C = conv(D ∪ {y}) qui ne sont pas exposés.

1.5 Fonctions convexes sur un espace vectoriel

Soit E est un espace vectoriel réel.

Définition 1.5.1 (Fonction convexe). Une fonction f : E → R ∪ {+∞} est


dite convexe si pour tous x, y dans E avec f (x) < +∞, f (y) < +∞ et tout
θ ∈ [0, 1], on a :

f (θx + (1 − θ)y) ≤ θf (x) + (1 − θ)f (y)


12 CHAPITRE 1. CONVEXES, FONCTIONS CONVEXES

On remarque aisément que si f est convexe, tous les ensembles Af (a) = {x ∈


E/ f (x) ≤ a} et Bf (a) = {x ∈ E/ f (x) < a} sont convexes ; la réciproque est
fausse : si f : R → R est seulement supposée monotone, les ensembles Af (a),
Bf (a) sont convexes car ce sont des intervalles.
Définition 1.5.2 (Domaine effectif d’une fonction). Le domaine effectif d’une
fonction f : E → R ∪ {+∞} est l’ensemble

dom f = x ∈ E / f (x) < +∞
Remarque 1.5.3. La fonction f : E → R ∪ {+∞} est convexe si et seulement si
1) son domaine effectif est convexe
2) sa restriction f |dom f à son domaine effectif est convexe.
Définition 1.5.4 (Fonction strictement convexe). f est dite strictement convexe
(sur son domaine effectif ) si c’est une fonction convexe et si pour tous x 6= y
dans dom f et tout θ ∈]0, 1[, on a l’inégalité stricte :
f (θx + (1 − θ)y) < θf (x) + (1 − θ)f (y)
Proposition 1.5.5. Soit C un convexe d’un espace vectoriel et f : E → R ∪
{+∞} une fonction strictement convexe dont le domaine effectif contient C.
Si f atteint son maximum sur C en un point x0 ∈ C, alors x0 est un point
extrémal de C.
Démonstration : Soit M la borne supérieure de f sur C. Si x0 ∈ C, avec
f (x0 ) = M , n’est pas extrémal, soient y, z ∈ C distincts tels que x0 = (y+z)/2.
On a M = f (x0 ) < (f (y)+f (z))/2 ≤ max(f (y), f (z)) donc f prend une valeur
supérieure à M en l’un des points y ou z, ce qui constitue une contradiction.

On verra des propriétés analogues sans hypothèse de stricte convexité dans les
chapitres suivants.

Lorsqu’on la restreint à son domaine effectif, une fonction convexe devient une
fonction convexe usuelle définie sur un convexe et à valeurs réelles. Inversement,
on a :
Proposition 1.5.6 (Prolongement convexe). Si f : C → R est une fonction
convexe définie sur le convexe C, on peut l’étendre en une fonction convexe f˜ :
E → R ∪ {+∞} en posant
(
f (x) si x ∈ C
f˜(x) =
+ ∞ sinon
Cet artifice permet de manier simultanément des fonctions convexes f, g, . . .
définies sur des convexes différents, et de considérer f + g, max(f, g),. . .
1.5. FONCTIONS CONVEXES SUR UN ESPACE VECTORIEL 13

En particulier si A est une partie de E, on définit sa fonction caractéristique


par : 
0 si x ∈ A
χA (x) =
+∞ sinon
Alors l’ensemble A est convexe si et seulement si la fonction χA est convexe.

Définition 1.5.7 (Epigraphe d’une fonction). Si f est une fonction E →


R ∪ {+∞}, son épigraphe est le sous-ensemble de E × R défini par :

epi (f ) = (x, t) ∈ E × R / f (x) ≤ t

l’épigraphe strict de f est



epist f = (x, t) ∈ E × R / f (x) < t

Remarque 1.5.8. 1) L’épigraphe de f est un sous-ensemble de dom f × R.


2) La projection naturelle E × R → E, (x, t) 7→ x envoie epi f exactement
sur dom f .

Proposition 1.5.9. La fonction f : E → R ∪ {+∞} est convexe si et seule-


ment si son épigraphe est convexe.

Démonstration : Sif est convexe, alors pour tous (x, t), (y, u) dans epi (f ),
et tout θ ∈ [0, 1], on a f (θx + (1 − θ)y) ≤ θf (x) + (1 − θ)f (y) ≤ θt + (1 − θ)u,
donc (θx + (1 − θ)y, θt + (1 − θ)u) appartient à epi f , qui est donc convexe.
Réciproquement, si epi f est convexe, alors pour tous x, y ∈ dom f , et θ ∈ [0, 1],
on a (x, f (x)) ∈ epi f , (y, f (y)) ∈ epi f , donc (θx + (1 − θ)y, θf (x) + (1 −
θ)f (y)) ∈ epi f , ce qui signifie que f (θx + (1 − θ)y) ≤ θf (x) + (1 − θ)f (y), et
donc f est convexe.

Proposition 1.5.10. 1) Si (fi )i∈I est une famille quelconque de fonctions


convexes, l’enveloppe supérieure des (fi )i∈I , définie par f = supi∈I fi , est
convexe.
2) Si g est limite pour la convergence simple des fonctions d’une suite de
fonctions convexes, g est convexe.

Dans certaines questions on peut avoir besoin de considérer des fonctions


convexes à valeurs dans R = R ∪ {+∞} ∪ {−∞}. On prend alors la propriété
de convexité de l’épigraphe comme définition :

Définition 1.5.11 (Fonction convexe à valeurs dans R). La fonction f : E →



R est dite convexe si son épigraphe epi f = (x, t) ∈ E × R/ f (x) ≤ t est
convexe.
14 CHAPITRE 1. CONVEXES, FONCTIONS CONVEXES

Remarque 1.5.12. Il est équivalent de dire que l’épigraphe strict de f est


convexe.
Démonstration : En effet soit Tε la translation (x, t) → (x, t + ε) dans
E × R : elle transforme un convexe en un convexe. L’ensemble epist f s’écrit
comme réunion de la famille croissante des ensembles Tε (epi f ), ε > 0, tandis
que epi f s’écrit comme intersection de la famille d’ ensembles Tε (epist f ),
ε < 0.
La définition 1.5.11 coïncide avec la définition usuelle lorsque f est à valeurs
> −∞. Lorsque ce n’est pas le cas, on a la caractérisation suivante :

Lemme 1.5.13. La fonction f : E → R est convexe si et seulement si pour


tous x, y ∈ E tels que f (x), f (y) < +∞ et pour tout λ ∈ [0, 1], on a l’inégalité
de convexité

f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y)


avec les conventions usuelles −∞ + t = −∞, ∀t < +∞, a · (−∞) = −∞,
∀a > 0, et 0 · (−∞) = 0.

Notons que dans cette caractérisation, les points où f prend la valeur +∞


n’interviennent pas.
Remarque 1.5.14. La Proposition 1.5.10 reste vraie pour les fonctions à valeurs
dans R.

Définition 1.5.15 (Fonction convexe propre). Une fonction convexe est dite
propre si elle ne prend pas la valeur −∞, et n’est pas la constante +∞. Dans
le cas contraire, la fonction est dite impropre.
Chapitre 2
Espaces vectoriels normés, topologie des convexes et fonctions s.c.i.

2.1 Rappels de topologie des espaces vectoriels normés

Soit (E, k·k) un espace vectoriel normé sur R ou C, en bref un EVN. E est
donc un cas particulier d’espace métrique où la distance est donnée par

d(x, y) = kx − yk

Définition 2.1.1 (Normes équivalentes). Deux normes k·k1 et k·k2 sur un


EVN E sont dites équivalentes s’il existe deux constantes a, b > 0 telles que

∀x ∈ E , a kxk1 ≤ kxk2 ≤ b kxk1

Pour r > 0, on notera B(x0 , r) = {x ∈ E / kx − x0 k < r}, la boule ouverte de


centre x0 et de rayon r et B̄(x0 , r) = {x ∈ E / kx − x0 k ≤ r}, la boule fermée
de centre x0 et de rayon r.
Exemples 2.1.2. 1) Soit p ∈ N. L’espace vectoriel Rp peut être muni des
normes kxk1 = pi=1 |xi | , kxk∞ = supi=1,...,p |xi | , kxk2 = 2 1/2 ,
P Pp 
i=1 xi
où x = (x1 , . . . , , xp ).
2) Si E1 et E2 sont deux EVN munis des normes respectives k·k1 et k·k2 ,
l’espace produit E1 × E2 est un EVN munis de l’une des normes (équivalentes)
suivantes 1/2
kx1 k1 + kx2 k2 , sup(kx1 k1 , kx2 k2 ) , kx1 k21 + kx2 k22 ,
où x = (x1 , x2 ) ∈ E1 × E2 .
Plus généralement, on peut définir des espaces analogues en dimension infinie :
Exemples 2.1.3. `1 , c0 , `∞ , `2 . Ce sont des espaces de suites de nombres
réels définis par :

n ∞
X o ∞
X
`1 = x = (xn )n∈N telles que |xi | < +∞ , muni de la norme : kxk1 = |xi |
i=1 i=1

15
16 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

n ∞
X o ∞
X 1/2
2
`2 = x = (xn )n∈N telles que xi < +∞ , muni de la norme : kxk2 = xi 2
i=1 i=1

n o
c0 = x = (xn )n∈N telles que xn →n→∞ 0 , muni de la norme : kxk∞ = sup |xi |
i∈N

n o
`∞ = x = (xn )n∈N telles que sup |xi | < +∞ , muni de la norme : kxk∞ = sup |xi |
i∈N i∈N

Dans les exemples ci dessus, 2.1.2 et 2.1.3, en dimension finie ou non, il est très
facile de démontrer qu’on a bien des normes, sauf dans le cas de k·k2 . Dans le
cas de cette dernière norme, seule l’inégalité triangulaire n’est pas évidente à
démontrerP : il faut utiliser le fait qu’elle provient du produit scalaire défini par
hx, yi = pi=1 xi yi sur Rp et par hx, yi = ∞
P
i=1 yi dans le cas de `2 .
x i
Rappelons l’inégalité de Cauchy-Schwarz qui s’applique dans ce cadre :

|hx, yi| ≤ kxk2 kyk2


Cette inégalité implique alors facilement l’inégalité de Minkowski :

kx + yk2 ≤ kxk2 + kyk2

En effet, il suffit d’écrire :

kx + yk22 = kxk22 + 2hx, yi + kyk22 ≤ kxk22 + 2 kxk2 kyk2 + kyk22 = (kxk2 + kyk2 )2

ce qui prouve le résultat.

Définition 2.1.4 (Espace euclidien et espace préhilbertien). Un espace vecto-


riel muni d’un produit scalaire est appelé un espace euclidien s’il est de dimen-
sion finie et un espace préhilbertien sinon.

Définition 2.1.5 (Ensemble ouvert). Une partie A ⊂ E d’un EVN est ouverte
si ou bien A = ∅ ou bien

∀x0 ∈ A , ∃r > 0 tel que B(x0 , r) ⊂ A

On remarquera que l’espace E lui-même est ouvert.


2.1. TOPOLOGIE DES ESPACES VECTORIELS NORMÉS 17

Proposition 2.1.6. Toute réunion d’ouverts et toute intersection finie d’ou-


verts est ouverte.
S
Démonstration : Si x ∈ i∈I Ai , où les Ai sont ouverts, il existe un indice
i ∈ I tel que x ∈ Ai . Par
S suite il existe une boule B(x,
Sr), avec r > 0 incluse
dans Ai et donc dans i∈I Ai , ce qui prouve bien que i∈I Ai est ouvert.
Pour montrer qu’une intersection finie d’ouverts est ouverte, il suffit de remar-
quer qu’une intersection finie de boules de même centre et de rayons non nuls
est encore une boule de même centre et de rayon non nul.

Définition 2.1.7 (Ensemble fermé). Une partie A ⊂ E d’un EVN est fermée
si son complémentaire est ouvert.

Proposition 2.1.8. Toute intersection et toute réunion finie de fermés est


fermée.

Démonstration : On passe aux complémentaires dans la Proposition 2.1.6.

Définition 2.1.9. Une suite de vecteurs (xn )n∈N d’un EVN converge vers un
vecteur x ∈ E si et seulement si kxn − xk → 0 quand n → ∞.

Remarque 2.1.10. Soient E1 et E2 sont deux EVN. Dans l’espace vectoriel


produit E = E1 × E2 muni de l’une des normes définies ci-dessus, 2.1.2, on
remarque qu’une suite (xn )n∈N = ((yn , zn ))n∈N converge vers un point x =
(y, z) si et seulement si yn → y et zn → z quand n → ∞.

Exemples 2.1.11. On peut considérer Rp comme le produit de p copies de


R. La convergence d’une suite de vecteurs pour l’une des normes définies dans
l’exemple 2.1.2 est donc la convergence coordonnées par coordonnées.

On a alors une autre caratérisation des parties fermées en termes de conver-


gence de suites :

Proposition 2.1.12. Dans un EVN E, une partie A est fermée si et seulement


si pour toute suite (xn )n∈N ⊂ A, convergeant vers x ∈ E, alors x ∈ A.

Démonstration : Supposons que A est fermée soit soit (xn )n∈N une suite de
A convergeant vers x ∈ E. Si x 6∈ A, alors, comme Ac est ouvert, il existe une
boule B(x, r), avec r > 0 incluse dans Ac . Cette boule ne peut donc contenir
aucun point de la suite (xn )n∈N , ce qui contredit la convergence de cette suite
vers x. Donc x ∈ A.
Réciproquement, supposons que pour toute suite (xn )n∈N ⊂ A, convergeant
vers x ∈ E, alors x ∈ A et que Ac n’est pas ouvert. Il existe donc x ∈ Ac
18 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

1
tel que pour tout n ∈ N, B(x, ) rencontre A. Pour chaque n ∈ N, on choisit
n
1
un point xn ∈ B(x, ). La suite ainsi construite converge vers x 6∈ A, ce qui
n
constitue une contradiction donc Ac est bien ouvert.
Définition 2.1.13 (Adhérence d’une partie). 1) Un point x est adhérent à
un sous-ensemble A d’un EVN E s’il est limite d’une suite de points de A.
2) L’adhérence ou fermeture A de A est l’ensemble des points adhérents à A.
Proposition 2.1.14. L’ensemble A est fermé si et seulement s’il contient tous
ses points adhérents, c’est à dire A = A.
Démonstration : On remarque d’abord que, par définition, on a toujours
A ⊂ A et que par la Proposition 2.1.12, A est fermé. Supposons que A est fermé.
Alors, d’après la Proposition 2.1.12, A contient tous ses points adhérents et
donc A ⊂ A. D’où l’égalité.
Réciproquement, si A = A, A est évidemment fermé.
Définition 2.1.15. Soit A une partie d’un EVN E et x ∈ E. La distance de
x à A est 
d(x, A) = inf kx − yk , y ∈ A

Proposition 2.1.16. 1) A = {x ∈ E , d(x, A) = 0}.


2) A est fermé si et seulement si ∀x ∈
/ A , d(x, A) > 0.

Démonstration : 1) La fonction d(·, A) est évidemment continue et donc


{x ∈ E , d(x, A) = 0} est fermé. Comme cet ensemble contient A, il contient
aussi A.
Soit x ∈ E tel que d(x, A) = 0. Il existe donc une suite (xn )n∈N ⊂ A qui
converge vers x. Par définition, x ∈ A. D’où l’autre inclusion {x ∈ E , d(x, A) =
0} ⊂ A.
2) A est fermé si et seulement si A = A = {x ∈ E , d(x, A) = 0}. Donc A est
fermé si et seulement si ∀x 6∈ A , d(x, A) 6= 0.
Définition 2.1.17 (Intérieur d’une partie). 1) Un point x est intérieur à une
partie A d’un EVN E s’il existe une boule B(x, r) de centre x, de rayon r > 0
incluse dans A.
o
2) L’intérieur A de A est l’ensemble des ses points intérieurs.
Remarque 2.1.18. Il revient au même de dire qu’un point x est intérieur à une
partie A et que x n’est pas adhérent au complémentaire Ac de A.
2.1. TOPOLOGIE DES ESPACES VECTORIELS NORMÉS 19

Démonstration : En effet si x est intérieur à une partie A, il existe une


boule de centre x et de rayon r > 0 incluse dans A donc dont l’intersection
avec Ac est vide. Par suite aucune suite de Ac ne peut appartenir à cette boule,
donc ne peut converger vers x.
Réciproquement si une suite de Ac converge vers x, toute boule centrée en x
contient des points de cette suite et ne peut donc pas être incluse dans A. Donc
x ne peut être intérieur à A.

Proposition 2.1.19. L’ensemble A est ouvert si et seulement s’il est égal à


son intérieur.
c o
Démonstration : Il suffit de remarquer que A = (Ac ) et de passer aux
complémentaires dans la Proposition 2.1.14.

Proposition 2.1.20. Soit A ∈ E ;


1) L’adhérence de A est le plus petit fermé contenant A.
2) L’intérieur de A est le plus grand ouvert contenu dans A.

Démonstration : 1) A est un fermé qui contient A. Si F est un fermé


contenant A, F contient les limites de suites convergentes de points de A, il
contient donc A. A est donc bien le plus petit fermé contenant A.
2) On passe aux complémentaires dans 1).

Définition 2.1.21 (Compact). Une partie K d’un EVN est compacte si de


toute suite de points de K on peut extraire une sous-suite convergeant dans K.

Exemple 2.1.22. E = R : les intervalles fermés bornés sont compacts.

Démonstration : Rappelons que dans R toute ensemble majoré a une borne


supérieure. Si (xn )n∈N est une suite dans l’intervalle [a, b] posons pour tout
entier p :

Mp = sup xn / n ≥ p
On a a ≤ Mp ≤ b et la suite Mp est décroissante, minorée par a, donc admet
une limite M . Pour tout entier k ≥ 1 on peut trouver un entier p(k) ≥ k tel
1 1
que Mp(k) < M + puis un entier n(k) ≥ p(k) tel que xn(k) > Mp(k) − .
k k
1 1
Alors n(k) ≥ k et M − < xn < M + donc n(k) → ∞ et xn(k) → M quand
k k
k → ∞.
On peut trouver k1 < k2 < . . . < ki < ki+1 . . . tels que n(k1 ) < n(k2 ) <
. . . < n(ki ) < n(ki+1 ) . . .. La suite (xn(ki ) )i≥1 est une suite extraite de (xn ) et
convergente vers M ∈ [a, b].
20 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

Proposition 2.1.23. 1) Toute partie fermé d’un compact est compacte.


2) L’image d’un compact par une application continue est compacte.
3) Si K est un compact et f : K → R une application continue alors f est
bornée et atteint ses bornes.
4) Tout compact d’un EVN est fermé et borné.

Démonstration : 1) Si K est compact et F ⊂ K est fermé, de toute suite


(xn )n∈N de points de F on peut extraire une sous suite convergeant vers un
point x de K. Alors x ∈ F puisque F est fermé.
2) Soit K un compact de l’EVN E1 et f : K → E2 une application continue.
Soit (yn ) une suite de points de f (K) : pour tout n il existe donc xn ∈ K tel
que yn = f (xn ).
Soit (xnk )k≥1 une suite extraite convergeant vers x ∈ K.
Par continuité on a ynk = f (xnk ) → f (x) ∈ f (K).
3) Soit M = sup f (x) (éventuellement M = +∞). Il existe une suite (xn )n∈N ∈
x∈K
K telle que f (xn ) → M quand n → ∞.
On extrait une sous suite (xnk )k∈N convergeant vers x ∈ K. Alors par conti-
nuité (f (xnk ))k∈N converge vers f (x) et donc M = f (x). En particulier M <
+∞ et f atteint son maximum M sur K au point x.
Le raisonnement est le même pour le minimum.
4) En appliquant le point 3) à la fonction continue f (x) = kxk on voit que K
est borné.
Si une suite (xn )n∈N de points de K converge vers un point x de E il en est de
même de toutes ses sous-suites. Or l’une d’entre elles converge vers un point
de K donc x ∈ K et par suite K est fermé.

Proposition 2.1.24. Si E1 et E2 sont deux EVN et si K1 et K2 sont des


compacts de, respectivement, E1 et E2 alors K1 ×K2 est un compact de E1 ×E2 .

Démonstration : Soit (xn )n∈N une suite de points de K1 × K2 . On a xn =


(yn , zn ) avec yn ∈ K1 et zn ∈ K2 .
Soit (yn(k) )k∈N une suite extraite de (yn )n∈N qui converge vers y ∈ K1 . Posons
ηk = ynk et ζk = zn(k) .
Soit (ζk(m) )m∈N une suite extraite convergeant vers z ∈ K2 . La suite (ηk(m) )m∈N
étant extraite de la suite convergente (ηk )k∈N converge vers le même point y.
Donc (ηk(m) , ζk(m) )m∈N → (y, z) ∈ K1 × K2 lorsque m → ∞. Or c’est une suite
extraite de (xn )n∈N et K1 × K2 est bien compact.

Lemme 2.1.25. Munissons l’espace vectoriel Rp de la norme k(x1 , . . . , xp )k1 =


p
|xi |. Alors les fermés bornés de Rp muni de cette norme sont compacts.
P
i=1
2.1. TOPOLOGIE DES ESPACES VECTORIELS NORMÉS 21

Démonstration : D’après la proposition précédente, pour tout M > 0 l’en-


semble [−M, M ]n = [−M, M ] × [−M, M ] × . . . × [−M, M ] est compact dans
Rp muni de la norme k k1 . Si K est un fermé borné de Rp , soit M = sup kxk1 .
x∈K
On a K ⊂ [−M, M ]p ; K est donc fermé dans un compact, donc compact.

Remarque 2.1.26. Lorsque deux normes k·k1 et k·k2 sur un espace vectoriel E
sont équivalentes, toutes les notions topologiques (convergence, fermés, ouverts,
compacts, continuité. . . .) sont les mêmes relativement à k·k1 ou à k·k2 .

Définition 2.1.27 (EVN isomorphes ou isométriques). Plus généralement, si


E1 et E2 sont deux EVN, munis respectivement des normes k·k1 et k·k2 et si
T : E1 → E2 est une application linéaire bijective telle qu’il existe a, b > 0
vérifiant
∀x ∈ E1 , a kxk1 ≤ kT xk2 ≤ b kxk1
on dira que E1 et E2 sont isomorphes et ils seront dits isométriques si a = b = 1.

On peut alors généraliser la remarque ci-dessus :


Remarque 2.1.28. Lorsque deux EVN E1 et E2 sont isomorphes, toutes les
notions topologiques (convergence, fermés, ouverts, compacts, continuité. . . .)
sont conservées par T et T −1 .

Théorème 2.1.29. Sur un EVN de dimension finie toutes les normes sont
équivalentes.

Démonstration : Soit E un EVN de dimension finie p, (e1 , . . . , ep ) une base


de E et k·k une norme sur E. La formule
p p
X X
λi ei = |λi |



i=1 1 i=1

définit une autre norme k·k1 sur E.


Posons b = max kei k. On a
i=1,...,p
p p p
X X X
λi ei ≤ |λi | kei k ≤ b |λi |



i=1 i=1 i=1

autrement dit kxk ≤ b kxk1 pour tout x ∈ E.


En particulier k·k est continue par rapport à k·k1 puisque

∀x, y ∈ E, kxk − kyk ≤ kx − yk ≤ b kx − yk1
22 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

L’ensemble S = {x ∈ E / kxk1 = 1} est compact : en effet c’est exactement


l’image du fermé borné de Rp , muni de la norme k·k1 du Lemme 2.1.25, Σ =
Xp
{(λ1 , . . . , λp ) ∈ Rp / |λi | = 1} par l’application continue (λ1 , . . . , λp ) 7→
Pp i=1
i=1 λi ei .
La fonction continue k·k atteint donc son minimum sur S ; autrement dit il
existe x0 ∈ E avec kx0 k1 = 1 et ∀x ∈ S, kxk ≥ kx0 k. Comme x0 6= 0 on a
x
kx0 k > 0. Posons a = kx0 k ; pour tout x ∈ E non nul on a ∈ S donc :
kxk1

x
kxk = kxk1 ≥ a kxk
1
kxk1
Si x = 0 on a kxk = 0 = kxk1 .
Finalement on a montré que toute norme k·k sur E est équivalente à k·k1 . Si
k·k , k·k0 sont deux normes sur E elles sont équivalentes à k·k1 , donc équiva-
lentes entre elles.
Corollaire 2.1.30. Tout EVN de dimension p est isomorphe à Rp .
Démonstration : Comme dans la démonstration précédente, on fixe une
base (e1 , . . . , ep ) et on définit une norme sur Rp par :

k(λ1 , . . . , λp )k = kλ1 e1 + . . . + λp ep k

Pour cette norme, l’opérateur linéaire T tel que T (λ1 e1 +. . .+λp ep ) = (λ1 , . . . , λp )
est une isométrie.
Corollaire 2.1.31. Dans un EVN de dimension finie E, tout ensemble fermé
borné est compact.
Démonstration : En effet, ce résultat est vrai dans Rp pour la norme k·k1
par le Lemme 2.1.25. Par le Théorème 2.1.29 et la Remarque 2.1.28, elle est
vraie sur Rp pour toute norme et sur tout EVN de dimension finie par le
Corollaire 2.1.30 et la Remarque 2.1.26.
Remarque 2.1.32. Le résultat devient faux en dimension infinie.
Par exemple considérons l’espace `1 des suites (xn )n∈N de réels telles que
P∞ ∞
P
|xn | < ∞, muni de la norme k(xn )k = |xn |, voir l’Exemple 2.1.3 .
n=1 n=1
La boule unité fermée de `1 est un fermé borné non compact. En effet notons
en la suite de réels (0, 0, . . . , 0, 1, 0 . . .) (le 1 en nième place). On a ken k = 1
et ken − em k = 2 pour tous n, m entiers distincts. Donc la suite (en )n∈N n’est
pas de Cauchy dans `1 , de même que ses sous-suites, qui ne convergent donc
pas.
2.1. TOPOLOGIE DES ESPACES VECTORIELS NORMÉS 23

Remarque 2.1.33. Ce phénomène est général : le théorème de F. Riesz dit dans


un EVN de dimension infinie la boule unité fermée n’est jamais compacte.
Proposition 2.1.34. Si K est un compact de E, alors pour tout x ∈ E, il
existe x0 ∈ K tel que
d(x, K) = kx − x0 k
Démonstration : La fonction de K → R+ qui à y ∈ K associe kx − yk est
continue. Il suffit donc d’appliquer la Proposition 2.1.23, 3).
Définition 2.1.35 (Dual d’un EVN). Le dual (topologique) E 0 d’un espace
vectoriel normé E est l’ensemble des applications linéaires continues de E dans
R, appellées formes linéaires continues.
Proposition 2.1.36. Soit f une forme linéaire sur un EVN E. Les propriétés
suivantes sont équivalentes :
1) f est continue.
2) f est continue à l’origine.
3) f est bornée sur la boule unité B(0, 1) de E.
4) ∃M ≥ 0 tel que ∀x ∈ E , kf (x)k ≤ M kxk.
Démonstration : Les implications 1) ⇒ 2) ⇒ 3) sont évidentes.
Montrons
3) ⇒ 4). Soit M = sup{kf (x)k , kxk ≤ 1}. Si x 6= 0, on peut écrire :
f (x)
kxk ≤ M et par linéarité, ceci implique bien kf (x)k ≤ M kxk. L’inégalité

est évidente si x = 0.
Montrons 4) ⇒ 1) : Soit M la constante donnée par 4) et soient x, y ∈ E,
alors : kf (x) − f (y)k = kf (x − y)k ≤ M kx − yk. Ceci prouve la continuité de
f sur E.
Définition 2.1.37 (Norme d’une forme linéaire). La norme d’une forme li-
néaire continue sur un EVN est définie par
kf k = sup |f (x)|
x∈E,kxk≤1

Proposition 2.1.38. Le dual E 0 d’un EVN E est un EVN, la norme de E 0


est donnée par :
∀f ∈ E 0 , kf k = sup |f (x)|
x∈E,kxk≤1

Notations 2.1.39. Les élément du dual E 0 de E seront notés de deux façons


différentes selon le contexte :
i) ou bien la notation fonctionnelle f : E → R
ii) ou bien la notation vectorielle par analogie avec le cas préhilbertien (Cha-
pitre 5) : y ∈ E 0 agit sur les éléments de E par le crochet de dualité hy, xi , pour x ∈
E.
24 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

Propriétés 2.1.40. 1) Dans un espace vectoriel de dimension finie, toutes


les formes linéaires sont continues.
2) Le dual d’un EVN de dimension finie est un EVN de même dimension.
3) Tout sous-espace affine d’un EVN de dimension finie est fermé.

Démonstration : Soit E un EVN de dimension p.


1) On fixe une base (e1 , . . . , ep ) de E et on utilise la norme k·k1 définie par
p p
X X
λi ei = |λi | .



i=1 1 i=1

Si f est une forme linéaire sur E, on écrit :


p
p
X  X
f λ e = λ f (e )

i i i i

i=1 1 i=1 1
p
p
 X  
X

≤ sup kf (ei )k |λi | = sup kf (ei )k λi ei

i=1,...,p i=1 i=1,...,p
i=1

1

Donc, par la Proposition 2.1.36, f est continue de norme inférieure ou égale à


sup kf (ei )k. Par Théorème 2.1.29, f est continue par rapport à toute norme.
i=1,...,p

2) On fixe une base (e1 , . . . , ep ) de E et on introduit la base duale (e∗1 , . . . , e∗p ),


définie pour i, j = 1, . . . , p par e∗i (ej ) = δi j, où δi j est le symbol de Kronecker
qui vaut 1 si i = j et 0 sinon. (e∗1 , . . . , e∗p ) est une partie libre de E 0 car si
Xp
λi e∗i = 0, on applique cette forme linéaire à ej pour chaque j = 1, . . . , p,
i=1
ce qui implique λj = 0. C’est aussi une partie génératrice de E 0 car si f ∈ E 0 ,
Xp
on note αj = f (ej ) pour j = 1, . . . , p et on peut écrire, pour x = λi ei ,
i=1
p
X p
X p
X

f (x) = f λi ei = λi f (ei ) = λi αi . Or, par définition de la base
i=1 i=1 i=1
p
X
duale, λj = e∗j (x) pour tout j = 1, . . . , p et par suite f (x) = e∗i (x)αi =
i=1
p
X p
X

αi e∗i .

αi ei (x). D’où l’égalité f =
i=1 i=1
La base duale ∗ ∗
(e1 , . . . , ep ) est donc bien une base de E 0 , ce qui implique en
particulier que E 0 est de dimension p.
2.1. TOPOLOGIE DES ESPACES VECTORIELS NORMÉS 25

3) Il suit de la partie 1) que tout hyperplan H ⊂ E est fermé. Soit M un


sous-espace vectoriel de E de dimension k, soit (e1 , . . . , ep ) une base de E telle
que (eT1 , . . . , ek ) est une base de M , et soit (e∗1 , . . . , e∗p ) la base duale. Alors
M = pi=k+1 Hi , où Hi = {x ∈ E / e∗i (x) = 0}, et il suit que M est fermé (une
intersection de hyperplans fermés). Si Y ⊂ E est un sous-espace affine, M la
direction de Y et x0 ∈ Y , il suit que Y = x0 + M (voir Proposition 1.3.3) et
alors Y est fermé.

Remarque 2.1.41. Plus généralement, tout SEA de dimension finie (d’un EVN
de dimension quelconque) est fermé. Effectivement, soit Y ⊂ E avec dim Y <
∞ et soit (yn ) une suite dans Y qui converge (vers la limite a qui a priori peut
être dans E \ V ). Alors (yn ) est bornée, disons kyn k ≤ R pour tout n ∈ N.
Donc (yn ) est une suite dans un ensemble compact K = {y ∈ Y / kyk ≤ R}
et sa limite appartient forcément à K ⊂ Y .

Dans un espace qui n’est pas de dimension finie, il existe des formes linéaires
qui ne sont pas continues.

Exemple 2.1.42. Soit E = c00 l’espace des suites de réels nulles à partir d’un
certain rang, P de la norme k·k∞ . La forme linéaire f sur c00 , définie par
 muni
f (xn )n∈N = ∞ i=1 xi n’est pas continue.

En effet, f est bien définie et linéaire sur E mais n’est pas bornée sur la boule
unité car en considérant la suite finie de réels comportant n termes non nuls :
sn = (1, 1, 1, . . . , 1, 0, 0, . . .), on a ksn k∞ = 1 et f (sn ) = n → +∞.

Définition 2.1.43 (Espace EVN separable). On dit qu’un EVN E est sépa-
rable s’il existe une suite d’espaces vectoriels de dimension finie dont la réunion
est dense dans E.

On remarquera qu’il est équivalent de dire qu’il existe une suite (xn )n∈N , dense
dans E (la définition habituelle de la séparabilité).
On peut montrer que `1 , `2 , c0 sont séparables mais que `∞ ne l’est pas.

Dans les EVN, on a des exemples naturels de convexes :

Exemples 2.1.44. (Boules de normes)


Soit k·k une norme sur E. Les boules de E, ouvertes ou fermées, B(x0 , r),
B̄(x0 , r), pour r > 0 sont des convexes.

Les boules centrées à l’origine sont des convexes particuliers, en ce qu’ils sont
symétriques, c’est à dire que si x ∈ B(0, r) alors −x ∈ B(0, r) et en particulier
0 ∈ B(0, r).
26 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

Plus généralement, considérons une application p : E → R+ , appelée jauge,


homogène, sous-additive, nulle en 0, c’est à dire qui vérifie :
i) p(λx) = λp(x) (∀x ∈ E, ∀λ > 0)
ii) p(x + y) ≤ p(x) + p(y) (∀x, y ∈ E).
iii) p(0) = 0.
Alors les ensembles {x ∈ E / p(x) < 1} et {x ∈ E / p(x) ≤ 1} sont des
convexes contenant 0.
Inversement, à tout convexe contenant 0, on peut associer une fonction jauge :

Définition 2.1.45 (Jauge d’un convexe). Si C est un convexe contenant 0, sa


jauge est la fonction jC : E → R+ définie par :

x
jC (x) = inf{λ > 0 / ∈ C}
λ
(avec la convention inf ∅ = +∞). Alors jC vérifie les propriétés i) à iii) ci-
dessus, et de plus :

x ∈ E / jC (x) < 1} ⊂ C ⊂ {x ∈ E / jC (x) ≤ 1 .

On remarquera :
1) La jauge jC d’un convexe C est une jauge au sens général défini ci-dessus.
2) jC est à valeurs finies si et seulement si l’intersection de C avec toute
demi-droite issue de 0 n’est pas réduite à {0} (C est dit absorbant).
3) La fonction jC est une norme si et seulement si de plus C est symétrique
et ne contient aucune demi-droite issue de 0.

2.2 Topologie des ensembles convexes dans les EVN

Soit (E, k·k) est un espace vectoriel normé.

Proposition 2.2.1. L’adhérence d’un convexe (resp., d’un SEA, d’un cône
convexe, SEV) est un convexe (resp., un SEA, un cône convexe, un SEV).

Démonstration : Si C est un convexe et x et y sont adhérents à C, il


existe deux suites (xn )n et (yn )n dans C convergeant respectivement vers x et
y. Pour tout θ ∈ [0, 1], la suite (θxn + (1 − θ)yn )n est dans C et converge vers
θx + (1 − θ)y, qui est donc adhérent à C. Donc C est convexe. Même preuve
pour un SEA, un cône convexe ou SEV.
Remarque 2.2.2. Le fait que F ⊂ E soit fermé n’entraîne pas que conv(F ) soit
fermé.
2.2. TOPOLOGIE DES CONVEXES DANS LES EVN 27

En effet soit E = R2 , F1 la branche d’hyperbole {(x, y) ∈ R2 / x > 0, xy = 1},


et F2 son symétrique par rapport au premier axe. Alors F1 , F2 sont fermés, donc
aussi F = F1 ∪F2 ; mais conv(F ) est le demi-plan ouvert {(x, y) / x > 0, y ∈ R},
qui n’est pas fermé.

Définition 2.2.3 (Enveloppe convexe fermée). L’enveloppe convexe fermée


d’une partie A de E est l’adhérence de son enveloppe convexe. On la note
conv(A).

Exercice 2.1. conv(A) est le plus petit convexe fermé de E contenant A.

Proposition 2.2.4. 1) Si A est un ensemble fini, conv(A) est compacte.


2) Plus généralement si K1 , . . . , Kp sont des convexes compacts, conv(K1 ∪
. . . ∪ Kp ) est compacte.
Pp
Démonstration : Posons Tp = {(λ1 , . . . , λp ) ∈ [0, 1]p / i=1 λi = 1} : Tp
est un compact car fermé dans [0, 1]p .
1) Si A = {a1P , . . . , ap }, on considère l’application continue f : Tp → E,
(λ1 , . . . , λp ) 7→ pi=1 λi ai ; on a conv(A) = f (Tp ), donc est compact comme
image continue d’un compact.

2) La preuve est analogue Ppen considérant g : Tp × K1 × · · · × Kp → E,


(λ1 , . . . , λp , x1 , . . . , xp ) 7→ i=1 λi xi .
Remarque 2.2.5. On verra au chapitre 3 que si E est de dimension finie, l’enve-
loppe convexe de tout compact de E est encore compacte. Toutefois ceci n’est
plus vrai en dimension infinie.
Prenons par exemple pour E l’espace `∞ des suites réelles bornées, muni de
la norme k(xn )n k = sup |xn |, voir l’Exemple 2.1.3. Pour tout k soit ek =
n∈N
ek
(0, 0, . . . , 0, 1, 0, 0, . . .) où le 1 est placé à la k-ième place. Soit K = {
/k≥
k
1}∪{0}. Alors K est compact : en effet, toute suite de points de K soit contient
une suite extraite constante, soit converge vers 0.

X ek
L’adhérence de conv(K) contient tous les points de la forme x = λk tels
k
k=1
P∞
que λk > 0 et λk ≤ 1. En effet, un tel point est limite dans `∞ de la suite
k=1
n
X ek
xn = λk , qui est clairement dans conv(K).
k
k=1
Mais un tel point n’appartient pas à l’ensemble conv(K) lui-même, car si y =
(yn )n∈N est dans conv(K), il y a seulement un nombre fini de coordonnées yn
non nulles.
28 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

On va maintenant étudier l’intérieur d’un convexe. Commençons par une re-


marque :
Remarque 2.2.6. Soit C un convexe d’un EVN E , alors aucun point de l’inté-
o
rieur C de C n’est extrémal.
Lemme 2.2.7. Soit C un convexe ayant un point intérieur x0 . Pour tout point
x adhérent à C, tout point y du segment semi-ouvert [x0 , x[ est intérieur à C.
Démonstration : i) Supposons d’abord que x ∈ C.
Soit B(x0 , r) une boule de centre x0 , de rayon r > 0 incluse dans C. Soit f
l’homothétie de centre x, de rapport λ, amenant x0 sur y.
On a :
∀t ∈ E, f (t) = x + λ(t − x)
= (1 − λ)x + λt
où λ est tel que y = f (x0 ) = (1 − λ)x + λx0 , donc 0 < λ ≤ 1. On a f (C) ⊂ C
par convexité de C, et f B(x0 , r) = B(y, λr) car f (t) − y = f (t) − f (x0 ) =
λ(x − x0 ), donc B(y, λr) ⊂ C et y est intérieur à C.
ii) Soit maintenant x ∈ C et y ∈]x0 , x[.
Soit g l’homothétie de centre y amenant x0 sur x.
On a g(t) = y + λ(t − y) ; la condition g(x0 ) = x s’écrit x − y = λ(x0 − y), d’où
λ < 0. Alors g(B(x0 , r)) = B(x, |λ| r). Puisque x est adhérent à C, il existe
z ∈ C ∩ B(x, |λ| r). Soit u = g −1 (z). Alors u ∈ B(x0 , r) est lui aussi intérieur
à C, et z − y = λ(u − y), λ < 0 montre que y est situé sur le segment ]u, z[.
D’après le i) ci-dessus, on voit que y est intérieur à C.
Proposition 2.2.8. Si C est un convexe d’intérieur non vide, alors son inté-
o
o o o
rieur C est convexe ; on a de plus : C = C et C = C.
o o
Démonstration : i) Si x, y ∈ C, tout le segment [x, y] est inclus dans C
o
d’après le Lemme précédent. Donc C est convexe.
o
ii) L’inclusion A ⊂ A est vraie pour toute partie A de E ; inversement si
o
x ∈ C, alors x est extrémité d’un segment ouvert inclus dans C, d’après le
o
Lemme précédent, donc x ∈ C.
On notera que l’adhérence d’un segment ouvert non vide ]x0 , x[ est le segment
fermé [x0 , x].
o
o
iii) L’inclusion A ⊃ A est vraie pour toute partie A de E. Inversement soit x
o
intérieur à C ; soit r > 0 tel que B(x, r) ⊂ C. Comme C = C, d’après ii), il
2.2. TOPOLOGIE DES CONVEXES DANS LES EVN 29

o
existe y ∈ C ∩ B(x, r). Soit z ∈ E tel que x soit milieu du segment [z, y] ; on a
encore z ∈ B(x, r), donc z ∈ C ; d’après le Lemme précédent, le segment ]z, y]
o
est inclus dans C ; en particulier x est intérieur à C.
o
o
Remarque 2.2.9. Si E est de dimension infinie, l’égalité C = C peut être fausse
o
lorsque C est vide.
Par exemple, soit E = c0 , l’espace des suites de réels convergeant vers 0, muni
de la norme k(xn )n∈N k = sup |xn |, voir l’Exemple 2.1.3 et C = c00 , le sous-
n∈N
o
espace des suites nulles à partir d’un certain rang. Alors C = E, mais C = ∅
car toute boule de E contient des vecteurs dont toutes les coordonnées sont
non nulles.

Toutefois ce phénomène ne se produit pas en dimension finie, comme on le


verra au chapitre 3.

Dans le cas des hyperplans et des demi-espaces affines en dimension infinie, on


peut dire un peu plus :

Soit H un hyperplan affine, D+ et D− les deux demi-espaces affines définis


par H, et D+ 0 = D \ H, D 0 = D \ H les demi-espaces stricts associés, voir
+ − −
Définitions 1.3.11 et 1.3.16.
Proposition 2.2.10. Si H = {x ∈ E/ f (x) = a} où f est une forme linéaire
non nulle sur E et a ∈ R, alors les assertions suivantes sont équivalentes :
1) f est continue, c’est à dire f ∈ E 0 .
2) D+0 est ouvert.

3) D+ est fermé.
4) H est fermé.
5) D+ est d’intérieur non vide.
Les propriétés analogues à 2), 3) et 5) avec D− et D−0 sont également équiva-

lentes aux précédentes.


Démonstration : 1) ⇒ 2) : Si f est continue, D+ 0 est évidemment ouvert.

2) ⇒ 3) : Si D+0 est ouvert, son complémentaire D est fermé et D également


− +
car c’est limage de D− par n’importe quelle symétrie par rapport à H, centrée
en un point de H.
3) ⇒ 4) : Si D+ est fermé, par l’argument précédent, D+ l’est aussi et comme
H = D+ ∩ D− , il est aussi fermé.
4) ⇒ 5) Supposons que H soit fermé et soit x0 ∈ / H. Alors f (x0 ) 6= a, par
exemple f (x0 ) < a. Comme le complémentaire H c de H est ouvert, il existe
30 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

r > 0 tel que B(x0 , r) ⊂ H c . Il est alors clair que f B(x0 , r) < a car si


x1 ∈ B(x0 , r) vérifie f (x1 ) ≥ a, la fonction g(t) = f (1 − t)x0 + tx1 prend les


valeurs f (x0 ) < a en t = 0 et f (x1 ) ≥ a en t = 1. Comme g est une fonction
affine sur R, elle prend la valeur a en un t ∈ [0, 1]. Le point u = (1 − t)x0 + tx1
appartient alors à H, ce qui est contradictoire. Donc B(x0 , r) ∈ D+ et D+ est
ouvert.
o
5) ⇒ 1) Soit x ∈ D+ et B(x, r) ⊂ D+ .
f (x) − a
On a donc : ∀z ∈ B(0, 1) , f (x + rz) ≥ a, soit −f (z) ≤ . Par linéarité,
r
f (x) − a
ceci implique aussi en changeant z en −z, ∀z ∈ B(0, 1) , f (z) ≤ . Par
r
f (x) − a f (x) − a
suite, nécessairement ≥ 0 et ∀z ∈ B(0, 1) , |f (z)| ≤ . Donc
r r
f (x) − a
f est continue de norme inférieure à , ce qui implique bien 1).
r
o o
0 = D et D 0 = D .
Corollaire 2.2.11. Si H est fermé, alors D+ + − −
o
Démonstration : Soit x ∈ D+ . Il est clair que x ∈ D+ 0 car toute boule

centrée en u ∈ H rencontre à la fois D+ et D− et u ne peut pas être intérieur


à D+ .
0 est ouvert et inclus dans D il est donc
Réciproquement si H est fermé, D+ +
o
inclus dans D+ .

Définition 2.2.12. On dit qu’une partie A d’un EVN est dense dans E si son
adhérence est égale à E.
Proposition 2.2.13. Une partie A d’un EVN est dense dans E si et seulement
si son complémentaire Ac ne contient pas de boule de rayon strictement positif.

Démonstration : En effet, si Ac contient une boule, A ne contient pas le


centre de cette boule donc A n’est pas dense dans E.
Réciproquement, si A n’est pas dense dans E, il existe un point x de E qui n’est
pas dans l’adhérence de A, donc qui est dans l’intérieur de Ac , d’où l’existence
d’une boule centrée en x, de rayon strictement positif, qui ne rencontre pas
A.
Corollaire 2.2.14. Un hyperplan affine est soit fermé, soit dense dans E.
Démonstration : Si l’hyperplan H n’est pas dense dans E, le complémen-
taire de H contient une boule B(x, r) de rayon non nul, donc D+ 0 ∪ D 0 aussi.

0 0
Cette boule ne peut intersecter à la fois D+ et D− car sinon, elle intersecterait
2.3. FONCTIONS S.C.I. SUR UN EVN 31

alors H, donc est incluse par exemple dans D+ 0 . Donc D est d’intérieur non
+
vide, et H est fermé d’après la Proposition 2.2.10.

Exemple 2.2.15. On reprend l’Exemple 2.1.42 : soit E = c00 l’espace des


suites de réels nulles à partir d’un certain rang, P∞ de la norme k·k∞ . La
 muni
forme linéaire f sur c00 , définie par f (xn )n∈N = i=1 xi n’est pas continue.
L’hyperplan H = {x ∈ E , f (x) = 0} n’est donc pas fermé en appliquant
l’équivalence 1) ⇐⇒ 4) de la Proposition 2.2.10 avec a = 0.

Explicitons une suite de H qui ne converge pas dans H : on part d’un P vecteur de
c00 qui n’est pas dans H, soit x = (x1 , x2 , . . . , xn , 0, 0, . . .) avec α = ni=1 xi 6=
0 et on définit la suite (ξk )k∈N∗ par :
 α α α 
ξk = x1 , x2 , . . . , xn , − , − , . . . , − , 0, 0, . . .
k k k
α
où on a mis k termes en − . Alors, pour tout k > 0, ξk ∈ H et de plus :
k
|αk |
kx − ξk k = → 0 quand k → +∞
k
Donc la suite (ξk )k∈N∗ est dans H et converge vers x 6∈ H.

Bien entendu, en dimension finie, tous les hyperplans sont fermés.

Corollaire 2.2.16. Si C est un convexe d’intérieur non vide, tout hyperplan


d’appui (voir 1.4.9) de C est fermé. Si de plus C est fermé, l’intersection d’un
hyperplan d’appui H avec C, F = H ∩ C, est une face fermée de C.

Démonstration : En effet, l’un des demi espaces associé à l’hyperplan d’ap-


pui contient C et est donc d’intérieur non vide, donc H est fermé par la Pro-
position 2.2.10. F est une face par le lemme 1.4.10.
Dans la pratique les hyperplans d’appui d’un convexe fermé d’intérieur non vide
C seront obtenus au moyen d’une forme linéaire f qui atteint son maximum et
son minimum sur C. C’est le cas en particulier si f est continue et C compact.
Dans ce cas, soient M et m, le maximum et le minimum de f sur C. Alors
HM = {x ∈ E / f (x) = M } et Hm = {x ∈ E / f (x) = m} sont des hyperplans
d’appui de C.

2.3 Fonctions s.c.i. sur un EVN

Soit (E, k·k) un EVN. On sait qu’une caractérisation classique de la continuité


d’une fonction numérique définie sur E, est la suivante :
32 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

Une fonction f : E → R est continue si et seulement si l’image réciproque de


tout intervalle ouvert de R est un ouvert de E.
On passe à la notion plus faible de semi-continuité inférieure si l’on se borne
à demander que les images réciproques des intervalles ouverts du type ]a, +∞[
soient ouverts.
Si f est autorisée à prendre les valeurs ±∞, ce sont les intervalles ]a, +∞] que
l’on considère. On a donc :
Définition 2.3.1 (Fonction s.c.i.). On dit que la fonction numérique f : E →
R est semi-continue inférieurement (s.c.i.) si pour tout a ∈ R, l’ensemble {x ∈
E / f (x) > a} est un ouvert de E. Il revient au même de dire que pour tout
a ∈ R, l’ensemble {x ∈ E / f (x) ≤ a} est un fermé de E.
En effet les ensembles {x ∈ E / f (x) > a} et {x ∈ E / f (x) ≤ a} sont
complémentaires ; le premier est ouvert si et seulement si le second est fermé.
Exemple 2.3.2. 1) Un sous-ensemble A de E est fermé si et seulement si sa
fonction caractéristique χA est s.c.i.
2) Toute fonction continue est s.c.i.
3) Une fonction f : E → R est continue si et seulement si f et −f sont s.c.i.
Démonstration : Pour montrer 3), on commence par voir que si f est
continue, f et −f sont s.c.i.
Pour la réciproque, on écrit ]a, b[=]a, +∞] ∩ [−∞, b[ et par suite
f −1 (]a, b[) = f −1 (]a, +∞])∩f −1 ([−∞, b[) = f −1 (]a, +∞])∩(−f )−1 (]−b, +∞]),
ce qui prouve bien que si f et −f sont s.c.i., f est continue.

Proposition 2.3.3. La fonction numérique f : E → R est s.c.i. si et seulement


si son épigraphe est fermé.
Démonstration : i) Supposons que f est s.c.i. Soit (x, t) ∈ E × R un point
n’appartenant pas à epi f . On a donc t < f (x). Choisissons τ ∈ R avec
t < τ < f (x). L’ensemble Uτ = {y ∈ E / f (y) > τ } est un ouvert contenant
x. L’ensemble Uτ ×] − ∞, τ [ est un ouvert de E × R contenant (x, t) et disjoint
de epi f . Donc le complémentaire de epi f est ouvert et epi f est bien fermé.
ii) Réciproquement si epi f est fermé, alors pour tout a ∈ R, l’ensemble Sa :=
epi f ∩ (E × {a}) est fermé comme intersection de deux fermés de E × R ; cet
ensemble s’écrit aussi Sa = Fa × {a}, où l’on a posé Fa = {x ∈ E / f (x) ≤ a}.
Donc Fa est fermé dans E comme image réciproque de Sa par l’application
continue
T x 7→ (x, a). Dans le cas spécial où a = −∞, on note que F−∞ =
t∈R Ft est fermé comme intersection d’une famille de fermés.
2.3. FONCTIONS S.C.I. SUR UN EVN 33

On a une autre caractérisation des fonctions s.c.i. en termes de limites infé-


rieures :

Définition 2.3.4. 1) Si f : E → R, x0 ∈ E, et Y ⊂ E, on pose :

lim inf f (x) = sup


x→x
inf f (x)
0 r>0 d(x,x0 )<r
x∈Y x∈Y

Lorsque Y = E, on écrit simplement lim inf f (x) = sup inf f (x)


x→x0 r>0 d(x,x0 )<r

2) Si (xn )n∈N est une suite de E, on pose :

lim inf xn = lim inf{xp , p ≥ n}


n→+∞ p→+∞

Remarque 2.3.5. Si x0 ∈ Y , on a lim inf f (x) ≤ f (x0 ).


x→x 0
x∈Y

Lemme 2.3.6. Soit Y ⊂ E et x ∈ Y .


1) lim inf f (y) = lim inf f (y).
y→x r→0 d(y,x)<r
y∈Y y∈Y
2) Si xn → x avec xn ∈ Y pour tout n ∈ N, on a : lim inf f (xn ) ≥ lim inf f (y).
y→x
n→+∞
y∈Y
3) Il existe (xn )n∈N ⊂ Y telle que f (xn ) → lim inf f (y).
y→x
y∈Y

Démonstration : Dans tout ce qui suit, on utilise le fait général suivant :

A ⊂ B ⇒ inf A ≥ inf B

1) est vrai car la fonction r → inf d(y,x)<r f (y) est croissante.


y∈Y

2) Pour tout n0 ∈ N, on a : inf n≥n0 f (xn ) ≥ inf{f (y) , y ∈ Y ∩ B(x, rn0 )} où


rn0 = sup{d(x, xn ) , n ≥ n0 }, ce qui prouve le résultat.
1 1
3) On choisit xn ∈ B(x, ) ∩ Y tel que f (xn ) ≤ inf{f (y) , y ∈ B(x, ) ∩ Y } +
n n
1
.
n
Proposition 2.3.7. La fonction numérique f : E → R est s.c.i. si et seulement
si pour tout x0 ∈ X on a lim inf f (x) = f (x0 ).
x→x0

Démonstration : Si f est s.c.i., et f (x0 ) > −∞, alors pour tout t < f (x0 )
l’ensemble {x ∈ E / f (x) > t} est un ouvert contenant x0 , donc contenant aussi
une boule ouverte B(x0 , r), avec r > 0. Donc lim inf x→x0 f (x) ≥ t et en faisant
t → f (x0 ) on obtient lim inf x→x0 f (x) ≥ f (x0 ). Ceci reste évidemment vrai si
34 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

f (x0 ) = −∞. L’inégalité inverse est toujours vraie, donc lim inf x→x0 f (x) =
f (x0 ).
Réciproquement, supposons cette égalité est vraie en tout point x0 ∈ E. Soit
t ∈ [−∞, +∞[ et supposons que f (x0 ) > t. Il existe alors r > 0 tel que
inf x∈B(x0 ,r) f (x) > t. Le point x0 est donc intérieur à l’ensemble Ut = {x ∈
X / f (x) > t}. Comme ceci est vrai pour tout x0 ∈ Ut , cet ensemble est donc
ouvert. Le cas t = +∞ est trivial car U+∞ = ∅.
On traduit familièrement cette propriété en disant que les fonctions s.c.i. ne
peuvent sauter que vers le bas :
Remarque 2.3.8. On dira que f est s.c.i. en x0 ∈ E si lim inf f (x) = f (x0 ).
x→x0

Proposition 2.3.9. 1) Si (fi )i∈I est une famille quelconque de fonctions s.c.i.
de E → R, l’enveloppe supérieure des (fi )i∈I , f = supi fi , est également s.c.i.
2) Si f et g sont des fonctions s.c.i. de X dans R ∪ {+∞}, et α, β des réels
positifs, la fonction αf + βg est s.c.i.
T
Démonstration : 1) On a epi f = i epi fi . C’est donc un fermé, comme
intersection de fermés.
2) Pour tout sous-ensemble A de E, on a :

inf (αf (x) + βg(x)) ≥ α inf f (x) + β inf g(x)


x∈A x∈A x∈A

Il en résulte que pour tout x0 ∈ X, on a :

lim inf (αf (x) + βg(x)) ≥ α lim inf f (x) + β lim inf g(x)
x→x0 x→x0 x→x0

Si f et g sont s.c.i., on en déduit lim inf x→x0 (αf (x)+βg(x)) ≥ αf (x0 )+βg(x0 ).
L’inégalité inverse est triviale.

Remarque 2.3.10. Proposition 2.3.9 1) est fausse si on remplace partout “s.c.i.”


par “continue” (Exercice !)
Considérons maintenant un sous-ensemble Y de E et une fonction f : Y → R
définie sur Y .

Définition 2.3.11 (Fonction s.c.i. définie sur une partie de E). On dit que
la fonction numérique f : Y → R est semi-continue inférieurement (s.c.i.) si
pour tout a ∈ R, l’ensemble {x ∈ Y / f (x) > a} est un ouvert de Y , c’est à
dire l’intersection d’un ouvert de E avec Y .
2.4. FONCTIONS CONVEXES S.C.I. SUR UN EVN 35

Proposition 2.3.12 (Prolongement s.c.i.). Si f : Y → R est une fonction


s.c.i., la fonction f˜ : E → R définie par :

 lim inf f (x) si x ∈ Y
f˜(x) = y→x , y∈Y

+∞ sinon

est un prolongement s.c.i. de f , et on a epi f˜ = (epi f ).

Démonstration : Le fait que f˜(x) = f (x) pour x ∈ Y résulte de la semi-


continuité inférieure de f . Montrons que epi f˜ = (epi f ), il en résultera que f˜
est s.c.i.
a) Si (x, t) ∈ epi f , il existe une suite (xn , tn ) ∈ epi f convergeant vers (x, t).
En particulier xn → x et donc x ∈ Y . Pour tout ε > 0, on a tn ≤ t + ε, pour
n > n0 (ε), d’où f˜(x) ≤ lim inf f (xn ) ≤ t + ε ; en faisant ε → 0, on voit que
f˜(x) ≤ t, c’est à dire (x, t) ∈ epif˜.
b) Réciproquement, si (x, t) ∈ epi f˜, on a f˜(x) < +∞, d’où x ∈ Y et f˜(x) =
lim inf y→x f (y). Il existe alors xn → x, xn ∈ Y telle que f (xn ) → f˜(x). Soit
ε > 0 ; comme t + ε > f˜(x), on a f (xn ) ≤ t + ε pour n ≥ n0 (ε), c’est-à-dire
(xn , t + ε) ∈ epi f , et par conséquent (x, t + ε) ∈ epi f . En faisant ε → 0, on
obtient (x, t) ∈ epi f .

En particulier si Y est un ensemble fermé, toute fonction f : Y → R continue


se prolonge en une fonction s.c.i. sur E en posant

˜ f (x) si x ∈ Y
f (x) =
+∞ sinon

2.4 Fonctions convexes s.c.i. sur un EVN

Soit (E, k·k) un EVN. En réunissant les résultats sur les fonctions convexes et
les fonctions s.c.i. des deux sections précédentes, on obtient immédiatement les
résultats suivants :
Proposition 2.4.1. Une fonction E → R est convexe s.c.i. si et seulement si
son épigraphe est convexe fermé.
Exemple 2.4.2. Si A ⊂ E alors A est convexe fermé si et seulement si χA
est convexe s.c.i.
36 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.

Proposition 2.4.3. 1) L’enveloppe supérieure d’une famille quelconque de


fonctions convexes s.c.i. est convexe s.c.i.
2) Si f et g sont des fonctions convexes s.c.i. de E dans R ∪ {+∞}, et α, β
des réels positifs, la fonction αf + βg est convexe s.c.i.
Soit C un convexe de E.
Proposition 2.4.4 (Prolongement convexe s.c.i.). Si f : C → R est une
fonction convexe s.c.i., la fonction f˜ : E → R définie par :

f (x) = lim inf y∈C f (x) si x ∈ C
˜ y→x

+∞ sinon

est un prolongement convexe s.c.i. de f à E, et on a epi f˜ = (epi f ).

Démonstration : En effet, d’après 2.3.12, f˜ est s.c.i., epi f˜ = (epi f ) et cet


ensemble est un convexe fermé d’après 2.2.1.
En particulier si C est un convexe fermé, toute fonction f : C → R convexe
continue se prolonge en une fonction s.c.i. en posant

˜ f (x) si x ∈ C
f (x) =
+∞ sinon
Remarque 2.4.5. Le prolongement convexe s.c.i. χ˜C de la fonction caractéris-
tique du convexe C est égal à χC .

Lemme 2.4.6. Si la fonction convexe f : E → R prend la valeur −∞ en un


point x0 et si f (x1 ) > −∞, alors f (x) = +∞ pour tout x tel que x1 ∈ [x0 , x[.
Démonstration : Si f (x) < +∞, l’inégalité de convexité sur le segment
[x0 , x[ entraîne f (x1 ) = −∞, ce qui est une contradiction.

Corollaire 2.4.7. Si la fonction convexe f : E → R prend la valeur −∞ en


un point x0 , elle prend la valeur −∞ sur tout l’intérieur de dom f .
o o
Démonstration : Soit x1 ∈ dom f . Alors, il existe z ∈ dom f tel que
x1 ∈ [x0 , z]. Si f (x1 ) > −∞, on obtient une contradiction avec le lemme.

En particulier, en prenant la contraposée de cette proposition, on a :


o
Corollaire 2.4.8. S’il existe x0 ∈ dom f tel que f (x0 ) > −∞, f ne prend
nulle part la valeur −∞.
Corollaire 2.4.9. Si domf est d’intérieur non vide et si f est finie et s.c.i.
en un point x0 ∈ domf , f ne prend nulle part la valeur −∞.
2.4. FONCTIONS CONVEXES S.C.I. SUR UN EVN 37

Démonstration : En effet, comme f (x0 ) > −∞ et f est s.c.i. en x0 , il


existe une boule B(x0 , r) telle que f (x) > −∞ pour tout x ∈ B(x0 , r). Si
f (x1 ) = −∞, il existe z ∈ B(x0 , r) tel que z ∈ [x1 , x0 ]. D’après le Lemme
2.4.6, puisque f (x1 ) = −∞ et f (z) > −∞, f (x0 ) = +∞, ce qui constitue une
contradiction.
38 CHAPITRE 2. EVNS, TOPOLOGIE ET FONCTIONS S.C.I.
Chapitre 3
Structure des convexes de dimension finie

Dans ce chapitre, E est un espace vectoriel de dimension finie. On a vu au


chapitre précédent que sur les espaces vectoriels de dimension finie, toutes les
normes sont équivalentes. Sans perte de généralité, on peut donc munir E d’un
produit scalaire h·, ·i : il suffit d’identifier E à Rp à l’aide d’une Ppbase et de
prendre le produit scalaire naturel de Rp , défini par hx, yi = i=1 xi yi où
x = (x1 , . . . , xp ) et y = (y1 , . . . , yp ). La norme euclidienne associée est alors
2 1/2 .
Pp
kxk = hx, xi1/2 =

i=1 xi

On a également vu au chapitre 2, que dans ce cas, toutes les formes linéaires


sont continues et que le dual de E s’identifie à E, c’est à dire que toute forme
linéaire (continue) f ∈ E 0 sur E est représentée par un élément y ∈ E, avec :

∀x ∈ E , f (x) = hy, xi et kf k = kyk = hy, yi1/2

3.1 Intérieur d’un convexe en dimension finie

Proposition 3.1.1. Soit C un convexe dans un espace vectoriel de dimension


finie E. Les assertions suivantes sont équivalentes :
o
i) C 6= ∅
ii) Aff(C) = E
iii) C contient un repère affine.

Démonstration : i) ⇒ iii) : Toute boule B(x0 , r) contient un repère affine :


(x0 , x0 + ρe1 , x0 + ρe2 , . . . , x0 + ρep , où (e1 , . . . , ep ) est une base de E et ρ <
inf{r/ kei k}.

iii)⇒ i) : Si (x0 , . . . , xp ) est un repère affine de E, alors conv(x0 , . . . , xp ) est


inclus dans C et d’intérieur non vide : en effet soit ui = xi −x P 0 ; (u1 , . . . , up ) est
une basePde E. Soit (u∗1 , . . . , u∗p )Pla base duale. Alors x = pi=0 λi xi , équivaut
lorsque pi=0 λi = 1 à x−x0 = pi=1 λi (xi −x0 ), et dans ce cas λi = u∗i (x−x0 )

39
40 CHAPITRE 3. STRUCTURE DES CONVEXES

pour tout i = 1, 2, . . . , p. Par conséquent :

n p
X o

conv(x0 , . . . , xp ) = x ∈ E / ui (x−x0 ) ≥ 0, i = 1, . . . , p et u∗i (x−x0 ) ≤ 1
i=1

qui contient l’ouvert

n p
X o

x ∈ E / ui (x − x0 ) > 0, i = 1, . . . , p et u∗i (x − x0 ) < 1 .
i=1

p
X xi
Cet ouvert est non vide car il contient le point x = pour lequel
p+1
i=0
1
u∗i (x − x0 ) = pour tout i = 1, 2, . . . , p.
p+1

iii) ⇒ ii) : clair.

ii) ⇒ iii) : Si iii) est faux, soit k le nombre maximum de points affinement
indépendants de C, alors k < n + 1. Soit (x1 , .P . . , xk ) k pointsPaffinement
indépendants de C. Tout x ∈ C peut s’écrire x = ki=1 λi xi , avec ki=1 λi = 1
sinon (x, x1 , . . . , xk ) serait affinement libre et donc k ne serait pas maximal. Il
en est de même de tout x ∈ Aff(C). On a donc Aff(C) = Aff(x1 , . . . , xk ). Or
la direction de Aff(x1 , . . . , xk ) est de dimension k − 1 < n, donc Aff(C) 6= E,
ce qui contredit ii).

Définition 3.1.2 (Dimension d’un convexe). On appelle dimension d’un convexe


C la dimension de Aff(C). C’est aussi le nombre p maximal tel que C contienne
p + 1 points affinement indépendants.

Remarque 3.1.3. La définition ci-dessus est un cas particulier de la Définition


1.3.10.
o
o
Corollaire 3.1.4. Si C = ∅, alors C = ∅.

o
Démonstration : En effet, par la Proposition 3.1.1 si C = ∅, Aff(C) 6= E.
o
Comme C ⊂ Aff(C) = Aff(C), alors, C = ∅, en utilisant à nouveau la Propo-
sition 3.1.1.
3.1. INTÉRIEUR D’UN CONVEXE EN DIMENSION FINIE 41

On va introduire une notion, le cône engendré par un convexe, qui permet


de caractériser d’une façon géométrique l’intérieur d’un convexe en dimension
finie :

Définition 3.1.5 (Cône tangent). Si C est un convexe d’un espace vectoriel


E, et x un point de C, le cône tangent en x au convexe C est le cône de sommet
x engendré par le convexe C ; on le notera TC (x). On a donc :

TC (x) = x + λy / y ∈ C et λ ≥ 0 = x + cone(C − x).

La Proposition suivante suit presque immédiatement dès définitions.

Proposition 3.1.6. Soit C est un convexe d’un espace vectoriel E, et x un


point de C. Les assertions suivantes sont équivalentes :
i) TC (x) = E
ii) cone(C − x) = E
iii) pour tout u ∈ E il existe δ > 0 tel que x + δu ∈ C
iv) Pour toute droite ∆ contenant x l’intersection ∆ ∩ C contient un segment
ouvert contenant x.

Démonstration : L’équvalence i) ⇐⇒ ii) suit de la définition du cône tan-


gent.
S L’équvalence avec iii) suit du fait que, pour un convexe C, cone(C) =
λ>0 λC (Proposition 1.2.7). Finalement, l’équvalence iii) ⇐⇒ iv) suit de la
convexité de C : si ∆ = {x + tu / t ∈ R} est une droite passant par x, l’inter-
section ∆ ∩ C est soit {x}, soit un segment qui contient x dans son intérieur
si et seulement si il contient x + δu et x + δ 0 (−u) pour certains δ, δ 0 > 0.

Définition 3.1.7 (Coeur d’un convexe). Si les conditions de la Proposition


3.1.6 sont réalisées on dit que x appartient au coeur du convexe C.

Proposition 3.1.8. Soit C un convexe d’un EVN. Si l’intérieur de C n’est


pas vide il coïncide avec le coeur de C.

Démonstration : Si x est un point intérieur de C soit B(x, r) une boule de


r u
centre x, de rayon r > 0 incluse dans C. Pour tout u ∈ E le point x +
2 kuk
et dans C, donc x est dans le coeur de C.
Réciproquement, supposons que C admet un point intérieur x0 et soit x est
un point de C non intérieurà C ; alors x n’appartient à aucun segment ouvert
]x0 , y[ avec y ∈ C (d’après le Lemme 2.2.7). Donc x n’est pas dans le coeur de
C.

Proposition 3.1.9. Si C est un convexe d’un espace vectoriel de dimension


finie, son intérieur coïncide avec son coeur.
42 CHAPITRE 3. STRUCTURE DES CONVEXES

Démonstration : Si l’intérieur de C n’est pas vide il coïncide avec son coeur


(Proposition 3.1.8). Si l’intérieur de C est vide alors Aff(C) 6= E (Proposition
3.1.1). Il existe donc un vecteur u n’appartenant pas à la direction du SEA
Aff(C). Pour tout x ∈ C, la droite ∆ passant par x de vecteur directeur u
vérifie ∆ ∩ Aff(C) = {x}. A fortiori ∆ ∩ C = {x} donc x n’est pas dans le
coeur de C : celui-ci est donc vide.

Corollaire 3.1.10. (Caractérisation des points intérieurs d’un convexe en di-


mension finie) Soit C un convexe d’un EVN de dimension finie E et x ∈ C.
Les propriétés suivantes sont équivalentes :

i) x ∈ C
ii) Pour toute droite affine ∆ contenant x, l’intersection ∆ ∩ C contient un
segment ouvert contenant x.
iii) ∀u ∈ E, ∃δ > 0 tel que x + δu et x − δu ∈ C.

Exercice 3.1. Les résultats de cette section sont en général faux en dimension
infinie. Considérons E = c00 (voir Exemple 2.1.42) muni de la norme k · k∞ .

1) Soit C = {(xn ) ∈ c00 / ∀n ∈ N |xn | ≤ n1 }. Montrer que C = ∅ tandis que
Aff(C) = cone(C) = E et alors le coeur de C contient 0.
2) Soi H un hyperplan dense dans E (donné par Example 2.2.15). Montrer
que l’affirmation du Corollaire 3.1.4 n’est pas vraie pour C = H.

3.2 Théorèmes de séparation en dimension finie

Ces théorèmes reposent sur le théorème fondamental des espaces euclidiens de


dimension finie, qui sera généralisé en dimension quelconque dans le chapitre 6 :

Théorème 3.2.1 (Projection métrique dans les espaces euclidiens). Soit C un


convexe fermé non vide d’un espace euclidien de dimension finie et x0 ∈ / C. Il
existe un point unique y0 ∈ C, appelé projection (métrique) de x0 sur C, qui
réalise la distance de x0 à C. La projection de x0 sur C est caractérisée par

∀y ∈ C , hx0 − y0 , y − y0 i ≤ 0 (∗)

Démonstration : Soit r = d(x0 , C) > 0 et B = C ∩ B̄(x0 , 2r). On écrit :

d(x0 , C) = inf ky − x0 k = inf ky − x0 k .


y∈C y∈B

(La deuxième égalité suit de d(x0 , C) = min{d(x0 , B), d(x0 , C \ B)} combinée
avec d(x0 , C \ B) ≥ 2r.) Or B est un fermé borné dans un espace de dimension
finie, il est donc compact. La fonction continue y → ky − x0 k atteint donc son
3.2. THÉORÈMES DE SÉPARATION EN DIMENSION FINIE 43

minimum sur B. Un point y0 où cette fonction atteint son minimum réalise la


distance de x0 à C.
Un tel point y0 vérifie : ∀y ∈ C , kx0 − yk2 ≥ kx0 − y0 k2 , d’où en écrivant
x0 −y = (x0 −y0 )+(y0 −y) et en développant : hx0 −y0 , y−y0 i ≤ 1/2 ky − y0 k2 .
Soit 0 < θ < 1. On applique cette inégalité à yθ = θy + (1 − θ)y0 ∈ C et on
obtient :
θhx0 − y0 , y − y0 i ≤ (1/2)θ2 ky − y0 k2
En divisant par θ et en faisant tendre θ vers 0, on obtient bien la condition (∗).
Réciproquement, si y0 ∈ C vérifie (∗), on a bien :

kx0 − yk2 = kx0 − y0 k2 + 2hx0 − y0 , y0 − yi + ky0 − yk2


≥ kx0 − y0 k2 + ky0 − yk2 ≥ kx0 − y0 k2

et y0 réalise la distance de x0 à C. En plus, la dernière inégalité est stricte


pour y 6= y0 , d’où l’unicité de la projection de x0 sur C.

Les deux théorèmes de séparation qui suivent, séparation d’un point et d’un
convexe fermé et séparation d’un point et d’un convexe ouvert, sont vrais
également en dimension quelconque mais la démonstration présentée ici est
particulière à la dimension finie :
Théorème 3.2.2 (Séparation d’un point et d’un convexe fermé dans un espace
de dimension finie). Si C est un convexe fermé non vide d’un espace E de
dimension finie et x0 un point de E n’appartenant pas à C il existe un hyperplan
affine H séparant strictement x0 de C ; c’est à dire que C et x0 sont inclus
chacun dans un demi-espace ouvert différent défini par H. En particulier C est
inclus dans l’un des demi-espaces affines associés à H.
Démonstration : Soient x0 et C comme dans l’énoncé. La distance

d(x0 , C) = inf{ky − x0 k / y ∈ C}

de x0 à C est strictement positive, puisque x0 6∈ C et C est fermé. Le théorème


de projection sur un convexe fermé d’un espace euclidien, 3.2.1, dit qu’il existe
un unique point y0 de C réalisant cette distance, c’est à dire ky0 − x0 k =
d(x0 , C), caractérisé par les inéquations :

∀y ∈ C, hy − y0 , x0 − y0 i ≤ 0. (†)

Posons f (y) = hy, x0 − y0 i ; la fonction f est une forme linéaire non nulle sur
E. La condition (†) peut être reformulée :

∀y ∈ C, f (y) ≤ f (y0 ).
44 CHAPITRE 3. STRUCTURE DES CONVEXES

Par ailleurs, on a f (x0 ) = f (y0 ) + f (x0 − y0 ) = f (y0 ) + kx0 − y0 )k2 > f (y0 )
Soit H l’hyperplan défini par :

y ∈ H ⇐⇒ f (y) = c,

où c = f (x0 )+f (y0 )


= f x0 +y 0

2 2 . (Notons que H est l’hyperplan médiateur du
segment [x0 , y0 ].) On voit que

f (x0 ) > c et ∀y ∈ C, f (y) < c.

Autrement dit, x0 et C sont inclus dans les demi-espaces ouverts différents


définis par H.
Remarque 3.2.3. (i) Le même argument montre que il existe un hyperplan d’ap-
pui H de C tel que C ⊂ D+ et x0 ∈ D− 0 . En effet, on peut prendre H = f −1 (c0 )
0
avec c = f (y0 ), assurant que y0 ∈ H ∩ C et alors H ∩ C est non-vide.
(ii) Sous les hypothèses du Théorème 3.2.2, il revient au même de dire que si x0
n’appartient pas au convexe fermé C, il existe une forme linéaire f sur E, de la
forme x 7→ hu, xi avec u ∈ E 0 , telle que supx∈C f (x) < f (x0 ). En effet, si l’hy-
perplan H, d’équation f (x) = a, sépare strictement x0 et C, on a par exemple :
∀x ∈ C , f (x) < a et f (x0 ) > a, d’où f (x0 ) > a ≥ supx∈C f (x). Inversement,
s’il existe une forme linéaire f sur E, non nulle avec f (x0 ) > supx∈C f (x), on
1 
pose a = f (x0 ) + sup f (x) et alors f (x0 ) > a et supx∈C f (x) < a.
2 x∈C

Théorème 3.2.4 (Séparation d’un point et d’un convexe ouvert en dimension


finie). Soit E espace de dimension finie, C un convexe ouvert de E. Par tout
point x0 n’appartenant pas à C il passe un hyperplan disjoint de C.
S
Démonstration : On peut supposer x0 = 0. Soit Γ = λC , c’est un
λ>0
cône convexe ; il est ouvert comme réunion des convexes ouverts λC pour λ >
0 et ne contient pas 0 puisque C 63 0 ; autrement dit Γ = cone(C) \ {0}
(voir Proposition 1.2.7). En particulier Γ 6= E, donc son adhérence Γ est aussi
distincte de E, car Γ a même intérieur que Γ, c’est à dire Γ. Soit y0 un point
de E n’appartenant pas à Γ, le théorème de séparation d’un point et d’un
convexe fermé, Théorème 3.2.2 donne l’existence d’une forme linéaire f telle
que f (y0 ) < inf f (z). Si z ∈ Γ, il en est de même de tz pour tout t > 0, donc
z∈Γ
f (y0 ) < f (tz) = tf (z) pour tous t > 0, z ∈ Γ. En divisant les deux membres
par t et faisant t → +∞, on obtient 0 ≤ f (z) pour tout z ∈ Γ. Donc Γ est
inclus dans le demi-espace fermé D = {x / f (x) ≥ 0} défini par l’hyperplan
H = Ker f qui passe bien par 0. Comme Γ est ouvert il est en fait inclus dans
l’intérieur de D, c’est-à-dire le demi-espace ouvert {x / f (x) > 0}. Il en est a
fortiori de même pour C.
3.2. THÉORÈMES DE SÉPARATION EN DIMENSION FINIE 45

Corollaire 3.2.5. Soit C un convexe d’intérieur non vide. Par tout point x0
o
non intérieur à C il passe un hyperplan affine H disjoint de C. De plus l’un
des demi-espaces fermés associés à H contient C.
o
Démonstration : On applique le théorème précédent à C. On trouve un
o
hyperplan H contenant C, tel que l’un des demi-espaces ouverts associés à H
o o
contienne C. Le demi-espace fermé correspondant contient l’adhérence de C,
qui coïncide avec celle de C par la Proposition 2.2.8, donc contient C.
Remarque 3.2.6. Sous les hypothèses du Théorème 3.2.4, il revient au même de
dire qu’il existe une forme linéaire non nulle f sur E, de la forme x 7→ hu, xi,
avec u ∈ E 0 , telle que supx∈C f (x) ≤ f (x0 ).

De ces deux théorèmes de séparation, on déduit ce qu’on appelle habituellement


les théorèmes de Hahn-Banach :

Corollaire 3.2.7 (Théorème de Hahn-Banach géométrique dans les espaces


de dimension finie #1). Soient C1 et C2 deux convexes non vides et disjoints
de l’espace vectoriel normé E. On suppose que C1 est ouvert. Il existe alors un
hyperplan affine H séparant strictement C1 de C2 . Plus précisément il existe
une forme linéaire f sur E et un réel a tels que ∀x1 ∈ C1 , ∀x2 ∈ C2 , f (x1 ) <
a ≤ f (x2 ).

Démonstration : On applique le Théorème 3.2.4 au point 0 S et au convexe


non vide C1 − C2 = {y − z / y ∈ C1 , z ∈ C2 }. En effet C1 − C2 = z∈C2 (C1 − z)
est ouvert comme réunion des ouverts C1 − z, translatés de C1 . D’où il existe f
forme linéaire telle que ∀y ∈ C1 , z ∈ C2 , f (y − z) < f (0) = 0 ; on en déduit, en
notant a = inf f (z) que ∀x1 ∈ C1 , ∀x2 ∈ C2 , f (x1 ) ≤ a ≤ f (x2 ). La première
z∈C2
inéquation signifie que C1 est inclus dans le demi-espace f (x) ≤ a ; comme C1
est ouvert, il est en fait inclus dans l’intérieur du demi-espace, c’est à dire le
demi-espace ouvert f (x) < a.

Corollaire 3.2.8 (Théorème de Hahn-Banach géométrique en dimension finie


#2). Soit C un convexe d’intérieur non vide de l’espace vectoriel normé E.
Tout sous-espace affine M disjoint de C est inclus dans un hyperplan affine H
o
disjoint de C et tel que C soit inclus dans l’un des demi-espaces limités par H.
o
Démonstration : Le convexe C − M = {x − y / x ∈ C, y ∈ M } est ouvert,
non vide et ne contient pas le point 0. Il existe donc d’après le Théorème 3.2.4
o
une forme linéaire f telle que f (x − y) > f (0) = 0 pour tout x ∈ C, y ∈ M .
Alors la forme linéaire f est constante sur M : en effet, supposons qu’elle prend
46 CHAPITRE 3. STRUCTURE DES CONVEXES

des valeurs distinctes en deux points y1 , y2 ∈ M et soit y(t) = y1 + t(y2 −y1 )
une paramétrisation de cette droite. Alors f y(t) = f (y1 )+t f (y2 )−f (y1 ) et
la restriction de f à la droite y1 y2 prend toutes les valeurs réelles, donc ne peut
être majorée par f (x) pour un x ∈ C. La forme linéaire f est donc bien égale à
une constante a sur M . On a donc M ⊂ H = {y / f (y) = a} qui est l’hyperplan
affine recherché : en effet, comme le demi espace fermé {y / f (y) ≥ a} contient
o o
C, il contient C qui coïncide avec C d’après la Proposition 2.2.8, donc ce demi
espace contient aussi C.
Corollaire 3.2.9. Soit C un convexe fermé de l’espace vectoriel normé E et et
K ⊂ E un convexe compact vérifiant K ∩ C = ∅. Alors, il existe un hyperplan
H qui sépare strictement C et K.
Démonstration : La fonction x → d(x, C) est continue et strictement po-
sitive sur K puisque C est fermé. Comme K est compact, elle atteint son
minimum m > 0 en un point x ∈ K. L’ensemble K 0 = {x ∈ E/ d(x, K) < m}
est un convexe ouvert contenant K et disjoint de C. On peut donc, par le
Corollaire 3.2.7, séparer strictement K 0 et C, donc aussi K et C.
Corollaire 3.2.10 (Théorème de Hahn-Banach dans les espaces de dimension
finie #3). Soit E un EVN et F ⊂ E un SEV. Soit f ∈ F 0 , le dual de F . Alors,
il existe f˜ ∈ E 0 qui est une prolongement de f (c’est-à-dire, f˜(x) = f (x) si
x ∈ F ) et telle que kf˜kE 0 = kf kF 0 .
Démonstration : On utilise le lemme suivant (Exercice !).
Lemme 3.2.11. Soit X un EVN, B = B(0, 1) la boule unité ouverte de X, et
soit f ∈ X 0 , f 6= 0. Alors f (B) = ] − c, c[, où c = kf k.
Pour le Corollaire, on peut supposer que c = kf k > 0. Posons M = f −1 (c),
alors M est un hyperplan (fermé) dans F . Par Lemme 3.2.11, M ∩BF (0, 1) = ∅
et – étant donné que M ⊂ F , il suit que M ∩ BE (0, 1) = ∅. Par Corollaire
3.2.8, il existe un hyperplan H de E tel que H ⊃ M et H ∩ BE (0, 1) = ∅.
Comme dans la démonstration de la Proposition 1.3.14, il existe une forme
lineaire f˜ telle que H = f˜−1 (c). Cette forme vérifie f˜(x) = f (x) si x ∈ M et
si x = 0, alors ”egalement pour tout x ∈ Aff(M ∪ {0}) = f . Autrement dit,
f˜ qui est une
 prolongement de f . Par ailleurs, H ∩ BE (0, 1) = ∅ montre que
f˜ BE (0, 1) ⊂] − c, c[ et alors il suit du Lemme 3.2.11 que kf˜k ≤ c = kf k.
L’inégalité inverse étant évidente, le Corollaire suit.

3.3 Autres théorèmes de séparation en dimension finie

Dans cette partie, on va montrer des théorèmes de séparation qui n’ont pas
d’analogue en dimension quelconque. On utilise des notions, le cône engendré
3.3. AUTRES THÉORÈMES DE SÉPARATION 47

par un convexe et l’intérieur relatif d’un convexe qui n’ont d’intérêt qu’en
dimension finie et qui sont essentielles pour ces théorèmes de séparation.

Définition 3.3.1 (Intérieur relatif d’un convexe de dimension finie). Soit C


un convexe non vide d’un espace vectoriel de dimension finie E. On appelle
intérieur relatif de C, et on note ri(C) l’intérieur de C relatif au sous-espace
affine Aff(C).

Un point x de C est donc relativement intérieur


 à C s’il existe r > 0 tel que
la boule B(x, r) vérifie B(x, r) ∩ Aff(C) ⊂ C.
Remarque 3.3.2. Cette notion d’intérieur relatif ne dépend pas de la norme
considérée sur l’espace de dimension finie E.
Grâce à cette notion d’intérieur relatif, on peut préciser la Proposition 2.2.8
dans les espaces de dimension finie :

Proposition 3.3.3. Si C est un convexe non vide de dimension finie, son


intérieur relatif ri(C) est aussi non vide. De plus, C = ri(C) et ri(C) = ri(C).

Démonstration : Soit C un convexe non vide de E. Par translation on se


ramène au cas où 0 ∈ Aff(C). Alors on peut considérer E1 = Aff(C) comme
un espace vectoriel normé (par la restriction de la norme de E), et C comme
un convexe de E1 tel que Aff(C) = E1 . L’intérieur de C relatif à E1 est donc
non vide (Proposition 3.1.1 ) et c’est exactement ri(C).
De plus, C et ri(C) ont même adhérence dans E1 , d’après la Proposition 2.2.8 ;
mais l’adhérence d’une partie A de E1 est la même dans E et E1 car E1 est
fermé. De même, puisque E1 est fermé, C est dans E1 et l’intérieur de C et de
C relativement à E1 coïncident d’après la proposition 2.2.8, ce qui veut bien
dire que ces deux convexes ont même intérieur relatif dans E.

Corollaire 3.3.4. (Caractérisation des points relativement intérieurs d’un


convexe) Soit C un convexe de dimension finie et x ∈ C. Les propriétés sui-
vantes sont équivalentes :
i) x ∈ ri(C)
ii) pour toute droite ∆ incluse dans Aff(C) et contenant x, l’intersection ∆∩C
contient un segment ouvert contenant x.
iii) pour tout point y de D, avec y 6= x, il existe z ∈ C tel que x ∈ [y, z[.
iv) Le cône tangent TC (x) est un sous-espace affine de E (on a alors TC (x) =
Aff(C)).

Démonstration : i) ⇐⇒ ii) résulte de la définition de l’intérieur relatif


car (ii) signifie que x est dans le coeur du convexe C relatif à Aff(C).
(ii) ⇒ (iii) est trivial.
48 CHAPITRE 3. STRUCTURE DES CONVEXES

(iii) ⇒ (iv) : on se ramène par translation au cas où x = 0. Il suffit de montrer


que TC (0) est symétrique (un cône symétrique est un SEV). Si u ∈ TC (0),
u 6= 0, il existe y ∈ C, y 6= 0 et λ > 0 tels que u = λy. Soit z ∈ C tel que
0 ∈]y, z[ (hypothèse (iii)). on a z = −ρy pour un certain ρ > 0. Alors −u = λρ z,
donc −u ∈ TC (0).
(iv) ⇒ (ii) : Si TC (x) est un SEA alors TC (x) ⊃ Aff(C) puisque par définition
TC (x) contient C et Aff(C) est le plus petit SEA contenant C.
Inversement Aff(C) est lui-même un cône de sommet x contenant C, donc
contient TC (x). Donc Aff(C) = TC (x). Toute demi-droite de Aff(C) contenant
x est donc incluse dans TC (x) : elle passe donc par un point y ∈ C, y 6= x. Donc
toute droite de Aff(C) contenant x passe par deux points y, z ∈ C, distincts de
x (un sur chacune des deux demi-droites correspondantes). Alors x ∈]y, z[.

Grâce à cette notion, on peut obtenir d’autres théorèmes de séparation, valables


uniquement en dimension finie et qui sont susceptibles de repondre à des cas
de figure particuliers non couverts par les théorèmes de séparation précédents.
Théorème 3.3.5. Si C est un convexe non vide d’un espace E de dimension
finie et x0 un point de E n’appartenant pas à ri(C), il existe un hyperplan affine
H de E, contenant x0 et disjoint de ri(C). De plus C est inclus dans l’un des
demi-espaces affines associés à H.
Démonstration : Si x0 6∈ Aff(C), La remarque 3.2.3(ii) appliqué à x0 et
au convexe fermé Aff(C) implique l’existence d’une forme linéaire f telle que
supx∈Aff(C) f (x) < f (x0 ). Alors, H = {x ∈ E/ f (x) = f (x0 )} contient x0 et
est disjoint de Aff(C), a fortiori de ri(C).
Si x0 ∈ Aff(C), on peut par translation supposer que Aff(C) est un sous-
espace vectoriel fermé V de E. Appliquant le Théorème 3.2.4 ci-dessus au
convexe C considéré dans l’espace vectoriel V , on voit qu’il existe un hyperplan
M de l’espace V contenant x0 et disjoint de ri(C). La preuve du Théorème
3.2.4 montre en fait l’existence d’un vecteur u ∈ V tel que ri(C) soit inclus
dans le demi-espace ouvert (relatif à V ) {y ∈ V / hu, yi < hu, x0 i} ; donc
aussi dans le demi-espace ouvert (relatif à E) {y ∈ E / hu, yi < hu, x0 i}.
L’hyperplan affine de E défini par H = {y ∈ E / hu, yi = hu, x0 i} contient
donc x0 et est disjoint de ri(C). Comme C ⊂ ri(C) = C (Proposition 3.3.3), il
est inclus dans l’adhérence du demi-espace ouvert, c’est-à-dire le demi-espace
fermé {y ∈ E / hu, yi ≤ hu, x0 i}.

3.4 Application aux hyperplans d’appui

Corollaire 3.4.1. Par tout point non intérieur d’un convexe de E il passe un
hyperplan d’appui.
3.5. STRUCTURE DES CONVEXES COMPACTS 49

Démonstration : Si le convexe C est d’intérieur non vide c’est une consé-


o
quence directe du Théorème 3.2.4 puisque C = ri(C). Si C est d’intérieur vide,
Aff(C) est un sous-espace affine de E, différent de E. Il est donc inclus dans
un hyperplan affine H ; celui-ci contient C, donc est bien un hyperplan d’appui
de C.
Corollaire 3.4.2. Tout convexe fermé C de dimension finie distinct de l’espace
entier est intersection des demi-espaces fermés qui le contiennent et qui sont
associés à des hyperplans d’appui.
Démonstration : Soit C1 l’intersection des demi-espaces fermés contenant
C associés à des hyperplans d’appui. Alors, C ⊂ C1 . Il suffit donc de montrer
l’autre inclusion, c’est-à-dire que x0 6∈ C =⇒ x0 6∈ C1 .
Soit x0 6∈ C. Par Remarque 3.2.3(i), il existe un demi-espace D+ ⊃ C associé
à un hyperplan d’appui de C tel que x0 ∈ D− 0 . Il suit que C ⊂ D et – étant
1 +
0
donné que D− ∩ D+ = ∅ – que x0 6∈ C1 .
Proposition 3.4.3. Soit K est un convexe compact d’un espace vectoriel de
dimension finie E. Pour tout hyperplan vectoriel V de E il existe un hyperplan
d’appui de K parallèle à V .
Démonstration : Tout hyperplan vectoriel V a pour équation f (x) = 0,
où f est une linéaire non nulle. Cette forme linéaire est évidemment continue,
elle atteint donc son maximum M et son minimum m sur K. Les hyperplans
d’équation f (x) = m et f (x) = M rencontrent donc K. Comme K est inclus
dans les demi-espaces f (x) ≥ m et f (x) ≤ M , ces hyperplans sont bien des
sont des hyperplans d’appui de K, de direction V .
Remarque 3.4.4. En fait on voit que soit K est inclus dans un hyperplan paral-
lèle à V , soit il est inclus dans une bande définie par deux hyperplans d’appui
parallèles à V .

Dans le cas où K est un convexe compact, la démonstration du fait que K


est l’intersection des demi-espaces le contenant déterminés par ses hyperplans
d’appui est plus simple que celle du cas général : on remarque que si x0 ∈ E
est un point n’appartenant pas à K, il existe d’après la Proposition 3.2.2 une
forme linéaire continue f telle que M := supx∈K f (x) < f (x0 ). Le demi-espace
f (x) ≤ M contient K mais non x0 . Par suite, l’hyperplan {x ∈ E/ f (x) = M }
est un hyperplan d’appui pour K.

3.5 Structure des convexes compacts de dimension finie

Le théorème qui suit est la version finie-dimensionnelle d’un théorème de Krein


et Milman.
50 CHAPITRE 3. STRUCTURE DES CONVEXES

Théorème 3.5.1 (Krein-Milman en dimension finie). Tout convexe compact


K de dimension finie est l’enveloppe convexe de ses points extrémaux.
Démonstration : L’inclusion conv(ExtK) ⊂ K est vraie pour tout convexe
(même non-compact).
Pour l’autre inclusion, on raisonne par récurrence sur la dimension de l’espace
vectoriel. Si dim E = 0, c’est trivial. Soit n > 0, et supposons le théorème
démontré pour dim E < n. Soit K un convexe compact de E de dimension n.
o
On peut supposer Aff(K) = E sinon on remplace E par Aff(K). Alors K = 6 ∅
(Proposition 3.1.1). Soit x ∈ K, il s’agit de montrer que x ∈ conv(Ext K) :
o
• Si x ∈ K \ K, il existe un hyperplan d’appui H contenant x (Théorème
3.2.4), et on a H ∩ K 6= ∅. Mais alors F = H ∩ K est une face de K, de
sorte que Ext F ⊂ Ext K. D’autre part Aff(F ) ⊂ H est un SEA de dimension
strictement inférieure à n, par conséquent l’hypothèse de récurrence s’applique
à F . On a donc x ∈ conv(Ext F ) ⊂ conv(Ext K).
o
• Si au contraire x ∈ K, soit D une droite affine quelconque contenant x.
Alors D ∩ K est un convexe compact de D, c’est à dire un segment [x1 , x2 ].
o
Les points x1 , x2 ne sont pas dans K, et donc d’après ce qui précède, ils sont
dans conv(Ext K). Alors x ∈ conv(x1 , x2 ) ⊂ conv(Ext K).
Corollaire 3.5.2. Soit K un convexe compact d’un espace vectoriel de dimen-
sion finie, et f : K → R ∪ {∞} une fonction convexe. On a
sup f (x) = sup f (x)
x∈K x∈Ext K

En particulier si la fonction f est continue, elle atteint son maximum en un


point de Ext K.
Démonstration : Soit M = supx∈Ext K f (x) ∈ R. Si x ∈ conv(Ext K), cet
élément est combinaison Pn convexe d’une famille P finie de points xi ∈ Ext K,
i = 1, . . . , n : soit x = i=1 λi xi , avec λi > 0 et ni=1 λi = 1. D’où
n
X n
X
f (x) ≤ λi f (xi ) ≤ M λi = M
i=1 i=1

L’ensemble {x ∈ K / f (x) ≤ M } contient donc conv(Ext K) = K. Donc M


est aussi le sup de f sur K.
Par ailleurs, si f est continue, elle atteint son maximum M ∈ R sur le compact
K en un point y. Etant donné que y est une combinaison convexe d’une famille
finie de points xi ∈ Ext K, le même argument montre que maxi f (xi ) ≥ M
et alors supx∈Ext K f (x) ≥ M . Il suit que supx∈Ext K f (x) = M et le sup est
atteint.
3.5. STRUCTURE DES CONVEXES COMPACTS 51

Remarque 3.5.3. 1) Ce résultat est souvent utilisé sous la forme suivante :


pour majorer la fonction f sur K, il suffit de la majorer sur Ext K ou Ext K.
2) Même si K est un convexe compact, Ext K n’est pas forcément fermé.
Pour voir 2), on peut considérer dans R3 l’enveloppe convexe K des points
A = (0, 0, 1), B = (0, 0, −1) et du cercle C d’équations : z = 0, x2 +y 2 −2x = 0.
Tous les points du cercle C sont extémaux dans  K sauf le point (0, 0, 0). Plus
précisément, on a Ext K = {A, B} ∪ C \ {0} qui n’est pas fermé.
Pour préciser le théorème de structure précédent, on utilise le théorème de
Carathéodory :

Proposition 3.5.4 (Théorème de Carathéodory). Soit E un espace vectoriel


de dimension finie p, et A un sous-ensemble de E.
i) Tout point du cône convexe engendré par A est combinaison linéaire à
coefficients positifs d’au plus p éléments de A.
ii) Tout point de l’enveloppe convexe de A est combinaison convexe d’au plus
p + 1 éléments de A.
Pn
Démonstration : i) Soit x = i=1 λi xi , avec xi ∈ A, λi ≥ 0. On veut
montrer, par récurrence sur n, qu’ilP existe I ⊂ {1, . . . , n}, avec card(I) ≤ p
et des nombres µi ≥ 0, tels que µi xi = x. C’est clair si n ≤ p. Supposons
i∈I
n ≥ p + 1. En plus, on peut supposer que λi > 0 pour tout i (sinon, on
peut écarter le terme correspondant et appliquer l’hypothèse de récurrence).
La famille (xi )1≤i≤n estP
nécessairement liée, il existe donc des réels (α1 , . . . , αn )
non tous nuls tels que ni=1 αi xi = 0. Pour tout τ ∈ R, on a alors :
n
X
x= (λi − τ αi )xi
i=1

On peut toujours supposer que {i / αi > 0} = 6 ∅, quitte à changer le signe de


tous les αi . Soit τ = min{ αλii / αi > 0}. On a λi ≥ τ αi si αi > 0, par définition
λ
de τ , avec l’égalité pour i = i0 , où τ = αii0 . Par ailleurs, on a τ > 0 et alors
0
λi > 0 ≥ τ αi si αi ≤ 0. L’élément x est donc une combinaison linéaire des
n − 1 éléments xi , i 6= i0 , à coefficients λi − τ αi (positifs ou nuls d’après ce qui
précède), et on applique l’hypothèse de récurrence.

ii) Dans l’espace vectoriel augmenté Ê = E ⊕ R, on considère l’ensemble  =


A × {1}. Il est clair que conv(Â) = conv(A) × {1}. Si (x, 1) ∈ conv(Â), on a
fortiori (x, 1) ∈ cone(Â), par conséquent il existe, d’après le (i) ci-dessus, p + 1
points (ai , 1) dans  dont (x, 1) soit combinaison linéaire à coefficients positifs
52 CHAPITRE 3. STRUCTURE DES CONVEXES

(αi ). Par conséquent : 


p+1
X

x= αi ai





i=1
 p+1
X

1= αi



i=1
c’est à dire que x est en fait combinaison convexe des (p + 1) points ai de
A.
Corollaire 3.5.5. Dans un espace de dimension finie p, tout point d’un convexe
compact est combinaison convexe d’au plus p + 1 points extrémaux du convexe.
Une autre conséquence du théorème de Carathéodory est relative à l’enve-
loppe convexe d’un ensemble compact, ce résultat a été annoncé au chapitre
1, Remarque 2.2.5 :
Proposition 3.5.6. Dans un espace vectoriel de dimension finie, l’enveloppe
convexe de tout compact est encore compacte.
Démonstration : Soit p la dimension Pp de E, K un compact de E ; posons
p
Tp = {(λ1 , . . . , λp ) ∈ [0, 1] / i=1 λi = 1} : Tp est un compact (car fermé
dans [0, 1]p ). Soit h l’application continue
p+1
X
Tp+1 × K p+1 → E, (λ1 , . . . , λp+1 , x1 , . . . , xp+1 ) 7→ λi xi .
i=1

On a conv(K) = h(Tp+1 × K p+1 ) d’après le théorème de Carathéodory, donc


conv(K) est compacte en tant qu’image d’un compact par une application
continue.

Rappelons que l’on a vu au chapitre 2 que ce résulat est faux en dimension


quelconque.

3.6 Structure des cônes convexes fermés de dimension finie

Définition 3.6.1 (Cône convexe saillant). Un cône convexe Γ est dit saillant
si Γ ∩ (−Γ) ⊂ {0}.
Remarque 3.6.2. (i) Il revient au même de dire qu’un cône convexe Γ est saillant
ou que Γ \ {0} est encore un cône convexe, ou encore que Γ ne contient aucune
droite vectorielle.
(ii) Rappelons (voir 1.2.4) la définition N (Γ) = {0} ∪ (Γ ∩ (−Γ)). Alors Γ est
saillant si et seulement si N (Γ) = {0}.
3.6. STRUCTURE DES CÔNES CONVEXES FERMÉS 53

Proposition 3.6.3 (Décomposition des cônes convexes fermés de dimension


finie). Tout cône convexe Γ contenant 0 d’un espace de dimension finie admet
une décomposition de la forme :

Γ = N (Γ) + Γ0

où Γ0 est un cône convexe saillant inclus dans un supplémentaire de N (Γ). De


plus, si Γ est fermé, Γ0 l’est aussi.
Démonstration : Etant donné que 0 ∈ Γ, N (Γ) = Γ ∩ (−Γ) et N (Γ) est le
plus grand sous-espace vectoriel inclus dans Γ. Soit W un supplémentaire de
N (Γ). On pose Γ0 = Γ ∩ W . Il est clair que N (Γ) + Γ0 ⊂ Γ.
Réciproquement tout élément x de Γ se décompose selon x = v + y, avec
v ∈ N (Γ) et y ∈ W ; alors y = x − v ∈ Γ car −v ∈ Γ, et donc y ∈ Γ0 . Donc
Γ = N (Γ) + Γ0 . Le cône Γ0 ne peut contenir de droite vectorielle sinon elle
serait incluse dans N (Γ) ; il est donc saillant.
Comme Γ0 = W ∩ Γ et que W est fermé, il est clair que si Γ est fermé, Γ0 l’est
aussi.
Remarque 3.6.4. 1) Par construction, Γ0 est la projection de Γ sur W , paral-
lèlement à N (Γ).
2) Réciproquement si Γ = V + Γ0 où V est un sous-espace vectoriel de E,
et Γ0 un cône convexe saillant inclus dans un supplémentaire W de V , alors
V = N (Γ).
Démonstration : 2) En effet la projection de N (Γ) sur W parallèlement
à V est un sous-espace vectoriel inclus dans Γ0 , donc est réduit à {0} ; d’où
N (Γ) ⊂ V , et l’inclusion inverse est claire.
Corollaire 3.6.5. Le cône convexe cone(u1 , . . . , us ) engendré par un ensemble
fini de points est fermé.
Démonstration : Soit Γ = cone(u1 , . . . , us ), et considérons une décomposi-
tion Γ = N (Γ)+Γ0 donnée par la Proposition 3.6.3 Comme Γ0 est la projection
de Γ sur un supplémentaire W de N (Γ), on a Γ0 = cone(y1 , . . . , ys ), où les yi
sont les projections des ui .
Montrons que Γ0 est fermé. On peut supposer les yi non nuls pour i ≤ k, et nuls
pour k < i ≤ s. Alors Γ0 = cone(y1 , . . . , yk ). Le convexe K = conv(y1 , . . . , yk )
est compact, et ne contient pas 0 : en effet, {y1 , . . . , yk } ⊂ Γ0 \ {0}, qui est
encore convexe car Γ0 est saillant. La distance δ = d(0, K) est donc strictement
positive. Soit (zn ) une suite dans Γ0 convergeant vers le point z ∈ E. On peut
écrire zn = λn xn , avec λn ≥ 0 et xn ∈ K. Alors la suite (λn ) est bornée car
kzn k supn kzn k
λn = ≤ (notons que (zn ) est convergente et donc bornée).
kxn k δ
54 CHAPITRE 3. STRUCTURE DES CONVEXES

Quitte à passer à une sous-suite, on peut suppososer λn → λ ∈ R+ et xn →


x ∈ K. Alors zn → z ∈ Γ0 , qui est donc bien fermé.
Comme N (Γ) est fermé et Γ0 est inclus dans le supplémentaire W de N (Γ), la
somme Γ = N (Γ) + Γ0 est fermée : si une suite de Γ converge dans E, les suites
projetées sur N (Γ) et W convergent, et leurs limites sont nécessairement dans
N (Γ) et W respectivement.
Remarque 3.6.6. En revanche, même en dimension finie, le fait que A soit
compact n’entraîne pas que cone(A) soit fermé. Soit par exemple dans E = R2
un disque fermé D centré sur l’axe 0x, et tangent à l’axe 0y. Alors cone(D) est
le demi-plan ouvert {(x, y) / x > 0, y ∈ R}, auquel on rajoute le point 0.

Le seul point extrémal d’un cône convexe fermé saillant est son sommet. Un
théorème de structure ne peut donc être obtenu à partir des points extrémaux,
il faut faire intervenir des faces particulières, de dimension un, les génératrices
extrémales.

Notation 3.6.7. Si u est un vecteur non nul, notons γu la demi-droite {λu / λ ∈


R, λ ≥ 0} issue de 0, de vecteur directeur u.

Définition 3.6.8 (Génératrices extrémales). Une direction du cône convexe


pointé Γ est une demi-droite γu , avec u ∈ Γ, u 6= 0. Une direction γ du cône
est dite extrémale si c’est une face de Γ. Une direction extrémale de Γ est
aussi appelée génératrice extrémale de Γ. On notera Gext(Γ) l’ensemble des
génératrices extrémales de Γ.

On voit donc que u ∈ Γ, u 6= 0 définit une génératrice extrémale si et seulement


si

x, y ∈ Γ, u = x + y =⇒ ∃λ1 , λ2 ≥ 0 tels que x = λ1 u, y = λ2 u.

Remarque 3.6.9. Posons pour tout u 6= 0, γu∗ = γu \ {0}. La direction γu est


une génératrice extrémale du cône convexe Γ si et seulement si u ∈ Γ, et pour
tous v, w ∈ Γ tels que γu∗ ⊂ γv∗ + γw
∗ on a γ = γ = γ .
u v w

Proposition 3.6.10. Un cône convexe non saillant n’admet aucune généra-


trice extrémale.

Démonstration : En effet si Γ est non saillant, il existe u ∈ Γ ∩ (−Γ),


u 6= 0, alors pour tout x ∈ Γ et tout α > 0, les vecteurs x ± αu appartiennent
à Γ. Si x définit une direction extrémale, ces vecteurs doivent appartenir à la
demi-droite vectorielle R+ x, pour tout α > 0. Il en résulte que ±u ∈ R+ x, ce
qui est impossible.
3.6. STRUCTURE DES CÔNES CONVEXES FERMÉS 55

On peut maintenant énoncer la version cône du théorème de Krein-Milman (en


dimension finie) :

Théorème 3.6.11 (Krein-Milman pour les cônes en dimension finie). Dans


un espace de dimension finie, tout cône convexe fermé saillant est l’enveloppe
convexe de ses génératrices extrémales. Plus précisément tout point du cône est
dans l’enveloppe convexe d’au plus p = dim E génératrices extrémales.

Pour démontrer ce théorème, on a besoin de deux lemmes. Le premier lemme


permet de ramener l’étude des cônes convexes fermés saillants à celle des
convexes compacts :

Lemme 3.6.12. Soit Γ un cône convexe fermé saillant d’un espace de dimen-
sion finie. Il existe un hyperplan affine H, ne contenant pas 0, dont l’intersec-
tion avec Γ soit un convexe compact K. De plus Γ est le cône convexe engendré
par K.

Démonstration : Soit SE = {x ∈ E/ kxk = 1} la sphère unité de E . Alors


A = SE ∩ Γ est un compact de E car c’est un fermé borné. Il résulte de la
Proposition 3.5.6 que L = conv(A) est aussi compact. De plus on a L 63 0 : en
effet A est inclus dans Γ \ {0} qui est convexe puisque Γ est saillant, de sorte
que l’on a aussi L ⊂ (Γ \ {0}).
On peut alors séparer strictement le point 0 du convexe fermé L, et par consé-
quent trouver une forme linéaire f sur E telle que :

inf f (x) > f (0) = 0


x∈L

On peut supposer que inf x∈L f (x) = 1. (On posera H = {x ∈ E / f (x) = 1}).
A fortiori inf x∈A f (x) ≥ 1, ce qui entraîne par homogénéité que ∀x ∈ Γ, kxk ≤
f (x). Alors le fermé K = {x ∈ Γ/ f (x) = 1} est inclus dans la boule unité de
E, donc est compact.
x
Si x ∈ Γ, x 6= 0 on a f (x) ≥ kxk > 0, donc y = est bien défini, et
f (x)
appartient clairement à H ∩ Γ = K. Comme x = f (x)y pour tout x ∈ Γ,
x 6= 0, on a bien Γ = cone(K).

Lemme 3.6.13. Soit C un convexe d’un hyperplan ne contenant pas 0, et


Γ = cone(C). La bijection naturelle γ → γ ∩ H entre les directions de Γ et les
points de C fait correspondre les génératrices extrémales de Γ avec les points
extrémaux de C.

Démonstration : Soit f (x) = 1 une équation de H. Si γx est une génératrice


extrémale, donc une face, de Γ, il est trivial que x ∈ Ext C.
56 CHAPITRE 3. STRUCTURE DES CONVEXES

Réciproquement, si x est un point extrémal de C et x = x1 + x2 , x1 , x2 ∈


x1
Γ \ {0}, on a 1 = f (x) = f (x1 ) + f (x2 ), de sorte que, en posant y1 = et
f (x1 )
x2
y2 = on peut écrire x = f (x1 )y1 + ϕ(x2 )y2 et x est donc le barycentre à
f (x2 )
coefficients non nuls des points y1 et y2 . Ceci entraîne y1 = x = y2 , donc x1 , x2
appartiennent à la direction γx , qui est donc extrémale.
On peut passer à la démonstration du Théorème 3.6.11 :
Démonstration : (Théorème 3.6.11) Soit K comme dans le Lemme 3.6.12.
On a K = conv(Ext K) d’après le théorème de Krein-Milman (Théorème
3.5.1), d’où
[
Γ = R+ K = conv{R+ x/ x ∈ Ext K} = conv( γ)
γ∈Gext(Γ)

3.7 Convexes fermés de dimension finie : le cas général

Si C est un convexe de l’espace vectoriel (de dimension finie) E, on considère


dans l’espace vectoriel augmenté Eb = E × R le convexe C b = C × {1} (obtenu
par translation à partir du convexe C = C × {0}), et le cône convexe Γ(C) =
b =S
cone(C) λ≥0 λC. C’est évidemment un cône convexe saillant puisque Γ(C)\
b
{0} est inclus dans le demi-espace ouvert E×]0, +∞[ et Γ(C) ∩ (E × {0}) = 0
de sorte que Γ(C)∩−Γ(C) = 0. Toutefois Γ(C) n’est pas nécessairement fermé,
même si C l’est, comme le montre le lemme suivant :

Lemme 3.7.1. Le cône Γ(C) est fermé si et seulement si C est compact.

Démonstration : a) Supposons que C est compact. Soit (un ) une suite dans
Γ(C) qui converge vers un point u de E. b On a un = (λn xn , λn ), avec λn ≥ 0 et
xn ∈ C. Alors (λn ) converge vers un réel λ ≥ 0 (la seconde composante de u) ;
par compacité de C, on peut (quitte à extraire une sous-suite) supposer que
(xn ) converge vers x ∈ C. Alors u = (λx, λ), donc appartient à Γ(C), qui est
donc fermé.
b) Réciproquement supposons Γ(C) fermé. Alors C b = Γ(C) ∩ (E × {1}) est
fermé, et donc C également. Si C n’est pas compact, c’est qu’il n’est pas
borné, c’est à dire qu’il existe une suite (xn ) ⊂ C, avec kxn k → ∞. La suite
(xn / kxn k , 1/ kxn k) est bornée et incluse dans Γ(C). Quitte à extraire, on
peut supposer qu’elle converge vers un point (u, 0), appartenant lui aussi à
Γ(C) (puisque ce cône est fermé) et tel que kuk = 1. C’est impossible car
Γ(C) ∩ (E × {0}) = {0}.
3.7. CONVEXES FERMÉS GÉNÉRAUX DE DIMENSION FINIE 57

Dans le cas où C n’est pas compact, on s’intéresse donc à l’adhérence Γ(C) :

Définition 3.7.2 (Cône asymptotique). On appelle cône asymptotique du


convexe C le cône convexe fermé Cas tel que Γ(C) ∩ (E × {0}) = Cas × {0}.

Autrement dit, le plongement naturel de E dans E ×R défini par x → (x, 0) fait


apparaître le cône asymptotique Cas comme la trace de Γ(C) sur l’hyperplan
E × {0} identifié à E.

Proposition 3.7.3. Si C est un cône convexe fermé, on a Γ(C) = Γ(C) ∪


(Cas × {0}).

Démonstration : Il s’agit de montrer que les points de Γ(C) qui ne sont


pas dans Γ(C) sont nécessairement dans E × {0} et par suite dans Cas × {0}.
Si donc (y, λ) est un point de Γ(C), avec λ > 0, soit (λn xn , λn ) (xn ∈ C,
λn ≥ 0) une suite de points de Γ(C) convergeant vers (y, λ). Alors le point
y
x = = lim xn appartient à C, d’où (y, λ) = (λx, λ) appartient à Γ(C).
λ n

Proposition 3.7.4. Soit C un convexe fermé. Les conditions suivantes sont


équivalentes :
i) u appartient au cône asymptotique de C ;
ii) Il existe une suite (xn ) dans C et une suite (λn ) de réels positifs avec
λn → 0 et λn xn → u ;
iii) Pour tout point x de C et tout réel λ > 0, le point x + λu appartient à C.
iv) Il existe un point x0 de C tel que pour tout réel λ > 0, le point x0 + λu
appartienne à C.

Démonstration : L’équivalence de i) et ii) est la définition même du cône


asymptotique.
i) ⇒ iii) : Si x ∈ C et u ∈ Cas , alors (x, 1) ∈ C
b et (λu, 0) ∈ Γ(C) ; donc
(x + λu, 1) appartient aussi au cône Γ(C), et comme ce n’est pas un élément de
E×{0}, c’est d’après la Proposition 3.7.3 un élément de Γ(C) ; donc x+λu ∈ C.

iii) ⇒ iv) : trivial.


iv) ⇒ iii) : On a (x0 + λu, 1) ∈ C,
b d’où (x0 /λ + u, 1/λ) ∈ Γ(C) pour tout
λ > 0. En passant à la limite λ → +∞, on obtient (u, 0) ∈ Γ(C), c’est à dire
u ∈ Cas .
58 CHAPITRE 3. STRUCTURE DES CONVEXES

Cette proposition montre que le cône asymptotique d’un convexe est formé des
directions des demi-droites affines incluses dans ce convexe.

Exemples 3.7.5. 1) Dans R2 , le cône asymptotique du convexe fermé défini


par une parabole est la demi-droite issue de l’origine, dirigée selon l’axe de la
parabole.
2) Dans R2 , le cône asymptotique du convexe fermé défini par une branche
d’hyperbole est le cône saillant issue de l’origine, limité par les directions des
axes de l’hyperbole.

Corollaire 3.7.6. Le cône Γ(C) est saillant si et seulement si C ne contient


aucune droite affine.

Démonstration : Comme Γ(C) est inclus dans le demi-espace E × R+ ,



N Γ(C) = Γ(C) ∩ (−Γ(C)) est inclus dans l’hyperplan E × {0}, et donc dans

Cas × {0}. Il en résulte que N Γ(C) = (Cas ∩ (−Cas )) × {0} ; donc Γ(C) est
non saillant si et seulement si il existe un vecteur u non nul tel que u et −u
soient dans le cône asymptotique. Etant donné x0 ∈ C ceci équivaut à dire que
la droite passant par x0 de vecteur directeur u est incluse dans C, d’après iii)
et iv) de la Proposition 3.7.4.

Théorème 3.7.7 (Décomposition des convexes fermés ne contenant pas de


droite en dimension finie). Tout convexe fermé de dimension finie C ne conte-
nant aucune droite affine est somme de son cône asymptotique et de l’enveloppe
convexe de ses points extrémaux :

C = conv(Ext C) + Cas

Plus précisément tout point x de C est dans la somme de k génératrices ex-


trémales de Cas et de l’enveloppe convexe de ` points extrémaux de C, avec
k + ` ≤ dim E + 1.

Démonstration : Il est clair d’après la Proposition 3.7.4 iii) que conv(Ext(C))+


Cas ⊂ C. Pour montrer l’autre inclusion, considérons le cône Γ(C) : d’après
le corollaire 3.7.6, le cône Γ(C) est saillant. Et d’après le théorème de Krein-
Milman pour les cônes convexes fermés saillants (Théorème 3.6.11) on a

Γ(C) = conv GextΓ(C)

On note que Cas × {0} est une face de Γ(C) comme intersection de ce cône

convexe avec un hyperplan d’appui et il en résulte Gext Γ(C) ∩ (Cas × {0}) =
Gext(Cas ) × {0}, Lemme 1.4.11.
3.7. CONVEXES FERMÉS GÉNÉRAUX DE DIMENSION FINIE 59
 
Montrons maintenant que Gext Γ(C) ∩ Γ(C) = Gext Γ(C) . Il suffit de vé-
 
rifier l’inclusion Gext Γ(C) ⊂ Gext Γ(C) . Si x ∈ C, notons γxb = R+ .(x, 1)
la direction de Γ(C) associée. Supposons que γxb ∈ Gext Γ(C) . Si (x, 1) =
(y, λ)+(z, µ), avec (y, λ), (z, µ) ∈ Γ(C), et si λ, µ > 0, on a en fait (y, λ), (z, µ) ∈
Γ(C), et par conséquent (y, λ) et (z, µ) sont colinéaires à (x, 1) par extrémalité
de γxb . Si au contraire on a par exemple µ = 0, alors (x, 1) = (y, λ) + (z, 0)
avec z ∈ Cas ; alors nécessairement λ = 1, y ∈ C, et x = y + z. Le point
x + z est aussi dans C, puisque z ∈ Cas . Le point (x, 1) étant milieu des points
(x±z, 1) ∈ Γ(C), ceux-ci doivent appartenir à la direction R+ (x, 1), ce qui n’est
possible que si x + z = x = x − z donc z = 0. Donc dans ce cas (z, µ) = (0, 0)
et (y, λ) = (x, 1).
On voit donc que, dans les deux cas, γxb est bien une génératrice extremale du
cône fermé Γ(C).
Comme Γ(C) = cone(C) b et C b est l’intersection de Γ(C) avec l’hyperplan E ×
{1} qui ne contient pas (0, 0) et le Lemme 3.6.13 montre que γxb ∈ Gext(Γ(C))
si et seulement si (x, 1) ∈ Ext (C),
b c’est à dire si et seulement si x ∈ Ext C.

Finalement soit x P ∈ C. Il existe m ≤ p + 1 génératrices extrémales γi de Γ(C)


telles que (x, 1) ∈ m i=1 γi . D’après ce qui précède, il existe x1 , . . . , xk ∈ Ext C,
α1 , . . . , αk ∈ R+ et uk+1 , . . . , um ∈ Cas , tels que :

k
X m
X
(x, 1) = αi (xi , 1) + (ui , 0)
i=1 i=k+1

Pk Pk Pm
d’où i=1 αi = 1 et x = i=1 αi xi + i=k+1 ui .
Remarque 3.7.8. Si le convexe fermé C contient une droite affine, il n’a aucun
point extrémal et son cône asymptotique n’a aucune génératrice extrémale.
Démonstration : En effet si u ∈ N (Cas ) , u 6= 0, et x ∈ C, on a x ± u ∈ C,
donc x n’est pas extrémal. Comme N (Cas ) 6= {0}, Cas n’a pas de génératrice
extrémale d’après la Remarque 3.6.10.
Remarque 3.7.9. Si C est un convexe fermé, l’ensemble conv(Ext C) n’est pas
forcément fermé ni borné.
En effet, On a déja vu en 3.5.3 que conv(Ext C) n’est pas nécessairement
fermé et si C est le convexe fermé limité par une hyperbole dans R2 , ses point
extémaux sont exactement les points de l’hyperbole, qui est non borné.

On a pour les convexes fermés un théorème de décomposition généralisant la


Proposition 3.6.3 :
60 CHAPITRE 3. STRUCTURE DES CONVEXES

Proposition 3.7.10 (Décomposition des convexes fermés en dimension finie).


Tout convexe fermé C d’un espace de dimension finie admet une décomposition
de la forme :
C = V + C0
où V est un sous-espace vectoriel de E, et C0 un convexe fermé ne contenant
aucune droite affine et inclus dans un translaté d’un supplémentaire de V .

Démonstration : Par translation, on peut supposer que 0 ∈ C. Soit N (C) :=


N (Cas ) le plus grand sous-espace vectoriel du cône asymptotique de C, W un
supplémentaire de N (Cas ) dans E, et C0 = C ∩ W ; on conclut comme dans la
preuve de la Proposition 3.6.3.
Chapitre 4
Structure des convexes polyédraux en dimension finie

On désigne par E un espace vectoriel de dimension finie.

4.1 Polaire d’une partie

Définition 4.1.1 (Polaire d’une partie). Soit A une partie d’un EVN E. Le
polaire de A est le convexe fermé du dual E 0 défini par :

A◦ = x∗ ∈ E 0 / hx∗ , xi ≤ 1, ∀x ∈ A


De même, si B est une partie de E 0 , le polaire de B est le convexe fermé de E


défini par :

B ◦ = x ∈ E/ hx∗ , xi ≤ 1, ∀x∗ ∈ B


Enonçons maintenant le Théorème du bipolaire :


Théorème 4.1.2 (Théorème du bipolaire). Pour toute partie A de E, on a :
A◦◦ = conv(A ∪ {0})
Démonstration : a) Il est clair que A ⊂ A◦◦ et 0 ∈ A◦◦ . Comme A◦◦ est
convexe fermé, il en résulte A◦◦ ⊃ conv(A ∪ {0}).
b) Inversement, soit x0 6∈ conv(A ∪ {0}). On peut donc, par le Théorème 3.2.2,
séparer strictement le point x0 du convexe fermé non vide conv(A ∪ {0}) ; il
existe donc x∗ ∈ E 0 telle que :
sup hx∗ , xi < hx∗ , x0 i
x∈conv(A∪{0})

En particulier a := hx∗ , x0 i > b := max(0, supx∈A hx∗ , xi) ≥ 0. Par homogé-


néité, on peut supposer que a > 1 ≥ b (si b = 0, on multiplie x∗ par (2/a) ;
si b > 0, on multiplie x∗ par (1/b)). L’inégalité 1 ≥ b signifie que x∗ ∈ A◦ .
L’inégalité a > 1 entraîne ensuite que x0 6∈ A◦◦ .

61
62 CHAPITRE 4. STRUCTURE DES CONVEXES POLYÉDRAUX

Corollaire 4.1.3. Pour tout convexe fermé contenant 0 on a :

C ◦◦ = C

Ces résultats sont vrais aussi en dimension quelconque : on pourra vérifier que
la démonstration du Théorème 4.1.2 s’applique sans changement dans ce cadre
en utlisisant les théorèmes de séparation du chapitre 6.

4.2 Définition et première représentation des convexes poly-


édraux

Définition 4.2.1 (Convexes polyédraux). On appelle convexe polyédral C de


E une intersection d’un nombre fini de demi-espaces affines fermés, c’est à
dire

C = x ∈ E/ gi (x) ≥ bi ; i = 1, . . . , N

où g1 , . . . , gN sont des formes linéaires sur E, et b1 , . . . , bN des réels.

On remarquera qu’un tel convexe polyédral C est toujours fermé. En plus, C


est un cône – un cône polyédral – si tous les bi sont nuls.

On a besoin d’un résulat sur les formes linéaires :

Lemme 4.2.2. Soient g1 , . . . , gN sont des formes linéaires sur E. Alors, g1 , . . . , gN


\N
engendrent linéairement le dual E 0 de E si et seulement si Ker gi = {0}.
i=1

N
\
Démonstration : Si x ∈ Ker gi avec x 6= 0, il suit que pour tout g ∈
i=1
6 E0.
Vect{g1 , g2 , . . . , gn } on a g(x) = 0. Donc Vect{g1 , g2 , . . . , gn } =
Réciproquement, si Vect{g1 , g2 , . . . , gn } =6 E 0 , il existe un g ∈ E 0 tel que g ∈
/
Vect{g1 , g2 , . . . , gn }. Par le théorème de séparation d’un point et d’un convexe
fermé (Théorème 3.2.2), il existe x ∈ E = E 00 qui sépare g et Vect{g1 , g2 , . . . , gn }.
Comme Vect{g1 , g2 , . . . , gn } est un SEV, nécessairement, x annule tout élé-
ment de cet ensemble et donc est dans l’intersection des noyaux des gi , i =
1, 2, . . . , N . Par contre, g(x) 6= 0. On en déduit qu’il existe un vecteur non nul
\N
dans Ker gi .
i=1
4.2. REPRÉSENTATION DES CONVEXES POLYÉDRAUX 63

On peut maintenant étudier la structure des convexes polyédraux :



Proposition 4.2.3. Si C = x ∈ E / gi (x) ≥ bi ; i = 1, . . . , N 6= ∅, on a :

Cas = x ∈ E/ gi (x) ≥ 0; i = 1, . . . , N
N
\

N (C) = N (Cas ) = x ∈ E/ gi (x) = 0; i = 1, . . . , N = Ker gi
i=1
En particulier N (C) = 0 si et seulement si g1 , . . . , gN engendrent linéairement
le dual E 0 de E.
Démonstration : Montrons l’assertion relative à Cas ; les autres s’en dé-
duisent facilement. Fixons x0 ∈ C. Alors
u ∈ Cas ⇐⇒ ∀λ > 0, x0 + λu ∈ C
⇐⇒ ∀λ > 0, ∀i = 1, . . . , N, gi (x0 + λu) ≥ bi
bi − g(x0 )
⇐⇒ ∀λ > 0, ∀i = 1, . . . , N, gi (u) ≥
λ
Faisant λ → +∞, on voit que cette dernière condition implique gi (u) ≥ 0, pour
tous i = 1, . . . , N . Inversement si ces inégalités sont vérifiées, on a bien :

gi (x0 + λu) = gi (x0 ) + λg(u) ≥ gi (x0 ) ≥ bi

On cherche à caractériser les points extrémaux et les génératrices extrémales


de convexes polyédraux. D’après 3.7.8 et 4.2.3, on supposera toujours que
Vect(g1 , g2 , . . . , gN ) = E 0 . Commençons par les points extrémaux :
Proposition 4.2.4. Soit C le convexe polyédral défini par les inéquations

gi (·) ≥ bi , i = 1, . . . , N

Pour tout x ∈ C, soit IC (x) l’ensemble des indices i ∈ {1, . . . , N } pour lesquels
gi (x) = bi . Alors x est extrémal si et seulement si

Vect gi / i ∈ IC (x) = E 0


Démonstration : a) Supposons Vect{gi / i ∈ IC (x)} = E 0 , montrons que


x est extrémal. En effet si x = (y + z)/2, avec y, z ∈ C, on a nécessairement
gi (y) = gi (z) = bi pour tout i ∈ IC (x). Comme les gi , i ∈ IC (x) engendrent E 0
par hypothèse, on a donc g(y) = g(z) pour toute g ∈ E 0 . Ceci entraîne bien
que y = z = x, donc x est extrémal.
64 CHAPITRE 4. STRUCTURE DES CONVEXES POLYÉDRAUX

6 E 0 . Il existe
\ maintenant qu’au contraire Vect{gi / i ∈ IC (x)} =
b) Supposons
alors u ∈ Ker gi , u 6= 0. Posons :
i∈IC (x)

gi (x) − bi
ε = inf , i ∈ IC (x) et gi (u) 6= 0
|gi (u)|
Alors ε > 0 et ε |gi (u)| ≤ gi (x)−bi , pour tout i 6∈ IC (x). On a donc gi (x±εu) ≥
bi pour i 6∈ IC (x).
D’autre part gi (x ± εu) = gi (x) = bi pour i ∈ IC (x) et si gi (u) = 0.
D’où x ± εu ∈ C et comme εu 6= 0, x n’est pas extrémal.
Corollaire 4.2.5. Tout convexe polyédral a un nombre fini de points extré-
maux.
Démonstration : Supposons comme ci-dessus le convexe polyédral C défini
par les inéquations gi (·) ≥ bi , i = 1, . . . , N . D’après la proposition précédente,
si x ∈ C est extrémal, il existe I ⊂ {1, . . . , N } tel que Vect(gi )i∈I = E 0
et gi (x) = bi pour tout i ∈ I. On peut choisir I de cardinal p = dim E.
Inversement pour tout I ⊂ {1, . . . , N } de cardinal p tel que Vect(gi )i∈I = E 0 ,
il existe exactement un point zI ∈ E tel que gi (zI ) = bi , pour tout i ∈ I.
L’ensemble I des parties I de {1, . . . , N } à p éléments telles que Vect(gi )i∈I =
p
E 0 est de cardinal majoré par CN , il en est donc de même de Ext C (qui est
inclus dans {zI / I ∈ I}).
Remarque 4.2.6 (Sommets). Les points extrémaux d’un convexe polyédral sont
aussi appelés ses sommets.
Corollaire 4.2.7. Tout cône convexe polyédral a un nombre fini de génératrices
extrémales.
Démonstration : Si N (Γ) 6= (0), Γ n’a aucune génératrice extrémale. Si
N (Γ) = (0), les génératrices extrémales de Γ sont en bijection avec les points
extrémaux d’un convexe compact K = Γ∩H, où H est un hyperplan bien choisi
(Lemmes 3.6.12 et 3.6.13). Un hyperplan est trivialement polyédral, donc K
est polyédral et par suite a un nombre fini de points extrémaux.

On s’intéresse ensuite aux génératrices extrémales d’un cône convexe poly-


édral :
Proposition 4.2.8. Soit Γ un cône polyédral défini par les inéquations
gi (·) ≥ 0 , i = 1, . . . , N
On suppose que Vect(gi )N 0
i=1 = E . Alors γ = R+ u est une génératrice extrémale
de Γ si et seulement si Vect(gi )i∈IΓ (u) est un hyperplan de E 0 .
4.2. REPRÉSENTATION DES CONVEXES POLYÉDRAUX 65

Démonstration : Remarquons que la condition Vect(gi )N 0


i=1 = E équivaut à
\
Ker gi = 0,
i
donc à N (Γ) = 0 (Lemme 4.2.3), et donc au fait que Gext(Γ) 6= ∅ (Théorème
3.6.11 et Remarque 3.6.10).
Soit H un hyperplan affine tel que K = H ∩ Γ soit compact et Γ = cone(K)
(Lemme 3.6.12). Alors K est un convexe polyédral, défini par les inéquations
gi (·) ≥ 0 , i = 1, . . . , N
et l’équation de H, soit
g0 (·) = 1
Si x ∈ K, on a :
IK (x) = {i/ gi (x) = 0} ∪ {0} = IΓ (x) ∪ {0}
On a donc :
Vect(gi )i∈IK = Vect[(gi )i∈IΓ ∪ {g0 }]
Mais pour tout x ∈ K, on a g0 6∈ Vect(gi )i∈IΓ (x) , puisque g0 (x) 6= 0. On en
déduit :
x ∈ Ext K ⇐⇒ rang (gi )i∈IK = dim E
⇐⇒ rang (gi )i∈IΓ = dim E − 1

On déduit de cette étude une représentation des convexes polyédraux :


Corollaire 4.2.9 (Décomposition des convexes polyédraux de dimension finie).
Tout convexe polyédral peut s’écrire sous la forme :
C = conv(x1 , . . . , xq ) + cone(u1 , . . . , us )
Si C ne contient pas de droite affine, on peut supposer que x1 , . . . , xq sont des
points extrémaux de C et u1 , . . . , us définissent des directions extrémales de
Cas .
Démonstration : Soit C = N (C)+C0 une décomposition du convexe fermé
C en la somme d’un sous-espace vectoriel et d’un convexe fermé ne contenant
pas de droite (Proposition 3.7.10). Alors C0 est encore un convexe polyédral
(intersection d’un convexe polyédral avec un SEA). Soient x1 , . . . , xq les points
extrémaux de C0 (en nombre fini, d’après Corollaire 4.2.5) et γ1 , . . . , γm les
génératrices extrémales de son cône asymptotique (en nombre fini, d’après
Corollaire 4.2.7) ; u1 , . . . , um des vecteurs directeurs de ces génératrices extré-
males. Soit (v1 , . . . , v` ) une base de N (C). On pose (v1 , −v1 , . . . , v` , −v` ) =
(um+1 , . . . , us ). On a donc cone(um+1 , . . . , us ) = N (C) et conv(x1 , . . . , xq ) +
cone(u1 , . . . , um ) = C0 .
66 CHAPITRE 4. STRUCTURE DES CONVEXES POLYÉDRAUX

4.3 Convexes ∗-polyédraux et deuxième représentation des convexes


polyédraux

On cherche à trouver une réciproque au Corollaire 4.2.9. Pour cela, on introduit


les convexes ∗-polyédraux :
Définition 4.3.1 (Convexe ∗-polyédral). Appelons convexe ∗-polyédral un
convexe de la forme

C = conv(x1 , . . . , xq ) + cone(u1 , . . . , us )
Il résulte de la Proposition 4.2.9 que tout convexe polyédral (non vide) est
∗-polyédral.
Définition 4.3.2 (Polytope). Un convexe ∗-polyédral de la forme C = conv(x1 , . . . , xq )
est appelé un polytope.
Proposition 4.3.3. Tout convexe ∗-polyédral est fermé.
Démonstration : On a C = K + Γ, où K = conv(x1 , . . . , xq ) est compact
(Proposition 2.2.4) et Γ = cone(u1 , . . . , us ) est fermé (Corollaire 3.6.5). Il s’en-
suit que C est fermé. En effet, si (xn ) est une suite de C convergeant vers
x ∈ E, on a xn = yn + zn , avec (yn ) dans K et (zn ) dans Γ. On peut supposer
que (yn ) converge vers un point y de K. Alors (zn ) converge vers z = x − y, et
z ∈ Γ puisque Γ est fermé. D’où x = y + z est dans K + Γ = C.

On va utiliser la notion de polaire introduite au chapitre 2, Définition 4.1.1 :


Proposition 4.3.4. Le polaire d’un convexe ∗-polyédral est un convexe poly-
édral. Précisément, si
C = conv(x1 , . . . , xq ) + cone(u1 , . . . , us )
alors
C ◦ = {x∗ ∈ E 0 / hx∗ , uj i ≤ 0 , j = 1, . . . , s ; hx∗ , xi i ≤ 1 , i = 1, . . . , q}.
Démonstration : Soit C = conv(x1 , . . . , xq ) + cone(u1 , . . . , us ) un convexe
∗-polyédral. Si x∗ ∈ C ◦ , on a en particulier hx∗ , xi + λuj i ≤ 1 pour tous
1 ≤ i ≤ q, 1 ≤ j ≤ s et λ ≥ 0. En divisant par λ et faisant λ → +∞,
on en déduit hx∗ , uj i ≤ 0 pour tout 1 ≤ j ≤ s, tandis qu’en faisant λ = 0
il vient hx∗ , xi i ≤ 1 pour tout 1 ≤ i ≤ q. Réciproquement
Pq siPces conditions
∗ s
sont vérifiées, on a hx P,q xi ≤ 1 pour tout x = i=1 λi xi + j=1 ρj uj ∈ C
(λi ≥ 0, i = 1, . . . , q ; i=1 λi = 1 ; ρj ≥ 0, j = 1, . . . , s). Donc :
C ◦ = x∗ ∈ E 0 / hx∗ , uj i ≤ 0 j = 1, . . . , s ; hx∗ , xi i ≤ 1 i = 1, . . . , q


est bien un convexe polyédral de E 0 .


4.3. CONVEXES ∗-POLYÉDRAUX ET POLYÉDRAUX 67

Théorème 4.3.5. La classe des convexes ∗-polyédraux coïncide avec celle des
convexes polyédraux.
Démonstration : On sait déja que tout convexe polyédral est ∗-polyédral
(Proposition 4.2.9).
Réciproquement soit C un convexe ∗-polyédral. Par translation, on peut sup-
poser que 0 ∈ C. D’après la Proposition 4.2.9, son polaire C ◦ est polyédral,
donc ∗-polyédral. Donc, à nouveau d’après la Proposition 4.2.9, son bipolaire
C ◦◦ est encore polyédral. Comme C est fermé (Proposition 4.3.3) et contient
0, on a C ◦◦ = C par le théorème du bipolaire, 4.1.2 : donc C est polyédral.
Corollaire 4.3.6. L’image d’un convexe polyédral de E par une application
linéaire T : E → F est un convexe polyédral de F .
Démonstration : Si C = conv(x1 , . . . , xq ) + cone(u1 , . . . , us )
on a
T (C) = conv(T x1 , . . . , T xq ) + cone(T u1 , . . . , T us )

Corollaire 4.3.7. La somme d’un nombre fini de convexes polyédraux est un


convexe polyédral.
Démonstration : Si C1 , . . . , Cn sont des convexes polyédraux de E, C1 ×
C2 × · · · × Cn est un convexe polyédral n n
Pn de E . Soit S : E → E l’application
linéaire somme : (x1 , . . . , xn ) → i=1 xi . Alors S(C1 × C2 × · · · × Cn ) =
C1 + C2 + . . . + Cn est polyédral.

On a vu dans la preuve de la Proposition 4.3.4 que le polaire du convexe


polyédral (ou, le même, ∗-polyédral) C = conv(x1 , . . . , xq ) + cone(u1 , . . . , us )
est le convexe polyédral d’inéquations hx∗ , xi i ≤ 1, i = 1, . . . , q et hx∗ , uj i ≤ 0,
j = 1, . . . , s. Réciproquement :
Remarque 4.3.8. Soient bi , i = 1, . . . , q des réels strictement positifs. Le polaire
du convexe polyédral C d’équations

C = x ∈ E/ gi (x) ≤ bi , i = 1, . . . , q ; hj (x) ≤ 0 , j = 1, . . . , s

est le convexe

C ◦ = conv(0, g1 /b1 , . . . , gq /bq ) + cone(h1 , . . . , hs )

Démonstration : En remplaçant gi par gi /bi , on peut supposer bi = 1,


i = 1, . . . , q. Le polaire de D = conv(0, g1 , . . . , gq ) + cone(h1 , . . . , hs ) est alors
égal à C d’après ce qui précède. Alors C ◦ = D◦◦ = D d’après le théorème du
bipolaire, 4.1.2, (puisque D est fermé et contient 0).
68 CHAPITRE 4. STRUCTURE DES CONVEXES POLYÉDRAUX

4.4 Application : le lemme de Farkas

Proposition 4.4.1 (Lemme de Farkas). Soient f1 , . . . , fN et f des formes


linéaires sur E. Une condition nécessaire et suffisante pour que le système
d’inéquations
fj (x) ≤ 0, j = 1, . . . , N
entraîne l’inéquation f (x) ≤ 0 est que f soit combinaison linéaire à coefficients
positifs ou nuls des fj , j = 1, . . . , N .

Démonstration : Soit Γ = cone(f1 , . . . , fN ). Son polaire n’est autre que le


cône convexe polyédral de E défini par les équations fj (x) ≤ 0, j = 1, . . . , N .
Dire que le système d’inéquations fj (x) ≤ 0, j = 1, . . . , N entraîne l’inéqua-
tion f (x) ≤ 0 revient donc à dire que f appartient au bipolaire de Γ, qui n’est
autre que Γ d’après le théorème du bipolaire 4.1.2 et le fait que Γ est fermé
(Corollaire 3.6.5) et contient 0.
Chapitre 5
Application à la programmation linéaire

5.1 Programmation linéaire. Une méthode théorique de réso-


lution

Dans tout ce chapitre, E est un EVN de dimension finie.

Définition 5.1.1 (Programmation linéaire). Un problème de programmation


linéaire est un problème d’optimisation du type :

déterminer inf f (x)
(P)
sous les contraintes fi (x) ≤ bi , i = 1, . . . , m

où f et les fi sont des formes linéaires sur E.

Il revient au même de dire que l’on cherche à minimiser f sur le convexe


polyédral C déterminé par les inéquations {fi (x) ≤ bi , i = 1, . . . , m}.

Définition 5.1.2 (Programme admissible). Le convexe C étant supposé non


vide, ses éléments sont appelés les programmes admissibles de (P).

Soit Ext C l’ensemble des sommets (ou points extrémaux) de C, et Gext(Cas )


l’ensemble des génératrices extrémales du cône asymptotique Cas . On pose
inf P = inf x∈C f (x).

Définition 5.1.3 (Programme optimal). Un point x0 ∈ C tel que f (x0 ) =


inf P (s’il en existe) est appelé programme optimal pour (P).

Proposition 5.1.4. On suppose que C ne contient pas de droite. S’il existe une
direction asymptotique γu ∈ Gext(Cas ) telle que f (u) < 0, alors inf P = −∞.
Dans le cas contraire inf P > −∞, et est atteint en un point de Ext C.

69
70 CHAPITRE 5. PROGRAMMATION LINÉAIRE

Démonstration : Soit x0 un point de C. Si u ∈ Cas est tel que f (u) < 0, on


a f (x0 + λu) = f (x0 ) + λf (u) → −∞ lorsque λ → +∞ ; comme x0 + λu ∈ C
pour tout λ ≥ 0, on voit que inf P = −∞.
Si au contraire f (u) ≥ 0 pour tout u tel que S γu ∈ Gext(Cas ), alors f (u) ≥
0 pour tout u ∈ Cas , puisque Cas = cone( Gext(Cas )). On sait que C =
K + Cas , avec K = conv(Ext C). On a donc inf P = inf{f (x) + f (u) / x ∈
K, u ∈ Cas } = inf{f (x) / x ∈ K}. Soit Ext C = (s1 , . . . , sN ) une énumération
de l’ensemble (fini) des points
Pextrémaux. Pour toute combinaison convexe
x= N N
mini=1,...,N f (si ). Donc inf P =
P
i=1 α i s i , on a f (x) = i=1 α i f (si ) ≥
mini=1,...,N f (si ) > −∞.
Remarque 5.1.5. (i) La première affirmation de la Proposition 5.1.4 est vraie
pour un convexe quelconque. La deuxième affirmation n’est pas vraie en géné-
ral, même pour des convexes fermés : Soit E = R2 , C = {(x, y) / x > 0, xy ≥
1}, et f (x, y) = y.
(ii) Si C contient une droite, on a C = N (Cas ) + C0 , où C0 = C ∩ N (Cas )⊥
est un convexe polyédral qui ne contient pas d’une droite. Si f n’annule pas
tout element de N (Cas ), il suit comme dans la démonstration de la Proposition
5.1.4 que inf P = −∞. Dans le cas contraire, inf P est équivalent au problème
de minimisation de f sur C0 et alors il suffit de solutionner le dernier.

En vue de la Proposition 5.1.4, une manière de résoudre le problème (P) (sous


l’hypothèse que C ne contient pas de droite) consiste donc à :
* Déterminer l’ensemble fini Gext(Cas ).
* Tester si il existe γu ∈ Gext(Cas ) tel que f (u) < 0 : dans ce cas inf P = −∞.
* Dans le cas contraire déterminer l’ensemble fini Ext C.
* Calculer f (s) pour tous les s ∈ Ext C, et leur minimum.

Dans la pratique, ce schéma d’algorithme achoppe sur le nombre de points


extrémaux ou de génératrices extrémales de C, qui peut être considérablement
supérieur à la fois au nombre m de contraintes et à la dimension n de l’espace
vectoriel des programmes E.
Par exemple si E = Rn et C est le cube de dimension n :

C = x = (x1 , . . . , xn ) ∈ Rn / 0 ≤ xi ≤ 1, i = 1, . . . , n


alors m = 2n. Les sommets de C sont les points (x1 , . . . , xn ) avec xi = 0 ou 1,


qui sont en nombre 2n .
On est donc conduit à envisager un algorithme consistant à parcourir un chemin
particulier dans l’ensemble Ext C.
5.1. PROGRAMMATION LINÉAIRE, RÉSOLUTION THÉORIQUE 71

Définition 5.1.6 (Arêtes d’un convexe). Une arrête d’un convexe C est une
face 1-dimensionnelle. On appelle A l’ensemble des arrêtes de C.

Comme C est supposé ne pas contenir de droite, une arête est soit un segment
[s1 , s2 ], et nécessairement dans ce cas s1 , s2 ∈ Ext C ; soit une demi-droite
s + γu , et alors nécessairement s ∈ Ext C, et γu ∈ Gext(Cas ).

Lemme 5.1.7. Un point non extrémal x0 ∈ C appartient à une arête de


C si et seulement si, en posant IC (x0 ) = {i = 1, . . . , m / fi (x0 ) = bi }, la
famille (fi )i∈IC (x0 ) est de rang (n − 1) dans E 0 . Un vecteur non nul u est alors
directeur pour cette arête si et seulement si fi (u) = 0, ∀i ∈ IC (x0 ). Pour tout
x appartenant à la même arête, on a donc IC (x0 ) ⊂ IC (x) avec égalité quand
x0 n’est pas un sommet.

Démonstration : i) Si (fi )i∈IC (x0 ) est de rang (n−1), l’intersection des (n−
1) hyperplans affines Hi = {x/ fi (x) = bi } est une droite affine ∆ contenant
x0 . Comme les hyperplans Hi sont d’appui pour C, chaque Hi ∩ C est une face
de C, et il en est de même de A = ∆ ∩ C. Comme x0 n’est pas extrémal, la
face A n’est pas réduite à {x0 }. C’est donc une arête de C, contenant x0 . Un
vecteur directeur u de A vérifie évidemment fi (u) = 0 pour tout ∀i ∈ IC (x0 ) ;
tout autre point x de a vérifie fi (x) = bi , pour tout i ∈ IC (x0 ), c’est-à-dire
IC (x0 ) ⊂ IC (x).
ii) Si (fi )i∈IC (x0 ) est de rang n, x0 est extrémal, il y a une contradiction.
iii) Si (fi )i∈IC (x0 ) est de rang r < (n − 1), on peut trouver n − r vecteurs
indépendants u` , ` = 1, . . . , n − r, tels que fi (u` ) = 0 pour tous i ∈ IC (x0 ) et
` = 1, . . . , n − r.
Alors x0 ±δu` ∈ C pour tout ` = 1, . . . , n−r et δ petit puisque fi (x0 ±δu` ) = bi
si i ∈ IC (x0 ), tandis que fi (x0 ± δu` ) = fi (x0 ) ± δfi (u` ) < bi pour i 6∈ IC (x0 )
et δ suffisamment petit.
Il s’ensuit que toute face de C contenant x0 contient aussi les x0 + εu` , ` =
1, . . . , n−r, donc est de dimension ≥ n−r ≥ 2 : donc x0 n’appartient à aucune
arête de C.

Lemme 5.1.8. Pour tout sommet s de C, le cône convexe de sommet s engen-


dré par C coïncide avec le cône convexe de sommet s engendré par les arêtes
issues de s.

Démonstration : Par translation, on peut supposer que s = 0. Soit Γ =


cone(C), le cône convexe engendré par C. Ce cône est encore polyédral, car si
C = conv(0, s2 , . . . , sN )+cone(u1 , . . . , up ), on a Γ = cone(s2 , . . . , sN , u1 , . . . , up ).
Les génératrices extrémales de Γ sont des demi-droites engendrées par les arêtes
de C issues de s = 0. En effet si u engendre une génératrice extrémale de Γ,
72 CHAPITRE 5. PROGRAMMATION LINÉAIRE

v+w
soit A = γu ∩ C ; si x ∈ A, vérifie x = , avec v, w ∈ C, on a a fortiori
2
v, w ∈ Γ ; si x 6= 0, on a γx = γu , d’où v, w ∈ γx = γu par extrémalité de γu ,
donc v, w ∈ A ; si x = 0, on a v = w = 0 par extrémalité de s = 0. Donc A est
une arête de C.
Réciproquement, si A est une arête de C d’extrémité 0, soit γ = R+ A la demi-
v+w
droite issue de 0 engendrée par A. Si u ∈ γ vérifie u = avec v, w ∈ Γ,
2
soit λ > 0 tel que λu, λv, λw appartiennent à C. Alors λv, λw appartiennent à
A et donc v, w appartiennent à γ, qui est donc extrémale.
Le même raisonnement montre que 0 est un sommet de Γ, qui est donc saillant.
Comme le cône polyédral saillant Γ est engendré par ses génératrices extré-
males, il est donc inclus dans le cône convexe de sommet s engendré par les
arêtes issues de s. L’inclusion inverse est triviale.
Corollaire 5.1.9. Si toute arête issue du sommet s de C est incluse dans le
demi-espace D = {x ∈ E / f (x) ≥ f (s)}, alors le convexe C tout entier est
inclus dans ce demi-espace, c’est-à-dire que s est un programme optimal pour
(P).
Définition 5.1.10 (Sommets voisins). On dira que deux sommets s1 , s2 ∈
Ext C sont voisins si le segment [s1 , s2 ] est une arête de C.
On peut alors modifier comme suit le schéma d’algorithme de recherche d’un
programme optimal :

* initialisation : déterminer un sommet s0 de C.


A la k-ième étape, on a déterminé un sommet sk de C.
* s’il existe une arête infinie issue de sk , dirigée par un vecteur u tel que
f (u) < 0, alors inf P = −∞, et l’algorithme s’arrête.
* sinon, deux cas se présentent :
** si pour tout sommet s voisin de sk , on a f (s) ≥ f (sk ), alors sk est un
programme optimal (Corollaire 5.1.9) et l’algorithme s’arrête.
** sinon, il existe un sommet s voisin de sk , tel que f (s) < f (sk ) ; on
pose sk+1 = s.
Puisque l’ensemble Ext C des sommets de C est fini, et que les sommets sk
ainsi construits sont tous distincts, l’algorithme s’arrête après un nombre fini
d’étapes.
Cet algorithme consiste donc à joindre tout sommet initial de C à un sommet
optimal s’il en existe par une chaîne de sommets voisins.
En fait il est possible de joindre ainsi deux sommets quelconques de C :
Remarque 5.1.11. Pour tous s0 , s ∈ Ext C il existe une chaîne s0 , s1 , . . . , sN = s
de sommets de C, telle que pour tout i < N , si+1 soit voisin de si .
5.2. FORMES CANONIQUE ET STANDARD 73

Démonstration : Soit V(s0 ) l’ensemble des sommets s de C qu’on peut


joindre à s0 par une telle chaîne. Soit K0 = conv(V(s0 )). Alors, K0 est inclus
dans convExt(C).
Si Ext C n’est pas inclus dans le convexe fermé K0 , on peut trouver s ∈ Ext C
et une forme linéaire f séparant strictement s de K0 , c’est-à-dire :

inf f (x) > f (s)


x∈K0

D’après la Proposition 5.1.4, on peut trouver s1 ∈ V(s0 ) tel que f (s1 ) =


inf x∈K0 f (x).
Le Corollaire 5.1.9 appliqué à s1 et K = conv(Ext C) montre qu’il existe
une arête [s1 , s2 ] de K telle que f (s2 ) < f (s1 ). Alors s2 ∈ Ext C est aussi
dans V(s0 ) : en effet, une chaîne t0 = s0 , . . . , tN = s1 joignant s0 à s1 se
prolonge en la chaîne (t0 , . . . , tN , s2 ) joignant s0 à s2 ; ce qui contredit f (s2 ) <
inf x∈K0 f (x).

5.2 Forme canonique et forme standard d’un problème linéaire

Dans la formulation canonique, on suppose que E = Rn , et on désigne par


(ej )j=1,...,n la base naturelle de Rn .
La forme linéaire à optimiser est donnée par f (x) = c.x, où c ∈ Rn est identifiée
à une matrice-ligne tandis que x est identifiée à une matrice colonne.

Définition 5.2.1 (Fonction objectif). f est appelée la fonction objectif.

Les contraintes fi (x) ≤ bi , 1 ≤ i ≤ m s’écrivent Ai .x ≤ bi , où les Ai ∈ Rn sont


des matrices ligne. En notant b ∈ Rm la matrice colonne définie par les bi , et A
la matrice à m lignes et n colonnes dont les lignes sont les Ai , ces contraintes
s’écrivent Ax ≤ b, où ≤ désigne l’ordre partiel naturel sur Rm , c’est à dire que
l’inéquation a ≤ b signifie que leurs coordonnées ai , bi vérifient les inéquations
ai ≤ bi , i = 1, . . . , m. On convient aussi de n’examiner que les programmes à
coordonnées positives ou nulle.
Un problème linéaire sous forme canonique a donc la forme
(
minimiser f (x) = c.x
(Pc )
sous les contraintes Ax ≤ b et x ≥ 0

Il est clair que le convexe polyédral défini par les contraintes ne contient aucune
droite, puiqu’il est inclus dans le cône saillant Rn+ .
74 CHAPITRE 5. PROGRAMMATION LINÉAIRE

Tout problème linéaire du type considéré au paragraphe 4.1 :


(
minimiser f (x) = c.x, x ∈ Rn
(P)
sous les contraintes Ax ≤ b

se ramène à la forme canonique en dédoublant les variables :


(
minimiser g(x0 , x00 ) = c.(x0 − x00 ), (x0 , x00 ) ∈ R2n
(P) ⇐⇒
sous les contraintes A(x0 − x00 ) ≤ b et x0 ≥ 0, x00 ≥ 0

Dans la formulation standard, les contraintes inégalités associées à la matrice


A sont remplacées par des contraintes égalité :
(
minimiser f (x) = c.x
(Ps )
sous les contraintes Ax = b et x ≥ 0
On peut toujours passer de la formulation canonique à la formulation standard
en introduisant une variable d’écart, “slack variable” en Anglais, x0 ∈ Rm :
(
minimiser g(x, x0 ) = c.x + 0.x0 , (x, x0 ) ∈ Rn+m
(Pc ) ⇐⇒
sous les contraintes Ax + x0 = b et x ≥ 0, x0 ≥ 0
 
x
ce qui correspond à équation matricielle à = b, avec la nouvelle matrice
x0
à = (A / Im ).

5.3 Paramétrisation des programmes de base pour un pro-


blème standard

Dans toute la suite, le problème d’optimisation considéré est donné sous forme
standard : (
minimiser f (x) = c.x, x ∈ Rn
(Ps )
sous les contraintes Ax = b et x ≥ 0
où A est une matrice à n colonnes, m lignes que l’on suppose de rang m.

Pour tout programme admissible x, notons N (x) l’ensemble des indices j =


1, . . . , n pour lesquels les contraintes xj ≥ 0 sont actives, c’est à dire qu’on a
xj = 0 :
N (x) = {j ∈ {1, . . . , n} / xj = 0}
Définition 5.3.1 (Programmes de base). Les points extrémaux du convexe
polyédral C défini par les contraintes Ax = b et x ≥ 0 sont appelés programmes
de base.
5.3. PARAMÉTRISATION DES PROGRAMMES DE BASE 75

Lemme 5.3.2. Un programme admissible x est un programme de base si et


seulement si les vecteurs colonnes Aj de la matrice A correspondant aux indices
j 6∈ N (x) sont indépendants.
Démonstration : D’après la Proposition 4.2.4, dire que x est un sommet
de C équivaut à dire que les formes linéaires coordonnées e∗j : y 7→ yj , pour
j ∈ N (x), et les formes linéaires associées aux contraintes égalité fi : y 7→ Ai .y,
i = 1, . . . , m engendrent E 0 ; il revient au même de dire que le seul vecteur de
E annulant toutes ces formes linéaires est le vecteur nul :
)
uj = 0, ∀j ∈ N (x)
=⇒ u = 0
Ai .u = 0, i = 1 . . . m
En notant Aj les vecteurs colonne de la matrice A, il revient encore au même
de dire que :
uj Aji = 0, i = 1, . . . , m =⇒ uj = 0, ∀j 6∈ N (x)
X

j6∈N (x)

ou encore que les vecteurs colonne (Aj )j6∈N (x) sont indépendants.
Remarque 5.3.3. Il résulte immédiatement de ce lemme que pour tout pro-
gramme de base x, l’ensemble N (x) a au moins n − m éléments. Le programme
de base est dit non dégénéré si N (x) a exactement n − m éléments, dégénéré
s’il en a plus.
Si S est une partie non vide de l’ensemble {1, . . . , n}, soit RS l’espace des suites
de réels (xj )j∈S indexées par S ; on a une application naturelle de restriction
rS : Rn → RS , x = (xj )j=1,...,n 7→ xS = (xj )j∈S .
Si (B,  une partition de {1, . . . , n} en deux ensembles non vides, on écrira
 F ) est
xB
x= pour signifier que x est obtenue par recollement des suites (xj )j∈B
xF
et (xj )j∈F .
Notons que cette écriture est impropre et ambigüe lorsque les ensembles B et
F ne sont pas consécutifs.
De même, la matrice A pourra s’écrire (improprement) A = (AB / AF ), où AB
est le bloc défini par les colonnes Aj , j ∈ B, et AF celui défini par les colonnes
Aj , j ∈ F . On a alors Ax = AB xB + AF xF .
Corollaire 5.3.4. Si x est un programme de base, il existe une partition (B, F )
de {1, . . . , n} telle que cardB = m, que AB soit une matrice régulière et que
−1
xB = AB b, xF = 0. Réciproquement pour toute sous-matrice AB de 
A, carrée
A−1

−1 B b
d’ordre m, inversible et telle que AB b ≥ 0, le programme s(B) :=
0
est un programme de base.
76 CHAPITRE 5. PROGRAMMATION LINÉAIRE

Démonstration : Si x est un programme de base, le système (Aj )j6∈N (x) est


libre. Comme l’ensemble des vecteurs colonnes est de rang m par hypothèse, par
le théorème de la base incomplète, on peut trouver une partie B à m éléments
de {1, . . . , n}, contenant le comlémentaire de N (x), et tel que les colonnes Aj ,
j ∈ B, forment une base de Rm . Alors la matrice AB est inversible. Soit F le
complémentaire de B, on a F ⊂ N (x), donc xF = 0 ; alors b = Ax = AB xB ,
d’où xB = A−1 B b.
Réciproquement si B est une partie àm éléments de {1, . . . , n}, telle que AB
−1

A b
soit inversible et A−1 B b ≥ 0, alors x =
B est un programme admissible,
0
et N (x) contient le complémentaire F de B ; donc les colonnes Aj , j 6∈ N (x)
sont des colonnes de AB , donc sont indépendantes, et x est un programme de
base.
Définition 5.3.5 (Paramétrisation des programmes de base). Soit B la famille
−1
des parties B à m éléments de {1, . . . , n} telles
 que B soit régulière et AB b ≥
A
−1
AB b
0. Alors l’application B → Rn , B → s(B) = est une paramétrisation
0
de l’ensemble Ext C des programmes de base. C’est en particulier une surjection
de B sur Ext C.
Cette paramétrisation n’est pas nécessairement injective : il se peut que s(B) =
s(B 0 ) = x, avec B 6= B 0 . Comme N (s(B)) ⊃ F = B, on voit que nécessaire-
ment N (x) ⊃ F ∪ F 0 a plus de n − m éléments, et donc x est un programme de
base dégénéré. A contrario, un programme de base non dégénéré, qui a donc
exactement m coordonnées non nulles, est paramétrisé par un unique élément
de B.
Définition 5.3.6. Si B ∈ B, les coordonnées de xB sont appelées variables de
base, celles de xF sont les variables libres.

On s’intéresse ensuite aux programmes de base voisins :


Définition 5.3.7 (Programmes de base voisins). Deux éléments B, B 0 de B
sont appelés voisins si B ∩B 0 a (m−1) éléments. Dans ce cas, B ∪B 0 a (m+1)
éléments, et donc F ∩ F 0 en a (n − m − 1).
Lemme 5.3.8. Deux programmes de base différents sont voisins si et seulement
si ils peuvent être paramétrisés par des éléments de B voisins.
Démonstration : Si B, B 0 ∈ B sont voisins, les programmes de bases
s(B), s(B 0 ) appartiennent tous deux à la variété affine ∆ définie par :
(
Ax = b
xj = 0, ∀j ∈ F ∩ F 0
5.3. PARAMÉTRISATION DES PROGRAMMES DE BASE 77

Les m formes linéaires fi : y → Ai .y, i = 1, . . . , m et les n − m formes linéaires


e∗j , i ∈ F forment un système de rang n. En effet, cela revient à l’indépendance
des colonnes Aj , j ∈ B. Ces vecteurs forment donc une base de Rn . Par ailleurs
F ∩ F 0 a n − m − 1 éléments.
Par conséquent le système (fi , i = 1, . . . , m; e∗j , j ∈ F ∩ F 0 ) est de rang n − 1,
et ∆ est donc une droite affine.
Comme chaque ensemble Fj = {x ∈ C / xj = 0}, lorsqu’il est non vide,
est l’intersection de C avec un hyperplan d’appui, donc est une face de C,
a = ∆ ∩ C est une face de C, contenant s(B) et s(B 0 ). C’est donc une arête
de C, et elle est nécessairement égale à [s(B), s(B 0 )]. Donc s(B) et s(B 0 ) sont
voisins.
Réciproquement si s et s0 sont deux programmes de base voisins, il résulte du
s + s0
Lemme 5.1.7 que le milieu x = vérifie N (x) ⊂ N (s) ∩ N (s0 ), et que le
2
système de formes linéaires fi : y 7→ Ai y, i = 1, . . . , m, et e∗j : y 7→ yj , j ∈ N (x)
est de rang n − 1.
Par contre les systèmes {fi , i = 1, . . . , m; e∗j , j ∈ N (s)} et {fi , i = 1, . . . , m; e∗j , j ∈
N (s0 )} sont de rang n ; on peut donc trouver j0 ∈ N (s) \ N (x) et j00 ∈
N (s0 ) \ N (x) tels que les systèmes {fi , i = 1, . . . , m; e∗j , j ∈ N (x) ∪ {j0 }} et
{fi , i = 1, . . . , m; e∗j , j ∈ N (x) ∪ {j00 }} soient de rang n.
En raisonnant comme dans la preuve du Lemme 5.3.2, on en déduit que le
système de colonnes (Aj )j6∈N (x) n’est pas indépendant, mais qu’il le devient
dès qu’on lui enlève la j0 -ième colonne (ou la j00 -ième).
Complétons le système libre (Aj )j6∈N (x),j6=j0 en une base (Aj )j∈B de Rm . Alors
j0 6∈ B, j00 ∈ B et si B 0 est déduit de B en remplaçant j00 par j0 , le système
(Aj )j∈B 0 est aussi générateur, donc une base de Rm . Soient F et F 0 les com-
plémentaires de B et B 0 , on a F ⊂ N (x) ∪ {j0 } ⊂ N (s) et F 0 ⊂ N (x) ∪ {j00 } ⊂
N (s0 ).
Il en résulte que AB sB = As = b, AB 0 s0B 0 = As0 = b, d’où sB = A−1 B b,
s0B 0 = A−1B0 b, et finalement B, B 0 sont des éléments de B (voisins) et s = s(B),

s0 = s(B 0 ).

Dans le cas des arêtes infinies issues d’un programme de base, on a la paramé-
trisation suivante :
Lemme 5.3.9. Si a est une arête infinie issue du sommet s, il existe B ∈ B
paramétrisant  s et un élément j0 du complémentaire F de B tel que u =
−A−1 j0

A
B soit un vecteur directeur de a. Réciproquement pour tout B ∈ B
ej0
−1 j0
et tout j0 6∈ Btels que A B A ≤ 0, la demi-droite issue de s(B) de vecteur
−1 j0
−AB A
directeur u = est une arête de C.
e j0
78 CHAPITRE 5. PROGRAMMATION LINÉAIRE

Démonstration : Soit a une arête infinie issue de s, et x = s un point de a,


différent de s. Alors N (x) ⊂ N (s). Comme dans la preuve du lemme précédent,
le système de colonnes (Aj )j6∈N (x) est lié, mais on peut trouver j0 ∈ N (s)\N (x)
tel que le système (Aj )j6∈N (x),6=j0 soit libre. On complète ce sytème en une base
(Aj )j∈B de Rm . Alors j0 6∈ B. Comme le complémentaire F de B est inclus
dans N (s), on a s(B) = s.
D’autre part F \ {j0 } ⊂ N (x) ; donc xF = xj0 ej0 . Par ailleurs b = Ax =
AB xB + AxF = AB xB + xj0 Aj0 ; comme b = AB sB , on en déduit par différence
j0 −1 j0
que AB (xB  − sB ) = −x j0 A et donc xB − sB = −xj0 AB A . Finalement
−1 j0
−AB A
x − s = xj0 .
ej0
Réciproquement,  soient B ∈B tel que s(B) = s, et j0 6∈ B tels que A−1 j0
B A ≤ 0.
−1 j0
−AB A
Le vecteur u = est ≥ 0, et vérifie Au = 0, o, en déduit que pour
e j0
tout λ ≥ 0, le point x = s + λu est dans C.
Par ailleurs, uj = 0 pour tout j ∈ F \{j0 }. Donc u annule n−1 formes linéaires
indépendantes fi ,i = 1, . . . , m et Ej0 , j ∈ F \ {j0 }, qui correspondent toutes à
des contraintes actives en s (l’indépendance de ces formes découle du fait que
fi , i = 1, . . . , m et e∗j , j ∈ F forment une base de Rn ). D’après le Lemme 5.1.7,
la demi-droite de sommet s et de vecteur directeur u est une arête de C.

On déduit de cette étude du convexe C, le Test de la fonction objectif pour


résoudre (Ps ) :

Définition 5.3.10 (Vecteur test). Soit (B, F ) une partition de {1, . . . , n},
avec B ∈ B. On a pour tout programme admissible x :

f (x) = c.x = cB xB + cF xF
= cB (A−1
B (b − AF xF )) + cF xF
= cB A−1 −1
B b + (cF − cB AB AF )xF
= cB A−1
B b + tx = f (s(B)) + t(B)x

où le vecteur ligne t(B) = (0 | cF − cB A−1


B AF ) est appelé vecteur test.

Lemme 5.3.11. i) Si t(B) ≥ 0, le programme de base s(B) est optimal.


ii) S’il existe un indice ` tel que t(B)` < 0 et que A−1
B A ≤ 0, on a inf P = −∞.
`

Démonstration : i) Le calcul précédent montre que pour tout programme


admissible x, on a f (x) = f (s(B)) + t(B)x. Si t(B) ≥ 0, on a t(B)x ≥ 0, d’où
f (x) ≥ f (s(B)), et s(B) est un programme de base optimal.
5.4. L’ALGORITHME DU SIMPLEXE 79

−A−1 A`
 
−1 ` B
ii) SiAB A ≤ 0, alors u = est vecteur du cône asymptotique.
e`
En fait u dirige une arête infinie issue de s(B). Si t` > 0, on a f (u) = f (x +
u) − f (x) = t(B)u = t(B)` < 0. D’où inf P = −∞.

5.4 Application : l’algorithme du simplexe

Commençons par le passage d’un programme de base à un programme voisin :

A tout élément B de B on associe la matrice à (m+1) lignes et (n+1) colonnes


obtenue en bordant la matrice A−1 B A (dont les colonnes sont indexées par les
entiers 1, . . . , n et les lignes par les éléments de B) par une ligne et une colonne
supplémentaire (indexées par l’entier n + 1) :
 −1
AB A A−1

B b
M (B) =
t(B) d(B)

où l’on a posé d(B) = −cB A−1B b = −f (s(B)).


D’après la définition du vecteur test t(B), la valeur de la fonction objectif en
tout programme admissible x est f (x) = t(B)x − d(B).
Proposition 5.4.1. Soient B et B 0 deux éléments de B voisins. Supposons
qu’on passe de B à B 0 en enlevant k et ajoutant `. On passe alors de M (B)
à M (B 0 ) en pivotant autour de l’élément indexé par (k, `), c’est à dire par les
opérations élémentaires sur les lignes suivantes :
Pour la ligne de M (B 0 ) indexée par ` :
1
M (B 0 )` = M (B)k
(A−1 `
B A)k
Pour toutes les autres lignes, indexées par j ∈ B ∩ B 0 ou j = n + 1 :

0
(A−1 `
B A)j
M (B )j = M (B)j − M (B)k
(A−1 `
B A)k

Remarque 5.4.2. On a (A−1 ` −1


B A)k 6= 0. En effet la matrice AB AB 0 est régulière.
Les colonnes de cette matrice sont identifiées aux vecteurs de RB suivants :
(A−1 j 0 −1 k −1 k
P
B AB 0 ) = ej si j ∈ B ∩ B = B \ {k}, (AB AB 0 ) = j∈B (AB AB 0 )j ej . Ce
dernier vecteur n’est indépendant des précédents que si (A−1 `
B A)k 6= 0.
Démonstration : Considérons le système d’équations :
(
Ax = b
(I)
c.x = −ξ
80 CHAPITRE 5. PROGRAMMATION LINÉAIRE

où x ∈ Rn et ξ ∈ R. On sait que c.x = t(B)x − d(B) dès que Ax = b. Donc le


système (I) équivaut à
(
A−1 −1
B Ax = AB b
(II)
ξ + t(B)x = d(B)

Quand on remplace B par B 0 , on obtient un nouveau système équivalent :


(
A−1 −1
B 0 Ax = AB 0 b
(II 0 )
ξ + t(B 0 )x = d(B 0 )

Revenons au système (II) ; il s’écrit matriciellement :


 
 −1
 ξ  −1 
0 IB AB AF  AB b
xB =
1 0 t(B)F d(B))
xF

Quand on fait l’opération sur les lignes mentionnée dans l’énoncé, la colonne
correspondant à l’indice ` ne comporte plus que des 0, sauf sur la ligne nouvel-
lement indexée par `, anciennement par k, où le coefficient vaut 1. Autrement
dit on a obtenu un système équivalent de la forme :
 
  ξ  
0 IB 0 D  z
xB 0  =
1 0 t d
xF 0

après réarrangement des colonnes pour regrouper celles indexées par B 0 , où D


est une matrice à m lignes, (n − m) colonnes, t une matrice ligne (à (n − m)
colonnes), z une matrice colonne à m lignes et d un réel.
On a donc obtenu le système équivalent :
(
xB 0 + DxF 0 = z
(III)
ξ + txF 0 = d

Les systèmes II 0 et III ne peuvent être équivalents pour tous xB 0 , xF 0 et ξ que


si D = A−1 0 0 −1 0
B 0 AF , t = t(B )F , z = AB 0 b et d = d(B ).
0

Progression dans les programmes de base. Phase II.


On part d’une solution de base s(B), supposée trouvée dans une phase pré-
liminaire (Phase I). On dispose donc de la matrice A(B) = (AB )−1 A, du
programme de base s(B) = A−1B b, du vecteur test t(B), de la valeur d(B).
5.4. L’ALGORITHME DU SIMPLEXE 81

* Si le vecteur test est positif, le programme de base s(B) est optimal et la


valeur optimale de la fonction objectif est −d(B).
* Sinon, on examine les colonnes de A(B) correspondant aux indices ` pour
lesquelles la coordonnée t(B)` < 0.
** Si pour l’une de ces colonnes A(B)` ≤ 0, il n’y a pas de programme
optimal, et la valeur optimale de la fonction objectif est −∞.
** Sinon on choisit ` minimisant t(B)` . On choisit k tel que A(B)`k > 0,
s(B)k
et minimisant , et on pivote autour du coefficient (k, `).
A(B)`k
s(B)k
Le nouveau programme obtenu s0 a pour coordonnées : s0` = , et pour
A(B)`k
A(B)jk
j 6= ` : s0j = s(B)j − s(B)k Si A(B)jk ≤ 0, il est clair que s(B 0 )j ≥ 0 ;
A(B)`k
s(B)j s(B)k
sinon, d’après le choix de k, on a s(B 0 )j = A(B)`j [ − ] ≥ 0. Donc
A(B)`j A(B)`k
s0 est bien un programme admissible, c’est à dire que B 0 ∈ B et s0 = s(B 0 ) est
un nouveau programme de base.
La nouvelle valeur de la fonction objectif est :

s(B)k
f (s(B 0 )) = −d(B 0 ) = −d(B) + t`
A(B)`k

s(B)k
donc f (s(B 0 )) − f (s(B)) = t` ≤ 0
A(B)`k
Si s(B)k 6= 0 (en particulier si s(B) n’est pas dégénéré), on obtient bien
f (s(B 0 )) < f (s(B)). Si en revanche s(B)k = 0 alors en fait s(B 0 ) = s(B),
c’est à dire qu’on a obtenu une nouvelle paramétrisation du même programme
de base.
Néanmoins même dans ce cas on peut continuer l’algorithme : on parcourt
ainsi une suite de paramétrisations B 0 , B 00 , B 000 . . . de s = s(B).
Deux cas se présentent :
*** soit ces paramétrisations successives de s sont distinctes : alors,
puisque s a un nombre fini de paramétrisations, on finit par obtenir soit un
nouveau programme de base et donc diminuer strictement la fonction objectif,
soit par obtenir une arête infinie (d’où inf P = −∞).
*** soit on retombe sur une paramétrisation de s déjà obtenue : il y a
cyclage, l’algorithme boucle.
En l’absence de cyclage l’algorithme s’arrête en un nombre fini d’étapes et
donne un programme de base optimal (ou bien inf P = −∞).
82 CHAPITRE 5. PROGRAMMATION LINÉAIRE

On peut éviter théoriquement le cyclage en modifiant l’algorithme. Dans la


pratique ce phénomène n’intervient quasi jamais.

Détermination d’un programme de base initial. Phase I.


Lorsqu’il n’y a pas de programme de base évident pour le problème (Ps ), on
considère le problème linéaire auxiliaire :

minimiser g(x, y) = m n m
 P
(Paux ) i=1 yi , x ∈ R , y ∈ R
sous les contraintes Ax + y = b et x ≥ 0, y ≥ 0

Remarquons que, quitte à modifier la matrice A en multipliant certaines de ses


lignes par −1, on peut toujours écrire le problème (Ps ) de manière que b ≥ 0.
Dans ce cas le problème auxiliaire a un programme de base évident (0, b) ,
correspondant à la base B = (n+1, . . . , n+m), la sous-matrice correspondante
étant l’identité IB . On peut donc lui appliquer l’algorithme du simplexe et
obtenir un programme de base optimal (s, z).
Si z 6= 0 alors l’équation Ax = b n’a pas de solution, ce qui veut dire que le
problème (Ps ) n’admet aucun programme admissible.
Dans le cas contraire le programme de base optimal de (Paux ) ainsi obtenu est
de la forme (s, 0). Alors s est un programme de base pour (P), car les colonnes
de A correspondant aux coordonnées non nulles de s sont les mêmes que celle
de la matrice (A | Im ) correspondant aux coordonnées non nulles de (s, 0),
donc sont indépendantes.

5.5 Application : l’acquisition comprimée

Dans cette section nous esquissons (sans démonstrations) quelques techniques


d’acquisition comprimée, qui – sous certains conditions – permet de récupérer
un signal à partir d’un très petit nombre d’observations.
On considère un vecteur inconnu x ∈ E = Rn que on veut reconstruire en
effectuant des mesures linéaires : f1 (x), . . . , fm (x), où fi ∈ E 0 . Une approche
équivalente est de considèrer une matrice de mesure M à m lignes et n colonnes,
l’observation étant M x ∈ Rm .
Evidemment, dans le cas général, on a besoin n mesures pour récupérer x exac-
tement et on peut prendre comme (fi ) n’importe quelle base de E 0 . (Dans la
pratique, il pourrait être nécessaire d’augmenter un peu le nombre d’observa-
tions pour compenser des erreurs ou le bruit.) Cependant, ce nombre peut être
considérablement réduit si nous savons a priori que le vecteur x est parcimo-
nieux (ou éparse), c’est-à-dire que la plupart de coordonnées de x sont nulles.
Il est convenable de quantifier cette proprieté.
5.5. L’ACQUISITION COMPRIMÉE 83

Définition 5.5.1 (Parcimonie ou éparsité d’un vecteur). Pour x ∈ Rn (ou


pour x ∈ c00 ), notons par kxk0 le nombre de coordonnées de x qui sont non
nulles. Si kxk0 ≤ s, on dit que le vecteur x est s-parcimonieux ou s-éparse.
Proposition 5.5.2. Si n ≥ m ≥ 2s, alors il existe une matrice de mesure M
à m lignes et n colonnes telle que pour tout y ∈ Rm , le problème
(P)s x ∈ Rn , M x = y, kxk0 ≤ s
admet au plus une solution.
Démonstration : Supposons que rang M = m, M x0 = M x00 = y avec
kx0 k0 ≤ s et kx00 k0 ≤ s, et posons x = x0 − x00 . Alors x ∈ Ker M et kxk0 ≤ 2s ;
on veut montrer qu’il suit que x = 0. Notons que l’ensemble de de vecteurs
2s-parcimonieux dans Rn est contenu dans une réunion d’un nombre fini de
sous-espaces vectoriels de Rn de dimension 2s ≤ m chacun, tandis que Ker M
est de dimension n − m. Alors, génériquement, l’intersection de Ker M avec
tous ces espaces contient seulement le point 0, comme requis.
Malheureusement, l’algorithme suggéré  par Proposition 5.5.2 n’est pas pra-
tique : pour un entier s donné, on a ns des s-uplets de coordonnées à examiner.
Il se trouve qu’il y a un moyen simple d’éviter cette difficulté.
Théorème 5.5.3. Il existe une constante finie C > 0 tell que, pour tout s ≤ n,
il existent m ≤ Cs 1 + log(n/s) et une matrice de mesure M à m lignes et n
colonnes vérifiant la conclusion de la Proposition 5.5.2 et telle que, pour tout
y ∈ Rm , les deux problèmes de minimisation
(
minimiser f (x) = kxk0
(P 0)
sous les contraintes x ∈ Rn , M x = y
et (
minimiser g(x) = kxk1
(P 1)
sous les contraintes x ∈ Rn , M x = y
sont équivalents.
Par conséquent, si le problème M x = y admet une solution s-parcimonieuse,
cette solution est unique et peut être obtenue en résolvant le problème (P 1).
Le problème (P 1) appartient a priori dans le cadre d’optimisation convexe
(voir chapitres 7 et 8), mais on peut le facilement reformuler dans le language
de la programmation linéaire (Exercice !) :
 X
 minimiser h(u) = ui
(P) i
sous les contraintes u, x ∈ Rn , M x = y, −u ≤ x ≤ u

84 CHAPITRE 5. PROGRAMMATION LINÉAIRE

Remarque 5.5.4. Dans la pratique, on rencontre plusieurs complications. Pre-


mièrement, on peut avoir des erreurs dès mesure ou les solutions peuvent être
seulement “approximativement” parcimonieuse ; ces difficultés peuvent être sur-
monter en utilisant des versions “robustes” du Théorème 5.5.3 (voir Réfs [6],[7],
où une démonstration du Théorème peut être également trouvée). Deuxième-
ment, un aspect important des applications est d’identifier des bases dans les-
quelles les vecteurs intéressants sont parcimonieux ; cet aspect appartient au
domaine d’application ou à la modélisation plutôt qu’à l’analyse convexe.
Chapitre 6
Structure des convexes en dimension quelconque

6.1 Convexes dans l’espace de Hilbert

Soit H un espace de Hilbert réel, c’est à dire un espace vectoriel muni d’un
produitpscalaire (x, y) 7→ hx, yi, complet pour la norme hilbertienne associée
kxk = hx, xi. Comme dans le cas de la dimension finie, si x, y ∈ H, on pose
d(x, y) = kx − yk et pour toute partie A ⊂ H, d(x, A) = inf{d(x, y) / y ∈ A}.

Théorème 6.1.1 (Existence d’une solution optimale). Soit C un convexe


fermé de H, et f : H → R une fonction convexe sci. On suppose que C
est borné, ou bien que f (x) → +∞ quand kxk → +∞. Le problème de mini-
misation sous contrainte
Minimiser f (x) sous la contrainte x ∈ C
admet une solution optimale au moins. Si de plus la fonction f est strictement
convexe, cette solution optimale est unique.

Définition 6.1.2 (Solution optimale). Une solution optimale (d’un problème


de minimisation) est un point x0 ∈ C tel que

f (x0 ) = inf{f (x) / x ∈ C}

Remarque 6.1.3. Une fonction f définie sur un EVN (ou sur une partie non-
bornée d’un EVN) est dite coercive si limkxk→∞ f (x) = +∞. Le Théorème
6.1.1 dit alors qu’une fonction convexe sci coercive atteint son minimum sur
toute partie convexe fermé d’un espace de Hilbert.
La preuve s’appuie sur le théorème de l’intersection suivant :

Théorème 6.1.4. Dans un espace de Hilbert toute suite décroissante de convexes


fermés bornés non vides a une intersection non vide.

Démonstration : Soit Cn une suite décroissante de convexes fermés bornés


de l’espace de Hilbert H. La suite numérique d(0, Cn ) est croissante, majorée

85
86 CHAPITRE 6. CONVEXES EN DIMENSION QUELCONQUE

par le rayon R d’une boule de centre 0 contenant C1 , donc convergente. Soit d


sa limite. Pour tout n, soit xn ∈ Cn tel que kxn k ≤ d(0, Cn ) + 1/n. On utilise
l’égalité du parallélogramme :

∀u, v ∈ H, ku − vk2 + ku + vk2 = 2(kuk2 + kvk2 )

que l’on applique à u = xn et v = xm . On a pour tous n, m avec m ≤ n :

kxn − xm k2 = 2(kxn k2 +kym k2 )−kxn + xm k2 ≤ 2(kxn k2 +kxm k2 )−4d(0, Cm )2



xn + xm
car ≥ d(0, Cm ), puisque Cm contient xm et xn , donc aussi leur
2
milieu.
Comme les réels kxn k, kxm k et d(0, Cm ) ont même limite finie d lorsque n ≥
m → ∞, on voit que 2(kxn k2 + kxm k2 ) − 4d(0, Cm )2 → 0 lorsque n ≥ m → ∞,
et donc aussi kxn − xm k2 → 0. Donc la suite (xm ) est de Cauchy. Soit x sa
limite. Comme xn ∈ Cm pour tout n ≥ m, et que Cm est fermé, on a donc
x ∈ Cm , et ceci pour tout m.

Démonstration : (Preuve du Théorème 6.1.1) L’hypothèse entraîne que


pour tout a ∈ R, l’ensemble {x ∈ H / f (x) ≤ a} est borné. Soit m =
inf{f (x) / x ∈ C}, qui a priori peut valoir −∞. Soit (mn ) une suite de
réels mn > m, tendant vers m quand n → ∞. Pour tout n, posons Cn =
{x ∈ C / f (x) ≤ mn } : alors chaque Cn est un convexe fermé non vide, et
cette suite est décroissante. De plus ces convexes sont bornés. Il existe donc
un point x0 dans leur intersection. On doit avoir f (x0 ) ≤ mn pour tout n, et
donc f (x0 ) ≤ m et par conséquent f (x0 ) = m. Comme f est à valeur réelles,
ceci entraîne m > −∞.
L’ensemble des solutions {x ∈ C/f (x) ≤ m} est un convexe fermé non vide.
Si f est strictement convexe cet ensemble est réduit à un point en raison de
l’inéquation stricte :

 x + x  f (x ) + f (x )
1 2 1 2
x1 6= x2 =⇒ f <
2 2

Remarque 6.1.5. On seulement utilisé la quasi convexité de f , c’est à dire que


pour tout a ∈ R, l’ensemble Af,a = {x ∈ H / f (x) ≤ a} est convexe. On peut
aussi autoriser f à prendre les valeurs ±∞.
6.1. CONVEXES DANS L’ESPACE DE HILBERT 87

Voici maintenant le théorème fondamental de projection sur les convexes fer-


més, que l’on a déja vu en dimension finie au chapitre 2, Théorème 3.2.1 :
Théorème 6.1.6. Soit C un convexe fermé de H, et x un point de H. Il
existe un unique point y0 ∈ C réalisant la distance de C à x, c’est à dire tel
que d(x, y0 ) = d(x, C)). Ce point, appelé projection de x sur C, est caractérisé
par par la propriété

hx − y0 , y − y0 i ≤ 0 pour tout y ∈ C

Démonstration : Existence et unicité de la projection :


La fonction y → d(x, y) = kx − yk est convexe, par convexité de la norme,
et positive. Il s’ensuit que son carré est convexe. En appliquant l’égalité du
parallélogramme à u = x − x1 et v = x − x2 , on montre aisément que la
fonction y → d(x, y)2 est strictement convexe. On peut appliquer le Théorème
6.1.1 au convexe C et à la fonction y → d(x, y)2 .
La caractérisation de la projection se démontre comme en dimension finie, voir
3.2.1.

On en déduit la représentation des formes linéaires sur un espace de Hilbert :


Corollaire 6.1.7. Toute forme linéaire continue sur un espace de Hilbert H
est de la forme fx0 : x → hx0 , xi, où x0 est élément de H.
Démonstration : Soit f : H → R une forme linéaire continue non nulle,
et H l’hyperplan affine d’équation f (x) = 1. Soit x0 la projection de 0 sur H.
Alors hx0 , x − x0 i = 0 pour tout x ∈ H ; c’est à dire que f (x) = 1 entraîne
hx0 , xi = hx0 , xi = kx0 k2 . Par linéarité de f et fx0 on en déduit fx0 = kx0 k2 f ,
donc f = afx0 = fax0 avec a = kx0 k−2 .
Remarque 6.1.8. Il résulte du corollaire précédent que l’on peut identifier le
dual H0 de H à l’espace H lui même.
De manière plus précise on a une application linéaire naturelle H → H0 , x 7→
fx , qui est surjective d’après le corollaire précédent. On a |fx (y)| ≤ kxk kyk,
d’après l’inégalité de Cauchy-Schwartz, donc kfx k ≤ kxk ; l’égalité fx (x) =
kxk2 montre qu’en fait kfx k = kxk ; donc l’application x → fx est une isométrie
linéaire et bijective.

Grâce à ces résultats, les théorèmes que nous avons vus dans le cadre des EVN
de dimension finie au chapître 2 ont un analogue dans le cadre hilbertien :
Théorème 6.1.9 (Séparation dans un espace de Hilbert #1). Si C est un
convexe fermé non vide d’un espace de Hilbert H et x0 un point de H n’ap-
partenant pas à C il existe un hyperplan affine H séparant strictement x0 de
88 CHAPITRE 6. CONVEXES EN DIMENSION QUELCONQUE

C ; c’est à dire que C et x0 sont inclus chacun dans un demi-espace ouvert


différent défini par H. En particulier C est inclus dans l’un des demi-espaces
affines associés à H.

Démonstration : C’est la même qu’en dimension finie, voir 3.2.2.


Remarque 6.1.10. Il revient au même de dire que si x0 n’appartient pas au
convexe fermé C, il existe une forme linéaire f sur H telle que supx∈C f (x) <
f (x0 ) ou encore qu’il existe u ∈ H tel que supx∈C hu, xi < hu, x0 i.
Le deuxième théorème de séparation pour des convexes quelconques en dimen-
sion finie (3.2.4) admet l’analogue suivant pour des convexes ouverts dans les
espaces de Hilbert :

Théorème 6.1.11 (Séparation dans un espace de Hilbert #2). Si C est un


convexe ouvert d’un espace de Hilbert H et x0 un point de H n’appartenant pas
à C, il existe un hyperplan affine H de H, contenant x0 et disjoint de C. De
plus C est inclus dans l’un des demi-espaces affines associés à H.

Démonstration : a) Cas où H est séparable.


Dans ce cas il existe une suite croissante de sous-espaces vectoriels de dimension
finie En , contenant x0 dont la réunion est dense dans H . Pour tout n posons :
Cn = C ∩ En : c’est un convexe ouvert de En , ne contenant pas x0 .
S
On a Cn 6= ∅ pour n assez grand, par densité de En , on peut donc supposer
n
C1 6= ∅.
On construit alors une suite de sous-espaces affines Hn , tels que H0 = {x0 } et
que pour tout n ≥ 1 :
i) Hn est un hyperplan affine de En contenant Hn−1 ;
ii) Hn ne rencontre pas C.
Pour trouver H1 , on applique le Théorème 3.2.4 en dimension finie à x0 et C1 .
Supposons avoir construit Hn . En appliquant le Théorème 3.2.8 en dimension
finie à Hn et Cn+1 , considérés dans l’espace de dimension finie En+1 , on obtient
un hyperplan affine Hn+1 de En+1 , contenant Hn et disjoint de Cn+1 , donc de
C.
Posons L = Hn et H = L. C’est un sous-espace affine de H , qui contient
S
n
x0 . H est disjoint de C car le complémentaire de C est fermé et contient L,
donc son adhérence H.
Montrons que H est un hyperplan affine de H , ce qui démontrera le théorème :
Par translation, on peut supposer que x0 = 0, de sorte que H est un sous-
espace vectoriel de H . Fixons y0 ∈ C1 et considérons Ĥ = H ⊕ Ry0 . Il s’agit
de montrer que Ĥ = H .
6.1. CONVEXES DANS L’ESPACE DE HILBERT 89

On a Ĥ ⊃ Hn ⊕ Ry0 = En , puisque Hn est un hyperplan de En ne contenant


pas y0 , donc Ĥ, contenant la réunion des En , est dense dans E. Il suffit donc
de montrer que Ĥ est fermé.
Or si x ∈ H est limite d’une suite (xk + ρk y0 )k de points de Ĥ, on a :

d(xk + ρk y0 , H) = d(ρk y0 , H) = |ρk | d(y0 , H)

et comme le membre de gauche tend vers d(x, H), et que d(y0 , H) 6= 0, on a


|ρk | → d(x, H)/d(y0 , H). Quitte à extraire une sous-suite, on peut supposer les
ρk de signe constant, donc convergeant vers ρ = ±d(x, H)/d(y0 , H). Alors la
suite xk converge vers y = x − ρy0 , qui doit appartenir à H (car H est fermé).
Donc x = y + ρy0 ∈ H ⊕ Rx0 = Ĥ.
b) Cas général.
Le cas général peut se démontrer de manière analogue au cas séparable ci-
dessus par un argument de récurrence transfinie sur le caractère de densité de
H , c’est à dire le plus petit cardinal d’une partie dense dans H . Pour un
espace séparable le caractère de densité est ℵ0 , le cardinal de N, qui est aussi
le premier cardinal infini.

Corollaire 6.1.12 (Théorème de Hahn-Banach géométrique dans les espaces


de Hilbert). Soient C1 et C2 deux convexes non vides et disjoints de l’es-
pace vectoriel de Hilbert H. On suppose que C1 est ouvert. Il existe alors
un hyperplan affine H séparant strictement C1 de C2 . Plus précisément il
existe une forme linéaire f sur H et un réel a tels que ∀x1 ∈ C1 , ∀x2 ∈ C2 ,
f (x1 ) < a ≤ f (x2 ).

Démonstration : On remarque d’abord que le convexe C1 − C2 est ouvert,


comme réunion des convexes ouverts C1 − z, z ∈ C2 . Comme en dimension
finie, on applique alors le Théorème 6.1.11 au point 0 et au convexe ouvert non
vide C1 −C2 = {y −z / y ∈ C1 , z ∈ C2 }. D’où il existe f forme linéaire telle que
∀y ∈ C1 , z ∈ C2 , f (y − z) < f (0) = 0 ; on en déduit, en notant a = inf f (z)
z∈C2
que ∀x1 ∈ C1 , ∀x2 ∈ C2 , f (x1 ) ≤ a ≤ f (x2 ). La première inéquation signifie
que C1 est inclus dans le demi-espace f (x) ≤ a ; comme C1 est ouvert, il est en
fait inclus dans l’intérieur du demi-espace, c’est à dire le demi-espace ouvert
f (x) < a.

Corollaire 6.1.13. Par tout point non intérieur d’un convexe d’intérieur non
vide de H il passe un hyperplan d’appui.

Démonstration : Comme le convexe C est d’intérieur non vide c’est une


o
conséquence directe du Théorème 6.1.11 appliqué à C.
90 CHAPITRE 6. CONVEXES EN DIMENSION QUELCONQUE

Corollaire 6.1.14. Tout convexe fermé C d’intérieur non vide distinct de


l’espace entier est intersection des demi-espaces fermés qui le contiennent et
qui sont associés à des hyperplans d’appui.

Démonstration : Soit C1 l’intersection des demi-espaces fermés contenant


C associés à des hyperplans d’appui. Alors, C ⊂ C1 . Il suffit donc de montrer
l’autre inclusion.
Soit x0 ∈ C1 n’appartenant pas à C, et y0 un point intérieur à C. Alors
l’intersection du segment [y0 , x0 ] avec C est un segment [y0 , z0 ] ; le point z0
n’est pas intérieur à C puisqu’on peut l’approcher par des points de ]z0 , x0 ].
o
Soit H un hyperplan d’appui de C passant par z0 et disjoint de C (Corollaire
6.1.13), et D un demi-espace associé contenant C. Le demi-espace D ne peut
contenir x0 : en effet y0 est intérieur à C, donc à D ; si x0 est dans D, alors le
point z0 ∈]y0 , x0 [ doit aussi être intérieur à D ; ce qui contredit z0 ∈ H . Donc
x0 ∈
/ C1 ce qui est une contradiction.

En dimension finie, les ensembles compacts sont exactement les ensembles fer-
més bornés (voir Chapître 1).
En dimension quelconque, cela n’est plus vrai, même dans les espaces de Hil-
bert : en effet la boule unité fermée d’un EVN qui n’est pas de dimension
finie est fermée bornée mais non compacte à cause du théorème de F. Riecz
qui affirme qu’un EVN est de dimension finie si et seulement si sa boule unité
fermée est compacte, 8.6.8.
Cependant, dans les espaces de Hilbert, on peut démontrer des analogues
des théorèmes concernant les convexes compacts en dimension finie pour les
convexes fermés bornés.
Ceci ne sera plus vrai pour des EVN quelconques où il faudra l’hypothèse plus
forte de compacité.

Proposition 6.1.15. Soit C un convexe fermé borné d’un espace de Hilbert.


Pour tout hyperplan vectoriel fermé V de H il existe un hyperplan d’appui
fermé de C parallèle à V .

Démonstration : La preuve est analogue à celle de la Proposition 3.4.3


et du corollaire 3.4.2. On invoque le Théorème 6.1.1 au lieu de la compacité
pour assurer qu’une forme linéaire continue f atteint son minimum sur C. En
fait, comme −f est aussi linéaire et inf C (−f ) = − supC f , cette forme linéaire
atteint aussi son maximum sur C. Le reste de la preuve est inchangé.

Proposition 6.1.16. Dans un espace de Hilbert H, tout convexe fermé borné


C possède au moins un point extrémal.
6.1. CONVEXES DANS L’ESPACE DE HILBERT 91

Démonstration : Donnons la preuve dans le cas où H est séparable, c’est à


dire où il contient une suite partout dense (un )n≥1 . On construit par récurrence
une suite décroissante de convexes fermés (Fn )n≥0 de la manière suivante :
F0 = C, et 
Fn+1 = x ∈ Fn / hun , xi = inf hun , yi
y∈Fn

Alors Fn+1 est non vide et l’hyperplan Hn = x ∈ H / hun , xi = inf y∈Fn hun , yi


est un hyperplan d’appui de Fn .


Donc Fn+1 est une face fermée de Fn . D’après le Lemme 1.4.11, on voit par
récurrence que Fn est une face de C lui-même. D’après le Théorème 6.1.4,
l’intersection des Fn est non vide ; c’est une face F de C.
Il reste à remarquer que cette face n’a qu’un seul élément, qui est donc un point
extrémal de C. Or supposons que x1 , x2 ∈ F . En particulier x1 , x2 ∈ Fn+1
pour tout n, et par conséquent hun , x1 i = hun , x2 i (= inf y∈Fn hun , yi). Par
conséquent x1 − x2 est orthogonal à tous les un , donc, par densité, à H tout
entier. Ceci entraîne x1 − x2 = 0.
Remarque 6.1.17. Cas non séparable.
Dans le cas non séparable on commence par étendre le Théorème 6.1.1 au cas d’
une famille, non nécessairement dénombrable, totalement ordonnée de convexe
fermés bornés non vides ; on considère ensuite la famille F des faces fermées
de C. Pour l’inclusion, cet ensemble est inductif, c’est à dire que pour toute
famille totalement ordonnée (Fα ) d’éléments de F il existe un élément de F
inclus dans tous les Fα , qui n’est autre que leur intersection.
D’après le théorème de Zorn, F possède des éléments minimaux. Soit F un
tel élément minimal, il suffit de montrer que cette face de C n’a qu’un seul
élément.
Or si x1 , x2 sont deux éléments distincts de F , la forme linéaire f (x) = hx1 −
x2 , xi prend au moins deux valeurs distinctes sur F (puisque f (x1 ) − f (x2 ) =
kx1 − x2 k2 6= 0). Soient m et M le minimum et le maximum de f sur F . Les
hyperplans d’appui de F correspondants, d’équations {x ∈ E , f (x) = m} et
{x ∈ E , f (x) = M }, définissent deux faces fermées F1 , F2 de F disjointes,
qui sont aussi des faces de C d’après 1.4.11.
Donc F n’est pas un élément minimal de F, il y a contradiction.

Théorème 6.1.18 (Krein-Milman, cas Hilbertien). Dans un espace de Hil-


bert H, tout convexe fermé borné est l’enveloppe convexe fermée de ses points
extrémaux.

Démonstration : Soit C un convexe fermé borné de l’espace de Hilbert


H, et L = convExt C l’enveloppe convexe fermée de l’ensemble de ses points
extrémaux. Il est clair que L ⊂ C.
92 CHAPITRE 6. CONVEXES EN DIMENSION QUELCONQUE

Supposons que L 6= C, il existe donc x ∈ C \ L. Soit H un hyperplan séparant


strictement x et L ; Soit H1 celui des hyperplans d’appui de C parallèles à H et
situé du même côté que x ; alors F = H1 ∩ C est une face de C disjointe de L.
F est aussi un convexe fermé borné de H, donc possède un point extrémal qui
est aussi un point extrémal de C d’après 1.4.11 , et qui doit donc appartenir à
L. Il y a donc contradiction.
Corollaire 6.1.19. Soit C un convexe fermé borné d’un espace de Hilbert, et
f : C → R une fonction convexe semi-continue inférieurement. On a

sup f (x) = sup f (x)


x∈C x∈Ext C

En particulier si C est compact et f continue, f atteint son maximum en un


point de Ext C.
Démonstration : Soit M = supx∈Ext C f (x) (Ce nombre peut être +∞).
Si x ∈ convExt C, cet élémentP est combinaison convexe d’une famille finie de
points xi ∈ Ext C : soit x = i λi xi . D’où
X X
f (x) ≤ λi f (xi ) ≤ M λi = M
i i

L’ensemble {x ∈ C / f (x) ≤ M } contient donc convExt C ; comme il est fermé,


il contient en fait convExt C = C. D’où l’égalité.
Par ailleurs si C est compact, il en est de même de Ext C et si f est continue
elle atteint son maximum sur ce compact.

Dans les espaces de Hilbert qui ne sont pas de dimension finie, la notion d’in-
térieur relatif n’a pas d’intérêt car la Proposition 3.1.1, qui est essentielle dans
l’utilisation de cette notion n’a pas d’analogue : en effet, si (en )n∈N est une
base orthonormée d’un espace de Hilbert séparable, l’enveloppe convexe fer-
eN
mée conv{ , n ∈ N} est compacte donc ne contient pas de boule mais par
n
contre, elle engendre l’espace tout entier.
La décomposition des convexes fermés non vides de dimension finie n’a pas non
plus d’analogue bien que certains résultats perdurent, en utilisant la conver-
gence faible.

6.2 Convexes dans les espaces vectoriels normés

Soit E un EVN de dimension quelconque. Contrairement aux espaces de di-


mension finie ou aux espaces de Hilbert, on n’a pas de théorème de projection
sur les convexes fermés ni même sur les sous-espaces vectoriels fermés.
6.2. CONVEXES DANS LES EVNS 93

On est donc amené à démontrer d’abord le théorème de séparation pour les


convexes ouverts :

Théorème 6.2.1 (Séparation, cas EVN #1). Soit E un espace vectoriel normé,
C un convexe ouvert de E et x0 un point de E n’appartenant pas à C. Il existe
un hyperplan affine fermé passant par x0 , ne rencontrant pas C. Il revient
au même de dire qu’il existe une forme linéaire continue f sur E telle que
∀x ∈ C, f (x) < f (x0 ).

Démonstration : La démonstration est identique à celle des espaces de


Hilbert (voir Théorème 6.1.11).

Les corollaires qui suivent se déduisent du théorème comme dens les cas pré-
cédents de la dimension finie et des espaces de Hilbert.

Corollaire 6.2.2 (Théorème de Hahn-Banach géométrique). Soient C1 et C2


deux convexes non vides de l’espace vectoriel normé E. On suppose C1 ouvert et
disjoint de C2 . Il existe alors un hyperplan affine fermé H séparant strictement
C1 de C2 . Plus précisément il existe une forme linéaire continue f sur E et un
réel a tels que ∀x1 ∈ C1 , ∀x2 ∈ C2 , f (x1 ) < a ≤ f (x2 ).

Corollaire 6.2.3. Par tout point non intérieur d’un convexe C d’intérieur
non vide de E il passe un hyperplan d’appui.

Démonstration : Comme le convexe C est d’intérieur non vide c’est une


o
conséquence directe du Théorème 6.2.1 appliqué à C.

Corollaire 6.2.4. Soit E un espace vectoriel normé. Pour tout point x de E


il existe une forme linéaire continue f de norme 1 qui norme x, c’est à dire
telle que f (x) = kxk.

Démonstration : Supposons par exemple kxk = 1. Alors on peut séparer le


point x de la boule ouverte B(0, 1). Il existe donc une forme linéaire continue
g telle que ∀y ∈ B(0, 1), g(y) ≤ g(x). En particulier puisque 0 ∈ B(0, 1), on
obtient 0 < g(x). Alors f = g/g(x) vérifie f (x) = 1 et supy∈B(0,1) f (y) ≤
f (x) = 1 ; cette dernière condition signifie kf k ≤ 1. L’inégalité inverse résulte
de 1 = f (x) ≤ kf k kxk = kf k.

Corollaire 6.2.5. Si E est un espace vectoriel normé séparable, il existe une


suite (fn ) de formes linéaires continues de norme 1 qui est normante, c’est-à-
dire que pour tout x ∈ E on a kxk = supn fn (x).

Démonstration : Soit xn une suite dense dans E, et pout tout n soit fn


une forme linéaire continue de norme 1 telle que fn (xn ) = kxn k (Corollaire
94 CHAPITRE 6. CONVEXES EN DIMENSION QUELCONQUE

6.2.4). Pour tout x ∈ E, et tout ε > 0, il existe n tel que kx − xn k ≤ ε ;


alors |kxk − kxn k| ≤ ε et |fn (x) − fn (xn )| ≤ kfn k kx − xn k ≤ ε. D’où fn (x) ≥
kxk − 2ε, et ceci montre que kxk ≤ supk fk (x). L’inégalité inverse est toujours
vraie.
Remarque 6.2.6. La suite (fn ) est alors séparante, c’est à dire que si x, y ∈ E
vérifient fn (x) = fn (y) pour tout n, on a x = y.

Le théorème de séparation d’un point et d’un convexe fermé se déduit alors du


théorème 6.2.1 :
Théorème 6.2.7 (Séparation, cas EVN #2). Soit C un convexe fermé de
l’espace vectoriel normé E. Pour tout point x0 ∈ E n’appartenant pas à C il
existe un hyperplan affine fermé H séparant strictement x de C ; il revient au
même de dire qu’il existe une forme linéaire continue f telle que supx∈C f (x) <
f (x0 ).
Démonstration : La distance r = d(x0 , C) est non nulle. Alors Cr = {y ∈
E / d(y, C) < r} est un convexe ouvert ne contenant pas x. Soit f une forme
linéaire continue telle que ∀y ∈ Cr , f (y) < f (x0 ). On a donc pour tout x ∈ C et
h ∈ B(0, r), f (x) + f (h) = f (x + h) < f (x0 ) ; d’où f (x0 ) ≥ suph∈B(0,r) (f (x) +
f (h)) = f (x) + r kf k et finalement f (x0 ) ≥ supx∈C f (x) + r kf k.
Corollaire 6.2.8. Soit E espace vectoriel normé. Tout convexe fermé de E,
différent de E, est l’intersection des demi-espaces fermés qui le contiennent.
Démonstration : Comme le convexe C considéré est différent de E, le
Théorème 6.2.7 appliqué à un point x0 6∈ C montre qu’il existe effectivement
des demi-espaces fermés contenant E. Soit D l’intersection des demi-espaces
fermés contenant C. Il est clair que D contient C ; le Théorème 6.2.7 montre
que D ne contient aucun point n’appartenant pas à C.
Proposition 6.2.9. Si C est un convexe fermé d’intérieur non vide, alors, C
est l’intersection des demi-espaces le contenant déterminés par ses hyperplans
d’appui.
Démonstration : Il suffit de montrer que tout point x n’appartenant pas
à C peut être séparé strictement de C par un hyperplan d’appui de C. Or
soit x0 un point intérieur à C. L’intersection du segment fermé [x0 , x] avec C
est un sous-segment fermé [x0 , y], et y n’est pas intérieur à C, puisqu’on peut
l’approcher par les points de ]y, x] qui ne sont pas dans C. Soit H un hyperplan
d’appui de C en y. Comme y appartient à H et x0 appartient au demi-espace
o
ouvert défini par H contenant C, x appartient à l’autre demi-espace ouvert.
6.2. CONVEXES DANS LES EVNS 95

Comme on l’a déja remarqué au paragraphe précédent, dans les EVN quel-
conques, on a besoin d’une hypothèse supplémentaire, la compacité du convexe,
pour obtenir des résultats analogues à ceux des espaces de Hilbert (ou de di-
mension finie) pour les convexes fermés bornés.
Proposition 6.2.10. Soit K est un convexe compact d’un espace vectoriel
normé E. Pour tout hyperplan vectoriel fermé V de E il existe un hyperplan
d’appui fermé de K parallèle à V .
Démonstration : La démonstration est analogue à celle du cas de la di-
mension finie, Proposition 3.4.3.
Remarque 6.2.11. En fait, on voit que soit K est inclus dans un hyperplan
parallèle à V , soit il est inclus dans une bande définie par deux hyperplans
d’appui parallèles à V .

On va maintenant pouvoir démontrer le théorème de Krein-Milman, avec la


proposition suivante :
Proposition 6.2.12. Dans un espace vectoriel normé, tout convexe compact
possède au moins un point extrémal.
Démonstration : Soit K un convexe compact de l’espace vectoriel E. Par
définition de la compacité, Spour tout N il existe un ensemble fini AN de
points de K tels que K ⊂ a∈AN B(a, 1/N ). Il en résulte facilement que K
contient une suite (xn ) dense dans lui-même. Alors K est inclus dans un sous-
espace vectoriel normé F de E séparable (voir Définition 2.1.43), par exemple
Vect{xn / n ≥ 1}. On peut donc supposer E lui même séparable.
D’après le Corollaire 6.2.5, on peut trouver une suite (fn ) de formes linéaires
continues de normes 1, qui est normante, donc séparante. Posons pour tout
x∈E : X
F (x) = 2−n fn (x)2
n
Alors la fonction F est convexe, comme somme de fonctions convexes car le
carré d’une forme linéaire est convexe. Cette fonction est en fait strictement
convexe, car si x 6= y, il existe n0 tel que fn0 (x) 6= fn0 (y), d’où fn0 ((x+y)/2)2 <
(fn0 (x)2 + fn0 (y)2 )/2 (puisque la fonction t 7→ t2 est strictement convexe).
Pour n 6= n0 on a l’inégalité large fn ((x + y)/2)2 ≤ (fn (x)2 + fn (y)2 )/2, d’où
l’inégalité stricte F ((x + y)/2) < (F (x) + F (y))/2.
Par ailleurs la fonction F est continue sur E à cause de la convergence uniforme
de la série sur toute boule B(0, R) ; cette fonction atteint donc son maximum
sur le compact K. D’après la Proposition 1.5.5, ce maximum est atteint en un
point extrémal de K.
96 CHAPITRE 6. CONVEXES EN DIMENSION QUELCONQUE

Théorème 6.2.13 (Krein-Milman, cas EVN). Dans un espace vectoriel normé,


tout convexe compact est l’enveloppe convexe fermée de ses points extrémaux.

Démonstration : C’est la même que dans les expaces de Hilbert, 6.1.18, en


utilisant la Proposition 6.2.12.

Corollaire 6.2.14. Soit K un convexe compact d’un espace vectoriel normé,


et f : K → R une fonction convexe semi-continue inférieurement. On a

sup f (x) = sup f (x)


x∈K x∈Ext K

En particulier si la fonction f est continue, elle atteint son maximum en un


point de Ext K.

Remarque 6.2.15. Ce résultat est souvent utilisé sous la forme suivante : pour
majorer la fonction f sur K, il suffit de la majorer sur Ext K.
Démonstration : C’est la même que pour les espaces de Hilbert, (6.1.19).

6.3 Une application : le théorème de Lyapounov

Définition 6.3.1 (Sous-espace facial d’un convexe). Soit C un convexe d’un


espace vectoriel E, et x un point de C. Le sous-espace facial de x (relatif à C)
est
WC (x) = {u ∈ E/ ∃ε > 0 tel que x ± εu ∈ C}

Autrement dit, u ∈ WC (x) si et seulement si u = 0 ou il existe un segment de


direction u, de milieu x et inclus dans C. C’est un sous-espace vectoriel de E :
WC (x) est clairement convexe et stable par les multiplications par les réels.
Remarque 6.3.2. 1) Le point x est extrémal si et seulement si WC (x) = (0).
2) Soit ΓC (x) le cône engendré par C − x. Alors WC (x) = ΓC (x) ∩ (−ΓC (x)).

Exercice 6.1. L’intersection (x + WC (x)) ∩ C est une face de C : c’est la plus


petite face de C contenant x.

Lemme 6.3.3. Soit K un convexe compact d’un EVN E (resp. un convexe


fermé borné d’un espace de Hilbert). Soit T : E → Rn une application affine
continue. Alors pour tout y dans le convexe C = T (K) il existe un point x ∈ K,
tel que T x = y, et dim WK (x) ≤ dim WC (y).

Démonstration : Une application affine est une composée τx0 ◦T0 , où T0


est linéaire et τx0 la translation de vecteur x0 . Il est alors facile de voir que
T0 (WK (x)) ⊂ WC (T x)). D’après le théorème de Krein-Milman, le convexe
6.3. THÉORÈME DE LYAPOUNOV 97

compact (resp. le convexe fermé) T −1 (y) ∩ K admet un point extrémal x.


Dans ce cas, la restriction de T0 à WC (x) est injective (et la conclusion sur les
dimensions en résulte). En effet si u ∈ WC (x) vérifie T0 u = 0, et si x ± εu ∈ K,
alors T (x ± εu) = T (x) = y, i. e. x ± εu ∈ T −1 (y) ∩ K. Comme x est extrémal
dans T −1 (y) ∩ K, il en résulte u = 0.

Etant donné un espace mesuré (Ω, A, µ), on considère l’espace de Banach


L∞ (Ω, A, µ) des (classes de) fonctions µ-mesurables bornées sur Ω, muni de la
norme kf k∞ = Ess supω∈Ω |f (ω)|.

Rappelons qu’une mesure positive µ sur un espace (Ω, A) est dite non-atomique
(ou diffuse) si tout ensemble A ∈ A de mesure µ(A) > 0 contient un ensemble
B ∈ A dont la mesure vérifie 0 < µ(B) < µ(A).
Lemme 6.3.4. Soit (Ω, A, µ) un espace mesuré. Les points extrémaux de la
boule-unité fermée B de l’espace L∞ (Ω, A, µ) sont les éléments de valeur ab-
solue IΩ . Si la mesure est non-atomique, alors pour tout point non extrémal f
de B l’espace WC (x) est de dimension infinie.

Démonstration : a) Si f ∈ B vérifie |f | = IΩ , on a f = IA −IAc (Ac désigne


g+h
le complémentaire de A) et si f = avec g, h ∈ B, alors IA .g ≤ IA ,
2
IA .h ≤ IA et IA .[(g + h)/2] = IA entraînent les égalités IA .g = IA .h = IA .
De même IAc .g = IAc .h = −IAc , et par conséquent g = h = f . Donc f est
extrémal.

Inversement si |f | 6= IΩ , posons u = IΩ − |f |. On a 0 ≤ u ≤ IΩ , u 6= 0, et
|f ± u| ≤ |f | + u = IΩ , c’est à dire kf ± uk ≤ 1. Donc f n’est pas extrémale.

b) Supposons maintenant µ non-atomique. Soit f ∈ B non extrémale, et comme


ci-dessus u = IΩ − |f |. Alors f ± v ∈ B ssi |v| ≤ u. Il revient au même de dire
que v = h.u avec h ∈ B. Il en résulte que v ∈ B(f ) si et seulement si v = h.u,
avec h ∈ L∞ (Ω, A, µ). Soit S le support de u, c’est à dire IS .u = u et IS c .u = 0.
Notons L∞ (S) le sous-espace de L∞ (Ω, A, µ) formé par les éléments à support
inclus dans S. Alors l’application h → h.u est un isomorphisme linéaire de
L∞ (S) sur W (f ). Mais comme µ est non-atomique, l’espace L∞ (S) est de
B
dimension infinie, pour tout S ∈ A de µ-mesure non nulle. En effet on peut
construire une suite infinie d’éléments (Sk )k de A inclus dans S et deux à deux
disjoints, et la suite (ISk )k est alors linéairement indépendante.
Théorème 6.3.5 (Lyapounov). Soit (Ω, A, µ) un espace mesuré, la mesure µ
étant non-atomique σ-finie. Soient f1 , . . . , fn des éléments de L1 (Ω, A, µ) fixés.
98 CHAPITRE 6. CONVEXES EN DIMENSION QUELCONQUE

Alors l’ensemble :
R(f1 , . . . , fn ) := {( A fi dµ)ni=1 / A ∈ A}
R

est un convexe compact de Rn .

Remarque 6.3.6. Quand n = 1 et f1 = IA le théorème dit que pour tout


t ∈ [0, µ(A)] il existe B ⊂ A avec µ(B) = t ; c’est une propriété bien connue
des mesures diffuses.
Démonstration : Quitte à rempacer la mesure µ par µ1 = sup1≤i≤n |fi | .µ,
et fi par fi / supi |fi |, on peut supposer que |fi | ≤ 1, pour i = 1, . . . , n, et que
la mesure µ est une probabilité.
On considère le convexe K = g ∈ L2 (Ω, A, µ)/ 0 ≤ g ≤ I , qui est fermé

borné dans L2 (Ω, A, R µ) et l’application linéaire continue T : L2 (Ω, A, µ) → Rn


définie par T g = ( Ω g.fi dµ)ni=1 .
Alors C = T (K), image de K par l’application linéaire T , est un convexe borné
qui contient l’ensemble R(f1 , . . . , fn ) puisque chaque caractéristique χA d’un
ensemble A ∈ A est dans K.
Montrons d’abord que C est fermé, doncR compact dans Rn . Si (a1 , . . . , an ) ∈ C,
il existe une suite (g` ) de K telle que R Ω g` .fi → ai quand ` → ∞, pour tout
i = 1, . . . , n. Soit Γk = {g ∈ K / Ω g.fi − ai ≤ 1/k, i = 1, . . . R, n}. Les Γk
sont des convexes fermés bornés de L2 car les applications g → Ω g.fi − ai
étant convexes continues de L2 dans R, non vides car Γk contient g` pour
` assez grand, et la suite (Γk ) est décroissante. R D’après le Théorème 6.1.4,
les Γk ont un point commun g, qui vérifie Ω g.fi = ai , i = 1, . . . , n. Donc
(a1 , . . . , an ) ∈ C et C est fermé.
Montrons maintenant que C = R(f1 , . . . , fn ). Pour tout y ∈ C, il existe d’après
le Lemme 6.3.3 un point x de K tel que dim WK (x) ≤ dim WC (y), donc
WK (x) est de dimension finie. Comme B est image de K par la bijection affine
z → 2z − IΩ , on en déduit que pour z = 2x − 1 l’espace facial W (z) est de
B

dimension finie. D’après le Lemme 6.3.4, z est un point extrémal de B, c’est à


dire de la forme IA − IAc . Alors x = (IΩ + z)/2 = IA .
Chapitre 7
Régularité des fonctions Convexes

7.1 Convexité et continuité

Dans ce qui suit, E est un espace vectoriel normé quelconque.


Proposition 7.1.1 (Continuité des fonctions convexes). Soit f : E → R ∪
{+∞} une fonction convexe, et x0 un point intérieur à domf . Si f est bornée
supérieurement au voisinage de x0 , elle est continue, et même lipschitzienne,
au voisinage de x0 .
Démonstration : a) Montrons d’abord la continuité de f en x0 .
Soit r0 > 0 tel que f (x) ≤ M pour tout x dans la boule fermée B(x0 , r0 ). Pour
r0
tout x ∈ B(x0 , r0 ) définissons y tel que y − x0 = (x − x0 ) et posons
kx − x0 k
kx − x0 k
λ= , alors y ∈ B(x0 , r0 ), λ ∈ [0, 1] et on a par convexité :
r0

f (x)−f (x0 ) = f (λy+(1−λ)x0 )−f (x0 ) ≤ λf (y)+(1−λ)f (x0 )−f (x0 ) = λ f (y)−f (x0 )
 kx − x0 k 
≤ λ M − f (x0 ) = M − f (x0 )
r0
x+z
Par ailleurs, posons z = x0 − (x − x0 ). Alors, z ∈ B(x0 , r0 ) et x0 = . On
2
a donc :
x+z 1
f (x0 ) = f ( ) ≤ (f (x) + f (z))
2 2
soit encore : 
f (z) − f (x0 ) ≥ − f (x) − f (x0 )
Il en résulte, en appliquant l’inégalité précédente à z :
kx − x0 k  kz − x0 k  
M −f (x0 ) = M −f (x0 ) ≥ f (z)−f (x0 ) ≥ − f (x)−f (x0 )
r0 r0

99
100 CHAPITRE 7. RÉGULARITÉ DES FONCTIONS CONVEXES

et finalement pour x ∈ B(0, r0 ), on a

kx − x0 k 
|f (x) − f (x0 )| ≤ M − f (x0 )
r0

Ce qui prouve bien la continuité de f en x0 .

b) Montrons que f est lipschitzienne sur toute boule B(x0 , r), r < r0 .

Si x ∈ B(x0 , r), on a B(x, r0 −r) ⊂ B(x0 , r0 ), donc f est bornée supérieurement


par M sur B(x, r0 − r). Il en résulte :

ky − xk
∀y ∈ B(x, r0 − r), |f (y) − f (x)| ≤ (M − f (x))
r0 − r

Mais comme x ∈ B(x0 , r0 ), on a f (x) ≥ f (x0 ) − (M − f (x0 )) = 2f (x0 ) − M ,


d’où
ky − xk
∀y ∈ B(x, r0 − r), |f (y) − f (x)| ≤ 2 (M − f (x0 ))
r0 − r

Si maintenant x, y ∈ B(x0 , r), on divise le segment [x, y] en segments consé-


cutifs [xi , xi+1 ], i = 0, . . . , N de longueur inférieure à r0 − r. Comme [x, y] ⊂
B(x0 , r), on voit que :
X X
|f (x) − f (y)| ≤ |f (xi+1 ) − f (xi )| ≤ A kxi+1 − xi k = A kx − yk
i i

M − f (x0 )
où A = 2 .
r0 − r

Définition 7.1.2 (Fonction localement lipschitzienne). On dira que f est lo-


o
calement lipschitzienne sur domf si elle est lipschitzienne au voisinage de tout
o
point de domf .

Corollaire 7.1.3. Soit f : E → R ∪ {+∞} une fonction convexe. Il est équi-


valent de dire :
i) Il existe x0 ∈ domf tel que f soit majorée au voisinage de x0 ;
ii) Il existe x0 ∈ domf tel que f soit continue en x0 ;
o
iii) domf 6= ∅ et f y est continue ;
o
iv) domf 6= ∅ et f y est localement lipschitzienne.
7.1. CONVEXITÉ ET CONTINUITÉ 101

Démonstration : iv) ⇒ iii) ⇒ ii) ⇒ i) est clair.


Montrons que i) ⇒ iv) : Supposons f bornée sur la boule B(x0 , r0 ). Alors
o o o
nécessairement, x ∈ domf et domf 6= ∅. Soit y0 ∈ domf . Il existe z0 un point
intérieur à domf tel que y0 appartienne au segment semi-ouvert [x0 , z0 [. Soit
h l’homothétie de centre z0 et de rapport λ amenant x0 sur y0 . On a h(x) =
z0 + λ(x − z0 ) = λx + (1 − λ)z0 , avec 0 < λ ≤ 1 et h(B(x0 , r0 )) = B(y0 , λr0 )
(voir la preuve du Lemme 2.2.7). Mais par convexité de f :

∀x ∈ B(x0 , r0 ), f (h(x)) = f (λx+(1−λ)z0 ) ≤ λf (x)+(1−λ)f (z0 ) ≤ max(M, f (z0 ))

ce qui entraîne que f est bornée supérieurement sur B(y0 , λr0 ), et est donc
lipschitzienne sur B(y0 , λr), pour tout r < r0 , d’après la proposition précédente
et sa preuve.
Corollaire 7.1.4. Si E est de dimension finie, toute fonction convexe f :
E → R ∪ {+∞} est continue et même localement lipschitzienne sur l’intérieur
relatif de son domaine effectif.
La conclusion signifie que la restriction de f à ri(domf ) est continue.

Démonstration : Si E est de dimension finie, quitte à remplacer E par


o
Aff(domf ), on peut supposer que ri(domf ) = domf . Alors par la Proposition
3.1.1, domf contient un repère affine (x0 , x1 , . . . , xp ). L’enveloppe convexe S =
conv(x0 , x1 , . . . , xp ) est incluse dans domf , et f est bornée supérieurement sur
S, puisque pour tout système (λ0 , . . . , λp ) de coefficients positifs de somme 1,
p p
p
X  X
f λi xi ≤ λi f (xi ) ≤ max f (xi )
i=1
i=0 i=0
o o
Puisque S est non vide, inclus dans domf , il suit du corollaire précédent que
o
f est continue, et même localement lipschitzienne, sur domf .
Exercice 7.1. Dans la situation du Corollaire 7.1.4, f est lipschitzienne sur
tout compact inclus dans ri(C).
Corollaire 7.1.5. La fonction convexe f : E → R ∪ {+∞} est continue en un
point de son domaine effectif si et seulement si son épigraphe est d’intérieur
non vide.
Démonstration : L’hypothèse de continuité entraîne que epif est d’inté-
rieur non vide : en effet si B(y0 , r) est une boule ouverte de centre y0 sur laquelle
f est majorée par M , l’épigraphe de f contient l’ouvert B(y0 , r)×]M, +∞[. La
réciproque est une conséquence de 7.1.3.
102 CHAPITRE 7. RÉGULARITÉ DES FONCTIONS CONVEXES

7.2 Convexité et différentiabilité

Commençons par examiner une notion très faible de différentiabilité :

Définition 7.2.1 (Dérivées directionnelles). Soit f : E → R ∪ {+∞} une


fonction numérique, x0 un point de domf , et h un vecteur non nul de E. On dit
f (x0 + th) − f (x0 )
que f est dérivable à droite dans la direction h si le rapport
t
a une limite, éventuellement infinie, lorsque t tend vers 0 par valeurs positives.
Cette limite fd0 (x0 , h) est appelée dérivée directionnelle de f dans la direction
h.

Proposition 7.2.2. Une fonction convexe f : E → R ∪ {+∞} est dérivable à


droite dans toute direction en tout point x0 où elle est finie (la dérivée direc-
tionnelle pouvant être infinie). De plus on a l’inégalité :

∀x ∈ E, f (x) − f (x0 ) ≥ fd0 (x0 , x − x0 )

Démonstration : C’est une conséquence du lemme suivant :

Lemme 7.2.3. Soit f : E → R ∪ {+∞} une fonction convexe, x0 ∈ domf et


h ∈ E. L’application

f (x0 + th) − f (x0 )


∆x0 ,h : ]0, +∞[→ R, t 7→
t
est croissante.

Démonstration : Posons ϕ(t) = f (x0 + th) − f (x0 ) : c’est une fonction


convexe de [0, +∞[ dans R ∪ {+∞}, avec ϕ(0) = 0 et par conséquent :

∀α, t ∈ [0, +∞[, ϕ(αt) = ϕ(αt + (1 − α).0) ≤ αϕ(t) + (1 − α)ϕ(0) = αϕ(t)

ϕ(s) ϕ(t)
En posant s = αt, on obtient ϕ(s) ≤ (s/t)ϕ(t) et donc si s > 0 : ≤ ,
s t
c’est à dire ∆x0 ,h (s) ≤ ∆x0 ,h (t). Donc ∆x0 ,h est une fonction croissante de
]0, +∞[ dans R ∪ {+∞}.

Revenons à la preuve de la Proposition 7.2.2 : la fonction croissante ∆x0 ,h


admet une limite dans R quand t → 0. Cette limite fd0 (x0 , h) est nécessairement
majorée par ∆x0 ,h (1).

Corollaire 7.2.4 (Minimum d’une fonction convexe : Règle de Fermat #1).


Une fonction convexe propre f admet un minimum au point x0 si et seulement
si toutes ses dérivées directionnelles à droite en x0 sont positives ou nulles.
7.2. CONVEXITÉ ET DIFFÉRENTIABILITÉ 103

Remarque 7.2.5. Posons fd0 (x0 , 0) = 0. Alors la fonction fd0 (x0 , .) : E → R,


h 7→ fd0 (x0 , h) est sous-linéaire, c’est à dire convexe et positivement homogène.
En particulier fd0 (x0 , h) ≥ −fd0 (x0 , −h).
Démonstration : La convexité résulte du fait que fd0 (x0 , .) est limite simple
des fonctions convexes h 7→ ∆x0 ,h (t), lorsque t → 0+ . L’homogénéité résulte de
l’égalité ∆x0 ,λh (t) = λ∆x0 ,h (λt) pour tout λ > 0. Si les dérivées directionnelles
selon ±h sont finies, (ou infinies de même signe) on a fd0 (x0 , h) + fd0 (x0 , −h) ≥
2fd0 (x0 , 0) = 0 par convexité, d’où l’inégalité fd0 (x0 , h) ≥ −fd0 (x0 , −h) ; celle-ci
reste trivialement vraie dans les cas où ces dérivées directionnelles sont infinies
de signe contraire.

On remarquera que la fonction fd0 (x0 , .) est un exemple naturel de fonction


convexe pouvant prendre la valeur −∞.

Une qualité de différentiabilité supérieure est atteinte lorsque la fonction fd0 (x0 , .)
est linéaire. En dimension infinie il est utile de requérir en sus la continuité :

Définition 7.2.6 (Gâteau différentiabilité). Soit f : E → R une fonction, et


x0 un point où f est finie. On dit que f est Gâteaux-différentiable en x0 si
pour tout h ∈ E, la fonction R → R, s → f (x0 + sh) est dérivable au point 0
(on notera f 0 (x0 , h) cette dérivée), et s’il existe une forme linéaire continue u∗
telle que f 0 (x0 , h) = hu∗ , hi, pour tout h ∈ E. La forme linéaire continue u∗
est alors unique, est appelée différentielle de Gâteaux (ou encore gradient) de
f en x0 et notée f 0 (x0 ) (ou parfois ∇f (x0 )).

Si la fonction f est Gâteaux-différentiable en x0 , on a en particulier fd0 (x0 , h) =


−fd0 (x0 , −h) pour tout h ∈ E. Le critère d’optimisation 7.2.4 devient alors

Corollaire 7.2.7 (Minimum d’une fonction convexe : Règle de Fermat #2).


Une fonction f , convexe propre et Gâteaux-différentiable en tout point de son
domaine effectif admet un minimum au point x0 ∈ domf si et seulement si
f 0 (x0 ) = 0.

Il est relativement aisé pour une fonction convexe d’être Gâteaux-différentiable


en un point donné. En effet :

Proposition 7.2.8. Si f est une fonction convexe propre continue en x0 ∈


domf et si fd0 (x0 , .) est impaire c’est à dire si fd0 (x0 , h) = −fd0 (x0 , −h), pour
tout h ∈ E, alors f est Gâteaux-différentiable en x0 .

Démonstration : Comme fd0 (x0 , h) < +∞ pour tout h ∈ E, à cause de


l’inégalité de la Proposition 7.2.2 et du fait que f est bornée au voisinage
de x0 , l’égalité de l’énoncé montre qu’on a aussi fd0 (x0 , h) > −∞. Les valeurs
104 CHAPITRE 7. RÉGULARITÉ DES FONCTIONS CONVEXES

fd0 (x0 , h) et −fd0 (x0 , −h) sont les dérivées à droite et à gauche de la fonction t →
f (x0 + th) au point 0. Leur égalité entraîne que cette fonction est dérivable en
0. La fonction fd0 (x0 , .), E → R, sous-linéaire impaire est alors nécessairement
linéaire.
Soit r0 > 0 tel que f (x0 + h) − f (x0 ) ≤ 1 pour h ∈ B(0, r0 ). Toujours à cause
de l’inégalité de la Proposition 7.2.2, on a fd0 (x0 , h) ≤ 1 pour khk ≤ r0 . Donc la
forme linéaire fd0 (x0 , .) est bornée, de norme ≤ 1/r0 , c’est à dire continue.

On veut maintenant caractériser la convexité d’une fonction Gâteaux-différentiable


f : E → R ∪ {+∞}. Le premier critère est maintenant trivial :
Proposition 7.2.9. Soit f : E → R∪{+∞}, Gâteaux-différentiable sur domf .
La fonction f est convexe si et seulement si pour tous x ∈ domf et y ∈ E on
a f (y) − f (x) ≥ hf 0 (x), y − xi.
Démonstration : En effet si f est convexe, cette inégalité résulte de la
Proposition 7.2.2.
Réciproquement supposons cette inégalité toujours vraie. Soient x, y ∈ domf ,
λ ∈ [0, 1] et z = λx + (1 − λ)y. On a

f (x) − f (z) ≥ hf 0 (z), x − zi


f (y) − f (z) ≥ hf 0 (z), y − zi
d’où

λf (x) + (1 − λ)f (y) − f (z) ≥ hf 0 (z), λ(x − z) + (1 − λ)(y − z)i = 0

donc f est convexe.

Pour obtenir un deuxième critère de convexité, on a besoin d’une définition :


Définition 7.2.10 (Application monotone). Une application T de D ⊂ E
dans E 0 est monotone si

∀x, y ∈ D hT (x) − T (y), x − yi ≥ 0

Proposition 7.2.11. Soit f : E → R ∪ {+∞}, Gâteaux-différentiable sur


domf . La fonction f est convexe si et seulement si f 0 est une application
monotone de domf dans E 0 .
Démonstration : a) Supposons f convexe.
Soient x, y ∈ domf . D’après la Proposition 7.2.2, on a :
f (y) − f (x) ≥ hf 0 (x), y − xi
f (x) − f (y) ≥ hf 0 (y), x − yi
7.2. CONVEXITÉ ET DIFFÉRENTIABILITÉ 105

En sommant membre à membre ces deux inégalités, on trouve l’inégalité cher-


chée.
b) Réciproquement, supposons f 0 monotone.
Soient x, y ∈ domf ; on considère l’application ϕ : [0, 1] → R, λ 7→ ϕ(λ) =
f (λx + (1 − λ)y) = f (y + λ(x − y)). Elle est dérivable, de dérivée :
ϕ0 (λ) = hf 0 (y + λ(x − y)), x − yi
Si λ1 < λ2 , on a :
ϕ0 (λ1 ) − ϕ0 (λ2 ) = hf 0 (y + λ1 (x − y)) − f 0 (y + λ2 (x − y)), x − yi ≤ 0
car la différence des arguments de f 0 vaut (λ1 − λ2 )(x − y). On en déduit
que la fonction ϕ est à dérivée croissante, donc est convexe. En particulier
ϕ(λ) ≤ λϕ(1) + (1 − λ)ϕ(0) = λf (x) + (1 − λ)f (y), ce qui est l’inégalité de
convexité pour f .
Remarque 7.2.12. Supposons que l’application domf → E 0 , x → f 0 (x) vérifie :
f 0 (x + th) − f 0 (x)
∀h ∈ E, h , hi → Q(x, h)
t
lorsque t → 0, avec Q(x, h) ≥ 0 pour tout h. Alors f est convexe. En particulier
si E = Rn est de dimension finie, et f : U → R est de classe C 2 sur l’ouvert
∂2f
convexe U , et si la matrice hessienne Hx (f ) = ( ) des dérivées partielles
∂xi ∂xj
secondes est positive c’est à dire t hHx (f )h ≥ 0 pour tout h ∈ Rn , alors f est
convexe sur U .
Démonstration : En effet d’après le théorème des accroissements finis on
a pour un certain θ ∈]0, 1[ :
d 0
hf 0 (x)−f 0 (y), x−yi = hf (y+t(x−y)), x−yit=θ = Q(θx+(1−θ)y, x−y) ≥ 0
dt
Dans le cas C 2 , on voit facilement que Q(x; h) = t hHx (f )h.

Finalement, rappelons la notion la plus forte de différentiabilité, qui est appelée


dans le cadre des EVN, la Fréchet-différentiabilité :
Définition 7.2.13 (Fréchet différentiabilité). Soit f : E → R une fonction,
et x0 un point où f est finie. On dit que f est Fréchet-différentiable en x0 s’il
existe une forme linéaire continue u∗ telle que
|f (x0 + h) − f (x0 ) − hu∗ , hi| = o(khk)
Bien entendu, si f est Fréchet-différentiable, elle est Gâteaux-différentiable et
u∗ = f 0 (x0 ).
106 CHAPITRE 7. RÉGULARITÉ DES FONCTIONS CONVEXES

Par contre, même en dimension finie, en général, la Gâteaux-différentiabilité


n’entraîne pas la Fréchet-différentiabilité. Néanmoins c’est vrai pour les fonc-
tions convexes :
Proposition 7.2.14. On suppose E de dimension finie. Si la fonction convexe
o
f : E → R∪{+∞} est Gâteaux-différentiable en x0 ∈ domf , elle y est Fréchet-
différentiable.
Démonstration : Soit r0 tel que B(x0 , r0 ) ⊂ domf et r < r0 . Posons pour
h ∈ SE = {h ∈ E/ khk = 1} et 0 ≤ t ≤ r :
 f (x +th)−f (x )
 0 t 0
si t > 0,
∆(h, t) =
 0
hf (x0 ), hi si t = 0.
La fonction ∆ : SE × [0, r] → R est continue : c’est clair (d’après le Corollaire
7.1.4) aux points (h0 , t0 ) avec t0 6= 0. Vérifions-le en un point (h0 , 0) ; on a :

|∆(h, t) − ∆(h0 , 0)| ≤ |∆(h, t) − ∆(h0 , t)| + |∆(h0 , t) − ∆(h0 , 0)|


|f (x0 + th) − f (x0 + th0 )|
=
t
f (x + th ) − f (x )
0 0 0
+ − hf 0 (x0 ), hi

t
Le second terme tend vers 0 quand t → 0 (Gâteaux-différentiabilité de f en
x0 ). Le premier terme se majore en utilisant la propriété de Lipschitz locale de
f (Corollaire 7.1.3) :
|f (x0 + th) − f (x0 + th0 |
≤ M kh − h0 k → 0, quand h → h0
t
Comme SE × [0, r] est un compact de E × R (SE est compacte car E est
de dimension finie), la fonction continue ∆ est uniformément continue, et par
conséquent
sup |∆(h, t) − ∆(h, 0)| → 0, quand t → 0
h∈SE

ce qui revient à dire que


f (x0 + h) − f (x0 ) − hf 0 (x0 ), hi = o(khk).

7.3 Convexité et sous-différentiabilité

Définition 7.3.1 (Sous-gradient). Soit f : E → R une fonction quelconque et


x0 un point donnant à f une valeur finie. On dit que f est sous-différentiable
7.3. CONVEXITÉ ET SOUS-DIFFÉRENTIABILITÉ 107

en x0 ∈ E s’il existe u∗ ∈ E 0 telle que :


∀x ∈ E, f (x) − f (x0 ) ≥ hu∗ , x − x0 i
On dit alors que u∗ est un sous-gradient de f en x0 ; on appelle sous-différentiel
de f en x0 , et on note ∂f (x0 ), l’ensemble des sous-gradients de f en x0 .

Remarque 7.3.2. 1) Par définition, f est sous-différentiable en x0 ∈ E si et


seulement si ∂f (x0 ) 6= ∅. 2) Il est clair que si f est sous-différentiable en un
point, elle ne prend nulle part la valeur −∞.

Remarque 7.3.3 (Règle de Fermat #3). Soit f : E → R une fonction quelconque


et x0 ∈ E tel que f (x0 ) ∈ R. Il suit directement de la définition que f admet
un minimum au point x0 si et seulement si 0 ∈ ∂f (x0 ).

Exercice 7.2. ∂f (x0 ) est un sous-ensemble convexe fermé de E 0 (éventuelle-


ment vide).

La notion de sous-gradient s’interprète géométriquement dans E × R (qu’on


peut munir d’une structure d’EVN en posant par exemple k(x, t)k = kxk+|t|) :
Remarque 7.3.4. La forme linéaire continue u∗ est un sous-gradient de f en x0
si et seulement si l’hyperplan affine de E ×R d’équation t = f (x0 )+hu∗ , x−x0 i
est un hyperplan d’appui de epif .
La notion d’une fonction sci a été introduite en Définition 2.3.1. On peut
énoncer :

Proposition 7.3.5. Si la fonction f : E → R ∪ {+∞} a un domaine effec-


tif convexe et y est sous-différentiable, elle est convexe, et coïncide sur son
domaine effectif avec une fonction convexe sci.

Démonstration : Pour tout x ∈ domf , choisissons u∗x ∈ ∂f (x). 0n pose :

g(y) = sup (f (x) + hu∗x , y − xi)


x∈domf

La fonction g est convexe sci comme enveloppe supérieure de fonctions affines


continues et g(y) ≤ f (y) pour tout y ∈ E.
De plus si y ∈ domf on a g(y) ≥ f (y) + hu∗x , y − yi = f (y), d’où g(y) = f (y)et
f coïncide bien avec une fonctions convexe continue sur son domaine effectif.
Comme domf est convexe, ceci implique que f est convexe par la Remarque
1.5.3.
108 CHAPITRE 7. RÉGULARITÉ DES FONCTIONS CONVEXES

Inversement les fonctions convexes sont sous-différentiables en tout point de


continuité dans leur domaine effectif :

Théorème 7.3.6. Si la fonction f : E → R ∪ {+∞} est convexe et continue


en un point de son domaine effectif, elle est sous-différentiable en tout point
de l’intérieur de son domaine effectif. De plus pour tout x0 point intérieur de
domf et tout h ∈ E, il existe u∗ ∈ ∂f (x0 ) tel que fd0 (x0 , h) = hu∗ , hi.

Démonstration : Si f est continue en un point, par le Corollaire 7.1.5, epif


est d’intérieur non vide.

Soit x0 un point intérieur à domf et h ∈ E, h 6= 0. Soit Dx0 ,h la droite affine


de E × R passant par le point (x0 , f (x0 )) et de vecteur directeur (h, fd0 (x0 , h).
On a donc :

Dx0 ,h = (x0 + τ h, f (x0 ) + τ fd0 (x0 , h) / τ ∈ R




Alors epistf ∩ Dx0 ,h = ∅. En effet pour τ ≥ 0, on a (d’après la Proposition


7.2.2) :
f (x0 + τ h) ≥ f (x0 ) + fd0 (x0 , τ h)) = f (x0 ) + τ fd0 (x0 , h)
tandis que pour τ ≤ 0, on a :

f (x0 + τ h) ≥ f (x0 ) + (−τ )fd0 (x0 , −h) ≥ f (x0 ) + τ fd0 (x0 , h)

(puisque fd0 (x0 , −h) ≥ −fd0 (x0 , h) et −τ ≥ 0).


Remarquons que epistf contient l’intérieur de epif (les points de epif \ epistf ,
c’est à dire du graphe de f |domf ne sont évidemment pas intérieurs à epif ).
Donc Dx0 ,h est disjointe de l’intérieur de epif . D’après le théorème de Hahn-
Banach (Corollaire 6.2.2), il existe un hyperplan affine fermé de E×R contenant
Dx0 ,h et disjoint de l’intérieur de epif . L’un des demi-espaces fermés associés
contient l’intérieur de epif , donc son adhérence epif . Autrement dit il existe
ϕ ∈ (E × R)0 non nulle et a ∈ R tels que :

inf ϕ(x, t) ≥ a = ϕ(y, s)


(x,t)∈epif

pour tout (y, s) ∈ Dx0 ,h . Mais (E × R)0 s’identifie à E 0 × R, c’est à dire que :
ϕ(x, t) = hv ∗ , xi + αt, pour un certain couple (u∗ , α) ∈ E 0 × R. On a alors en
particulier, puisque (x0 , f (x0 )) ∈ Dx0 ,h :

∀(x, t) ∈ epif, hv ∗ , xi + αt ≥ hv ∗ , x0 i + αf (x0 ) (∗)

En faisant t → +∞, on voit que nécessairement α ≥ 0.


7.3. CONVEXITÉ ET SOUS-DIFFÉRENTIABILITÉ 109

Si on avait α = 0, alors on aurait

∀x ∈ domf, hv ∗ , x − x0 i ≥ 0

Comme domf contient une boule B(x0 , r) (puisque x0 lui est intérieur), ceci
entraînerait ∀y ∈ B(0, r), hv ∗ , yi ≥ 0 ; ceci resterait vrai pour tout y ∈ E par
homogénéité, et en rempaçant y par −y, on voit qu’alors ∀y ∈ E hv ∗ , yi = 0,
c’est à dire v ∗ = 0 ; mais alors ϕ = 0, ce qui est une contradiction.
On a donc α > 0. En divisant par α, l’inégalité (∗) devient :

∀(x, t) ∈ epif, hw∗ , xi + t ≥ hw∗ , x0 i + f (x0 )

(où w∗ = (1/α)v ∗ ). En appliquant ceci au cas t = f (x), on obtient f (x) −


f (x0 ) ≥ −hw∗ , x − x0 i, pour tout x ∈ C, c’est à dire u∗ = −w∗ est un sous-
gradient de f en x0 .
Par ailleurs utilisons le fait que ϕ est constante sur Dx0 ,h :

∀τ ∈ R, −hu∗ , x0 + τ hi + f (x0 ) + τ fd0 (x0 , h) = C ste

ce qui entraîne fd0 (x0 , h) = hu∗ , hi.


Corollaire 7.3.7. Soit f : E → R ∪ {+∞} une fonction convexe, et x0 un
point de son domaine effectif.
i) Si la fonction f est Gâteaux-différentiable en x0 , elle est sous-différentiable
en x0 et ∂f (x0 ) = {f 0 (x0 )}.
ii) Si la fonction f est continue en x0 , et si son sous-différentiel ∂f (x0 ) ne
contient qu’un seul élément, elle est Gâteaux-différentiable en x0 .
Démonstration : i) Il résulte de la Proposition 7.2.2 et de la définition
7.2.6 que f 0 (x0 ) est un sous-gradient de f en x0 .
Inversement, soit u∗ ∈ ∂f (x0 ). On a donc, pour tout h ∈ E :

∀t ∈]0, 1], f (x0 + th) − f (x0 ) ≥ hu∗ , thi

On divise par t et on fait t → 0, on obtient à la limite :

hf 0 (x0 ), hi ≥ hu∗ , hi

En remplaçant h par −h, on voit que hf 0 (x0 ), hi ≤ hu∗ , hi, et par conséquent
u∗ = f 0 (x0 ).
ii) Si ∂f (x0 ) = {u∗ }, il résulte du Théorème 7.3.6 que pour tout h ∈ E on a :

fd0 (x0 , h) = hu∗ , hi

Il en résulte que f admet f 0 (x0 ) pour différentielle de Gâteaux en x0 .


110 CHAPITRE 7. RÉGULARITÉ DES FONCTIONS CONVEXES

Pour étudier le sous-différentiel d’une fonction convexe, on a besoin d’un théo-


rème de séparation fonctionnel :

Théorème 7.3.8 (Séparation fonctionnel). Soient f : E → R ∪ {+∞} une


fonction convexe, et g : E → R ∪ {−∞} une fonction concave telles que ∀x ∈
E, f (x) ≥ g(x). On suppose qu’il existe un point x0 où f et g prennent des
valeurs finies, et où l’une d’elle soit continue. Alors il existe une fonction affine
continue h telle que f (x) ≥ h(x) ≥ g(x).

Démonstration : On note hypog l’hypographe de g, c’est à dire l’ensemble


convexe
hypog = {(x, t) ∈ E × R / t ≤ g(x)}
Supposons que par exemple f est continue en x0 . Alors epif est d’intérieur non
vide, inclus dans epistf . L’hypothèse f ≥ g entraîne que epistf ∩ hypog = ∅.
Comme ces deux ensembles sont convexes, on peut les séparer par un hyperplan
affine fermé (Corollaire 6.2.2, théorème de Hahn-Banach géométrique) ; il existe
donc une forme linéaire continue ϕ non nulle sur E × R telle que

inf ϕ(x, t) ≥ b ≥ sup ϕ(x, t)


(x,t)∈epif (x,t)∈hypog

il revient au même de dire qu’il existe u∗ ∈ E 0 et a ∈ R, non tous deux nuls,


tels que

∀x ∈ domf, ∀y ∈ dom(−g), ∀t ≥ f (x), ∀s ≤ g(y) : hu∗ , xi+at ≥ b ≥ hu∗ , yi+as

En faisant t → +∞, on voit que a ≥ 0.


Si a = 0, en prenant y = x0 on voit que :

∀x ∈ domf, hu∗ , x − x0 i ≥ 0

et comme x0 est intérieur à domf ceci entraîne u∗ = 0, contradiction. Donc


a > 0, et quitte à diviser ϕ par a, on peut supposer a = 1. On a donc :

∀x ∈ domf, ∀y ∈ dom(−g), hu∗ , xi + f (x) ≥ b ≥ hu∗ , yi + g(y)

c’est à dire :
∀x ∈ E, f (x) ≥ −hu∗ , xi + b ≥ g(x)

Théorème 7.3.9. Soient f , g deux fonctions convexes de E dans R ∪ {+∞}.


Soit x0 un point de E.
a) Si f et g sont sous-différentiables en x0 , il en est de même de f + g, et

∂f (x0 ) + ∂g(x0 ) ⊂ ∂(f + g)(x0 )


7.3. CONVEXITÉ ET SOUS-DIFFÉRENTIABILITÉ 111

b) Supposons que ces fonctions prennent des valeurs finies en x0 et que l’une
d’elle soit continue en x0 . Alors si f + g est sous-différentiable en x0 , il en est
de même de f et g, et

∂(f + g)(x0 ) = ∂f (x0 ) + ∂g(x0 )

Démonstration : a) Si u∗ ∈ ∂f (x0 ) et v ∗ ∈ ∂g(x0 ), on a

f (x) ≥ f (x0 ) + hu∗ , x − x0 i


g(x) ≥ g(x0 ) + hv ∗ , x − x0 i
pour tout x ∈ E ∗ . En sommant membre à membre il vient

f (x) + g(x) ≥ f (x0 ) + g(x0 ) + hu∗ + v ∗ , x − x0 i

donc u∗ + v ∗ ∈ ∂(f + g)(x0 ).


b) Supposons que f est continue en x0 . Soit w∗ un sous-gradient de (f + g) en
x0 . On a donc :

f (x) + g(x) ≥ f (x0 ) + g(x0 ) + hw∗ , x − x0 i

pour tout x ∈ E ; ce qu’on peut encore écrire :

f (x) − f (x0 ) − hw∗ , x − x0 i ≥ −(g(x) − g(x0 ))

Soit f0 (x) = f (x) − f (x0 ) − hw∗ , x − x0 i et k0 (x) = −(g(x) − g(x0 )) : alors


f0 est convexe, continue en x0 , k0 est concave , et f0 ≥ k0 . Il existe donc
(Théorème 7.3.8) une fonction affine continue h telle que f0 ≥ h ≥ k0 . Comme
f0 (x0 ) = 0 = g0 (x0 ), on a h(x0 ) = 0, c’est à dire que h est de la forme
h(x) = h−u∗ , x − x0 i, avec u∗ ∈ E 0 . Donc :
(
f (x) − f (x0 ) ≥ hw∗ − u∗ , x − x0 i
∀x ∈ E,
g(x) − g(x0 ) ≥ hu∗ , x − x0 i

ce qui signifie que u∗ ∈ ∂g(x0 ) et w∗ − u∗ ∈ ∂f (x0 ).


Proposition 7.3.10. Soient E, F deux espaces vectoriels normés ; f : E →
R ∪ {+∞} une fonction convexe, et A : F → E un opérateur linéaire continu.
Soit x0 un point de E.
a) Si f est sous-différentiable au point Ax0 , alors f ◦A est sous-différentiable
en x0 , et
∂(f ◦A)(x0 ) ⊃ A∗ ∂f (Ax0 )
(où A∗ : E 0 → F 0 désigne l’opérateur transposé de A).
b) Si de plus f est continue en Ax0 , on a l’égalité
∂(f ◦A)(x0 ) = A∗ ∂f (Ax0 ).
112 CHAPITRE 7. RÉGULARITÉ DES FONCTIONS CONVEXES

Démonstration : a) Soit u∗ ∈ ∂f (Ax0 ). On a :

∀x ∈ F, (f ◦A)(x)−(f ◦A)(x0 ) = f (Ax)−f (Ax0 ) ≥ hu∗ , Ax−Ax0 i = hA∗ u∗ , x−x0 )i

donc A∗ u∗ ∈ ∂(f ◦A)(x0 ).


b) Réciproquement, soit v ∗ ∈ ∂(f ◦A)(x0 ). On a donc :

∀x ∈ F, f (Ax) − f (Ax0 ) = (f ◦A)(x) − (f ◦A)(x0 ) ≥ hv ∗ , x − x0 i

Alors Ker A ⊂ Ker v ∗ : en effet, si h ∈ Ker A, on a 0 = f (A(x0 ±h))−f (Ax0 ) ≥


±hv ∗ , hi, donc h ∈ Ker v ∗ . Autrement dit la valeur de v ∗ au point x ne dépend
que de l’image Ax = y ; on peut donc définir sans ambigüité ` : M = Im A → R
par `(y) = hv ∗ , xi pour tout x ∈ A−1 (y). L’application ` est bien sûr linéaire.
Posons (
`(y) si y ∈ ImA
g(y) =
− ∞ sinon
Alors g est concave, g(Ax0 ) = `(Ax0 ) ∈ R et

∀y ∈ E, f (y) − f (Ax0 ) ≥ g(y) − g(Ax0 )

D’après le Théorème 7.3.8, on en déduit qu’il existe une fonction affine continue
h telle que

∀y ∈ E, f (y) − f (Ax0 ) ≥ h(y) ≥ g(y) − g(Ax0 )

Comme h(Ax0 ) = 0, on a en fait h(y) = hu∗ , y −Ax0 i, pour un certain u∗ ∈ E 0 .


On a donc u∗ ∈ ∂f (Ax0 ). La restriction de u∗ à Im A vérifie clairement :

hu∗ , Aui ≥ `(Au) = hv ∗ , ui

pour tout u ∈ F . En remplaçant u par −u, on obtient donc l’égalité : hu∗ , Aui =
hv ∗ , ui pour tout u ∈ F . Donc v ∗ = A∗ u∗ , qui appartient à A∗ ∂f (Ax0 ).
Chapitre 8
Fonctions convexes conjuguées

8.1 Enveloppes supérieures de fonctions affines continues

Théorème 8.1.1. Une fonction f : E → R ∪ {+∞} est convexe sci si et


seulement si elle est enveloppe supérieure de fonctions affines continues.

Démonstration : Une enveloppe supérieure de fonctions affines continues


est convexe sci à valeurs dans R ∪ {+∞}.
Réciproquement soit f : E → R ∪ {+∞} une fonction convexe sci. Si f est
la fonction identique à +∞, c’est trivialement une enveloppe supérieure d’une
famille de fonctions affines continues, par exemple fn = n, n ≥ 1.
Sinon, domf n’est pas vide. Considérons x0 ∈ domf . Pour tout t réel t < f (x0 ),
l’ensemble Vf (t) = {x ∈ E / f (x) > t} est un ouvert contenant x0 , donc
contenant une boule ouverte B(x0 , r), r > 0. Soit g = t − χB(x0 ,r) : alors g est
une fonction concave, finie et continue sur B(x0 , r) et majorée par f . Comme
x0 est adhérent à domf , on a (domf ) ∩ B(x0 , r) 6= ∅.
D’après le théorème de séparation fonctionnelle (Théorème 7.3.8) il existe une
fonction affine continue h avec g ≤ h ≤ f . Donc h est une minorante affine
continue de f telle que h(x0 ) ≥ t.
Ce qui précède montre d’une part que f admet au moins une minorante affine
continue h0 , d’autre part qu’en tout point x adhérent à domf , il existe pour
tout t < f (x0 ) une minorante affine continue h de f telle que h(x0 ) ≥ t.
Soit maintenant x0 ∈ E \ domf ; on peut trouver d’après la Proposition 6.2.7
(séparation d’un point et d’un convexe fermé) une forme linéaire u∗ ∈ E 0 telle
que
α := sup hu∗ , xi < hu∗ , x0 i
x∈domf

La fonction affine hu∗ ,α définie par hu∗ ,α (x) = hu∗ , xi−α vérifie donc hu∗ ,α (x) ≤
0 pour tout x ∈ domf et hu∗ ,α (x0 ) > 0. Pour tout t ∈ R on peut donc trouver

113
114 CHAPITRE 8. FONCTIONS CONVEXES CONJUGUÉES

ρ ≥ 0 tel que ρhu∗ ,α (x0 ) > t − h0 (x0 ). Alors h = ρhu∗ ,α + h0 vérifie h(x0 ) > t
et h(x) ≤ h0 (x) ≤ f (x) pour tout x ∈ domf , donc h ≤ f .

Désignons par Af l’ensemble des minorantes affines continues de f ; il est clair


que f ≥ sup Af , et ce qui précède montre que f = sup Af .

8.2 Régularisée convexe sci d’une fonction numérique

Définition 8.2.1 (La régularisée convexe sci d’une fonction). La régularisée


convexe sci d’une fonction f E → R est la plus grande fonction convexe sci
fˆ : E → R minorant f .
Soit Sf l’ensemble des fonctions convexes sci minorant f (Noter que Sf contient
en particulier la constante −∞). Alors l’enveloppe supérieure de Sf est convexe
sci, donc c’est fˆ.
Remarque 8.2.2. La fonction f et sa régularisée convexe sci ont les mêmes
minorantes affines continues : Af = Afˆ. Il résulte donc du Théorème 8.1.1 que
si Af 6= ∅, la régularisée convexe sci fˆ est égale à l’enveloppe supérieure de Af .

Proposition 8.2.3. On a epifˆ = conv(epif ).


Démonstration : L’ensemble epifˆ est convexe fermé et contient epif , puisque
fˆ ≤ f et donc contient conv(epif ).
Inversement conv(epif ) est l’épigraphe d’une fonction convexe sci g : E → R.
En effet pour tout s ≥ 0 soit Ts la tranlation de E × R de vecteur (0, s), on
a Ts (epif ) ⊂ epif , et il en résulte Ts (conv(epif )) ⊂ co(epif ). Autrement dit
si (x, t) ∈ conv(epif ) alors pour tout s ≥ 0, on a (x, t + s) ∈ conv(epif ).
Posant g(x) = inf{t/ (x, t) ∈ conv(epif )}, avec la convention inf ∅ = +∞,
on a (x, g(x)) ∈ conv(epif ) lorsque g(x) > −∞ car cet ensemble est fermé et
finalement epig = conv(epif ).
La fonction g est alors convexe sci, et minore f , d’où g ≤ fˆ et donc conv(epif ) =
epig ⊃ epifˆ.

8.3 Conjuguée de Fenchel-Moreau

Définition 8.3.1 (Fonction conjuguée). Soit f : E → R une fonction nu-


mérique. Sa fonction conjuguée (au sens de Fenchel-Moreau) est la fonction
f ∗ : E 0 → R définie par
f ∗ (x∗ ) = sup[hx∗ , xi − f (x)]
x∈E
8.3. CONJUGUÉE DE FENCHEL-MOREAU 115

Remarque 8.3.2. La fonction conjuguée f ∗ est parfois aussi appelée polaire de


la fonction f . Dans le cas E = R, c’est la fonction conjuguée de Young de f .

Proposition 8.3.3. La fonction conjuguée f ∗ est soit une fonction convexe


sci de E 0 dans R ∪ {+∞}, soit la fonction identiquement égale à −∞.

Démonstration : En effet si f est identiquement égale à +∞, sa conjuguée


est identiquement égale à −∞. Sinon on peut se restreindre dans la définition de
f ∗ aux éléments x de domf , et f ∗ apparaît donc comme enveloppe supérieure
de fontions affines continues, donc est convexe, sci et ne prend pas la valeur
−∞.
Remarque 8.3.4. La valeur de la fonction conjuguée f ∗ au point x∗ est la
plus petite constante b telles que la fonction affine continue hx∗ ,b = hx∗ , .i − b
minore la fonction f (avec la convention inf ∅ = +∞). En particulier f ∗ est la
constante +∞ si et seulement si f n’a pas de minorante affine continue.
En effet hx∗ , .i−b ≤ f si et seulement si pour tout x ∈ E, on a hx∗ , xi−f (x) ≤ b,
ce qui équivaut à f ∗ (x∗ ) ≤ b.

Proposition 8.3.5. 1) f ∗ (0) = − inf x∈E f (x).


2) f ≤ g ⇒ f ∗ ≥ g ∗ .

3) Si λ > 0, on a (λf )∗ (x∗ ) = λf ∗ ( xλ )
4) Si λ 6= 0, on a (Dλ f )∗ = D1/λ f ∗ , (où Dλ f est la fonction dilatée Dλ f (x) =
f ( λx )).
5) Si α ∈ R, on a (f + α)∗ = f ∗ − α
6) Si a ∈ E, on a (τa f )∗ = f ∗ + h., ai (où τa f est la fonction translatée :
τa f (x) = f (x − a)).
7) (inf i∈I fi )∗ = supi∈I fi∗
8) (supi∈I fi )∗ ≤ inf i∈I fi∗

Démonstration : Exercice !

Exemple 8.3.6. Si A est une partie de E, χA sa fonction caractéristique,


alors (χA )∗ (x∗ ) = supx∈A hx∗ , xi : c’est la fonction d’appui de l’ensemble A.
En particulier si BE est la boule-unité de E, on a χ∗BE (x∗ ) = kx∗ k.

Exemple 8.3.7. Soit u∗ ∈ E 0 : c’est une fonction sur E que nous notons hu∗ , .i
pour éviter les confusions. Alors sa conjuguée est très dégénérée : hu∗ , .i∗ =
χ{u∗ } .

Exemple 8.3.8. Si f (x) = kxk, on a f ∗ = χB̄E0 .


116 CHAPITRE 8. FONCTIONS CONVEXES CONJUGUÉES

Exemple 8.3.9. Soit E = R.


|t|p |s|q
Si 1 < p < ∞ et f (t) = , on a f ∗ (s) = , où q est l’exposant conjugué
p q
de p c’est à dire 1/p + 1/q = 1.
Si f (t) = |t|, on a f ∗ (s) = χ[−1,1] (s), et inversement si f = χ[−1,1] on a
f ∗ (s) = |s|.

Exemple 8.3.10. Si ϕ : R → R est paire et f : E → E est définie par


f (x) = ϕ(kxk), alors f ∗ (x∗ ) = ϕ∗ (kx∗ k).

En effet

f ∗ (x∗ ) = sup sup [hx∗ , xi − ϕ(kxk)]


t≥0 x∈E,kxk=t

= sup sup [hx∗ , xi − ϕ(t)] = sup[t kx∗ k − ϕ(t)]


t≥0 x∈E,kxk=t t≥0

et comme ϕ est paire :

= sup[t kx∗ k − ϕ(t)] = ϕ∗ (kx∗ k)


t∈R

8.4 Biconjuguée

Si g est une fonction E 0 → R, sa conjuguée g ∗ est stricto sensu une application


E 00 → R. On ne considérera en général que la restriction g (∗) de g ∗ à E,
autrement dit la fonction E → R définie par :

g (∗) (x) = sup [hx∗ , xi − g(x∗ )].


x∗ ∈E 0

Lorsque E est réflexif (E 00 = E), par exemple si E est de dimension finie ou


un espace de Hilbert, on a g (∗) = g ∗ . Par abus de notation, on note souvent g ∗
au lieu de g (∗) , même lorsque E n’est pas réflexif.
Remarque 8.4.1. La Proposition 8.3.5 est valable aussi pour cette notion de
conjugaison.

Théorème 8.4.2 (Théorème de la biconjuguée). La biconjuguée f ∗(∗) : E →


R d’une fonction f : E → R est égale à la régularisée convexe sci de f si f
admet une minorante affine continue ; c’est la constante −∞ sinon.
8.5. CONJUGAISON ET SOUS-DIFFÉRENTIELS 117

Démonstration : D’après la Remarque 8.3.4, la fonction affine continue


hx∗ ,b définie par hx∗ ,b (x) = hx∗ , xi−b minore f si et seulement si (x∗ , b) ∈ epif ∗ .
Si une telle minorante affine existe, on a :

fˆ(x) = sup hx∗ ,b (x) = sup [hx∗ , xi − f ∗ (x∗ )] = f ∗(∗) (x)


(x∗ ,b)∈epif ∗ x∗ ∈domf ∗

Corollaire 8.4.3. Si f : E → R est une fonction convexe sci ne prenant pas


la valeur −∞ (ou constamment égale à −∞) on a f ∗(∗) = f .

Remarque 8.4.4. De même si g est une fonction E 0 → R, sa biconjuguée g (∗)∗


est l’enveloppe supérieure des minorantes affines de g de la forme : hx,b (x∗ ) =
hx∗ , xi − b (minorantes affines w∗ -continues). En particulier g (∗)∗ ≤ g.

Corollaire 8.4.5. Si f est une fonction E → R, on a f ∗(∗)∗ = f ∗ .

Démonstration : De f ∗(∗) ≤ f on tire f ∗(∗)∗ = (f ∗(∗) )∗ ≥ f ∗ ; inversement


on a f ∗(∗)∗ = (f ∗ )(∗)∗ ≤ f ∗ .

Notations 8.4.6. Soit Γ(E) la réunion de l’ensemble des fonctions E → R ∪


{+∞} convexe sci et de la constante −∞.

Lorsque E est réflexif (par exemple si E est de dimension finie, ou un espace de


Hilbert), toutes les fonctions affines continues sur E 0 sont de la forme hx,b (x∗ ) =
hx∗ , xi − b (x ∈ E, b ∈ R). Par conséquent on a :

Corollaire 8.4.7. Supposons l’espace E réflexif (par exemple E de dimension


finie, ou espace de Hilbert). La conjuguaison induit alors une bijection de Γ(E)
sur Γ(E 0 ), qui échange les constantes +∞ et −∞.

Exercice 8.1. Si (fi )i∈I est une famille de fonctions de Γ(E) alors (supi∈I fi )∗ =
(inf i∈I fi∗ )(∗)∗ .

8.5 Conjugaison et sous-différentiels

Remarque 8.5.1. Il résulte immédiatement de la définition de la conjugaison


que pour toute fonction f : E → R , et tous x ∈ E, x∗ ∈ E 0 , on a :

hx∗ , xi ≤ f (x) + f ∗ (x∗ )

dès que le second membre a un sens. Cette inégalité s’appelle l’inégalité de


Fenchel.
118 CHAPITRE 8. FONCTIONS CONVEXES CONJUGUÉES

Le cas d’égalité est caractérisé par la proposition suivante :

Proposition 8.5.2. Soit f : E → R et soit f ∗ sa conjuguée. Soient x ∈


E, x∗ ∈ E ∗ . Alors x∗ est un sous-gradient de f en x si et seulement si f (x) est
fini et
hx∗ , xi = f (x) + f ∗ (x∗ )

Démonstration : La forme linéaire x∗ est un sous-gradient de f en x si


et seulement si la fonction affine continue h(y) = hx∗ , y − xi + f (x) est une
minorante de f . D’après la Remarque 8.3.4, c’est le cas si et seulement si
−h(0) = hx∗ , xi − f (x) ≥ f ∗ (x∗ ). L’inégalité inverse étant toujours vraie, ceci
équivaut à l’égalité.
Remarque 8.5.3. De manière analogue si g : E 0 → R, et x ∈ E, x∗ ∈ E ∗ , alors
x est un sous-gradient de g en x∗ si et seulement si g(x∗ ) est fini et

hx∗ , xi = g(x∗ ) + g (∗) (x)

Corollaire 8.5.4. Si f : E → R et x ∈ E vérifient f ∗(∗) (x) = f (x) alors

x∗ ∈ ∂f (x) ⇐⇒ x ∈ ∂f ∗ (x∗ )

La condition f ∗(∗) (x) = f (x) est vérifiée en particulier dans les cas suivants :
1) lorsque f est sous-différentiable en x et dans ce cas ∂f (x) = ∂f ∗(∗) (x).
2) lorsque f ∈ Γ(E).

Démonstration : On a :
x∗ ∈ ∂f (x) ⇐⇒ hx∗ , xi = f (x) + f ∗ (x∗ )
x ∈ ∂f ∗ (x∗ ) ⇐⇒ hx∗ , xi = f ∗(∗) (x) + f ∗ (x∗ )

et ces conditions coïncident quand f (x) = f ∗(∗) (x). Ceci est en particulier vrai
pour tout x si f = f ∗(∗) c’est à dire si f ∈ Γ(E).
Si ∂f (x) 6= ∅, la fonction f admet une minorante affine continue qui lui est
égale au point x, donc f ∗(∗) (x) = f (x). Alors les assertions x∗ ∈ ∂f (x) et
x∗ ∈ ∂f ∗(∗) (x) sont équivalentes à la même relation hx∗ , xi = f (x) + f ∗ (x∗ ) =
f ∗(∗) (x) + f ∗ (x∗ ).

Corollaire 8.5.5. Supposons que f : E → R est Gâteaux différentiable en x,


et que f ∗ est Gâteaux différentiable en x∗ = f 0 (x). Alors x = f ∗0 (x∗ ).
8.6. DUALITÉ DANS L’OPTIMISATION CONVEXE 119

8.6 Dualité dans les problèmes d’optimisation convexe

Dualité de Rockafellar.

Soient E, F des EVN et Φ une application convexe E × F → R ∪ {+∞}.


L’espace vectoriel E × F est normé, par exemple par k(x, p)k = kxk + kpk. On
identifie (E × F )0 à E 0 × F 0 , le crochet de dualité étant défini par :

h(x∗ , p∗ ), (x, p)i = hx∗ , xi + hp∗ , pi

On suppose que la fonction Φ(x, 0) n’est pas identiquement +∞.

Définition 8.6.1 (Problème dual). On considère le problème :

P: Minimiser Φ(x, 0), pour x ∈ E

Le problème dual (sous-entendu : relativement à la fonction Φ) est par défini-


tion :
P∗ : Maximiser (−Φ∗ (0, p∗ )), pour p∗ ∈ F 0
Le nombre inf P = inf Φ(x, 0), (resp. sup P∗ = sup (−Φ∗ (0, p∗ ))), élément de
x∈E p∗ ∈F 0
R ∪ {−∞}) est appelé valeur du problème P (resp. P∗ ).

Définition 8.6.2 (Solutions optimales d’un problème et de son dual). On


dit que x̄ ∈ E (resp. p̄∗ ∈ F 0 ) est solution optimale de P (resp. de P∗ ) si
inf P = Φ(x̄, 0) (resp. sup P∗ = −Φ∗ (0, p̄∗ )). On notera dans ce cas min P au
lieu de inf P (resp. max P∗ au lieu de sup P∗ ).

Remarque 8.6.3. On a toujours sup P∗ ≤ inf P.


Démonstration : Ceci résulte trivialement de l’inégalité de Fenchel :

∀x ∈ E, ∀p∗ ∈ F 0 Φ(x, 0) + Φ∗ (0, p∗ ) ≥ h0, xi + hp∗ , 0i = 0

Posons h(p) = inf Φ(x, p). On a clairement inf P = h(0). Notons aussi que h
x∈E
ne peut être la constante +∞ (car Φ 6≡ +∞).

Lemme 8.6.4. On a h∗ (p∗ ) = Φ∗ (0, p∗ ), de sorte que sup P∗ = h∗∗ (0) et, si
h∗∗ n’est pas la constante −∞, l’ensemble des solutions optimales de P∗ est
égal à ∂h∗∗ (0).
120 CHAPITRE 8. FONCTIONS CONVEXES CONJUGUÉES

Démonstration : On a :
h∗ (p∗ ) = ( inf Φ(x, .))∗ (p∗ ) = sup Φ(x, .)∗ (p∗ )
x∈E x∈E
= sup sup[hp∗ , pi − Φ(x, p)] = Φ∗ (0, p∗ )
x∈E p∈F

Alors
h∗∗ (0) = sup [−h∗ (p∗ )] = sup (−Φ∗ (0, p∗ )) = sup P∗
p∗ ∈F 0 p∗ ∈F 0

si et seulement si −h∗ (p∗ )


= h∗∗ (0),
soit h∗ (p∗ ) + h∗∗ (0) = h0, p∗ i
Notons que le membre de gauche existe puisque h∗∗ diffère des constantes
±∞) ; d’après la Remarque 8.5.3, ceci équivaut à p∗ ∈ ∂h∗∗ (0) .
Lemme 8.6.5. La fonction h est convexe.
Démonstration : On a episth = {(x, t) ∈ E × R/ ∃p ∈ F : t > Φ(x, p)} =
{(x, t) ∈ E × R/ ∃p ∈ F : (x, p, t) ∈ epistΦ} : donc episth est l’image de epistΦ
par la projection naturelle E × F × R → E × R. Donc la convexité de epistΦ
entraîne celle de episth.
Théorème 8.6.6 (Égalité des solutions optimales). Supposons que la fonction
Φ vérifie la condition :
(H) Il existe x0 ∈ E telle que la fonction Φ(x0 , .) soit finie et continue au point p = 0
Alors le problème P∗ a des solutions optimales et inf P = max P∗ .
Démonstration : La conclusion est trivialement vérifiée si inf P = −∞.
On suppose donc h(0) = inf P > −∞. Comme la fonction Φ(x0 , .) est finie et
continue en 0, elle est majorée au voisinage de 0. A fortiori, la fonction h est
majorée au voisinage de 0, et comme h(0) > −∞, h ne prend pas la valeur −∞
(Lemme 1.5.13). Par conséquent, d’après la Proposition 7.1.1, h est continue
en 0. D’après la Proposition 7.3.6 elle est sous-différentiable en 0. D’après le
Corollaire 8.5.4, on a h∗∗ (0) = h(0) et ∂h∗∗ (0) = ∂h(0). D’après le Lemme
8.6.4, on a inf P = sup P∗ , et P∗ a des solutions optimales.
Proposition 8.6.7. Si les problèmes P et P∗ admettent tous deux des solutions
optimales, et si :
min P = max P∗ ∈ R
Alors toute solution optimale x̄ de P et toute solution optimale p̄∗ de P∗ sont
liées par la relation d’extrémalité :
Φ(x̄, 0) + Φ∗ (0, p̄∗ ) = 0
ce qui équivaut à : (0, p̄∗ ) ∈ ∂Φ(x̄, 0) (et si Φ est sci à (x̄, 0) ∈ ∂Φ∗ (0, p̄∗ )).
Réciproquement, si x̄ ∈ E et p̄∗ ∈ F 0 vérifient la relation d’extrémalité, alors x̄
est solution optimale de P, x̄∗ est solution optimale de P∗ , et min P = max P∗ .
8.6. DUALITÉ DANS L’OPTIMISATION CONVEXE 121

Démonstration : Comme inf P = Φ(x̄, 0), sup P∗ = −Φ∗ (0, p̄∗ ), ces deux
quantités sont égales (et finies) si et seulement si Φ(x̄, 0) + Φ∗ (0, p̄∗ ) = 0.
En écrivant 0 = h(x̄, 0), (0, x̄∗ )i, il résulte (égalité dans l’inégalité de Fenchel)
que cette relation équivaut à : (0, p̄∗ ) ∈ ∂Φ(x̄, 0) (elle entraîne donc (x̄, 0) ∈
∂Φ∗ (0, p̄∗ ), et est équivalente à cette relation lorsque Φ∗∗ (x̄, 0) = Φ(x̄, 0), en
particulier si Φ est sci).
Réciproquement, si cette relation d’extrémalité est vérifiée, on a :
inf P ≤ Φ(x̄, 0) = −Φ∗ (0, p̄∗ ) ≤ sup P∗
mais comme on a toujours sup P∗ ≤ inf P (Remarque 8.6.3), ces deux inégalités
sont des égalités.
Corollaire 8.6.8 (Théorème de Fenchel-Rockafellar). Soient f, g : E → R ∪
{+∞}, deux fonctions convexes. On suppose qu’il existe x0 ∈ E tel que

f (x0 ) < +∞ g(x0 ) < +∞
(H1 )
f est continue en x0
Alors
inf (f (x) + g(x)) = max∗ 0
(−f ∗ (−x∗ ) − g ∗ (x∗ ))
x∈E x ∈E
Démonstration : On applique le Théorème 8.6.6 à la fonction Φ : E × E →
R ∪ {+∞} définie par :
Φ(x, p) = f (x − p) + g(x)
L’hypothèse (H1 ) entraîne bien que la fonction Φ(x0 , .) est finie et continue en
0. On vérifie aisément que :
Φ∗ (x∗ , p∗ ) = f ∗ (−p∗ ) + g ∗ (x∗ + p∗ )
De sorte que le problème P : minimiser (f (x) + g(x))
a pour problème dual P∗ : maximiser (−f ∗ (−p∗ ) − g ∗ (p∗ )).
Exemple 8.6.9. Soit C un convexe fermé non vide de E. Si x0 ∈ E, on a :
d(x0 , C) = inf kx0 − xk = inf [kx0 − xk + χC (x)]
x∈C x∈E

Soit f (x) = kx − x0 k, g(x) = χC (x), on a :


f ∗ (x∗ ) = χ (x∗ ) + hx∗ , x0 i
B
E0

g ∗ (x∗ ) = suphx∗ , xi = hC (x∗ )


x∈C
On déduit donc du Corollaire 8.6.8 la relation :
d(x0 , C) = max [−hC (x∗ ) + hx∗ , x0 i]
kx∗ k≤1
122 CHAPITRE 8. FONCTIONS CONVEXES CONJUGUÉES

On considère maintenant un problème d’optimisation convexe ordinaire, c’est


à dire du type : 
minimiser f (x)
(P)
sous la contrainte g(x) ≤ 0
où f est une fonction convexe E → R ∪ {+∞} et g est une fonction E → Rm
convexe, c’est à dire que g(x) = (g1 (x), . . . , gm (x)) avec gi convexe pour tout
i = 1, . . . , m.
Définition 8.6.10 (Condition de Slater). On dit que la contrainte g(x) ≤ 0
vérifie la condition de qualification de Slater s’il existe x0 tel que f (x0 ) < +∞
et gi (x0 ) < 0 pour tout i = 1, . . . , m.
Corollaire 8.6.11. Sous la condition de qualification de Slater, il existe p̄∗ ∈
Rm , p̄∗ ≤ 0 tel que la valeur du problème (P) coïncide avec celle du problème
d’optimisation convexe sans contrainte :

(Pp̄∗ ) : Minimiser L(x, p̄∗ ) = f (x) − hp̄∗ , g(x)i, x∈E

De plus la valeur de (P) est en fait la plus grande des valeurs des problèmes
(Pp∗ ), p∗ ≤ 0.
Définition 8.6.12 (Multiplicateurs de Lagrange). 1) La fonction L : E ×
Rm → R ∪ {−∞}, définie par
(
∗ f (x) − hp∗ , g(x)i si p∗ ≤ 0
L(x, p ) =
− ∞ sinon
est appelée Lagrangien du problème (P).
2) Le m-uplet p̄∗ est appelé un système de multiplicateurs de Lagrange du
problème (P).
Démonstration : Posons
Φ(x, p) = f (x) + χCp (x)
où Cp = {x ∈ E / g(x) ≤ p}. La fonction Φ : E ×Rm → R∪{+∞} est convexe ;
de plus Φ(x0 , p) = f (x0 ) pour tout p ≥ g(x0 ) ; l’ensemble {p ∈ Rm / p > g(x0 )}
est un ouvert, contenant 0 d’après la condition de Slater ; autrement dit la
fonction p → Φ(x0 , p) est constante sur un voisinage de 0, et donc a fortiori
continue au point 0. Les conditions du Théorème 8.6.6 sont donc réalisées.
Explicitons le problème dual (P∗ ), relativement à Φ. La fonction conjuguée
est :
Φ∗ (x∗ , p∗ ) = sup [hx∗ , xi + hp∗ , pi − f (x) − χ{g(x)≤p} ]
x∈E, p∈Rm

= sup [hx∗ , xi + hp∗ , pi − f (x)]


x,p:g(x)≤p
8.6. DUALITÉ DANS L’OPTIMISATION CONVEXE 123

d’où :
Φ∗ (0, p∗ ) = sup [hp∗ , pi − f (x)]
x,p : g(x)≤p
∗ ∗

 sup[hp , g(x)i − f (x)] si p ≤ 0
x∈E
=
+ ∞ sinon

Le problème dual est donc :


Maximiser −Φ(0, p∗ ) = inf [f (x) − hp∗ , g(x)i]


(P ) x∈E
sous la contrainte p∗ ≤ 0
Le Théorème 8.6.6 montre que :
inf f (x) = max

inf [f (x) − hp∗ , g(x)i]
g(x)≤0 p ≤0 x∈E

Proposition 8.6.13 (Théorème de Kuhn-Tucker). Sous les hypothèses du Co-


rollaire 8.6.11, si le problème (P) admet une solution optimale x̄, celle-ci est
également solution optimale d’un problème sans contrainte

(Pp̄∗ ) : Minimiser L(x, p̄∗ ) = f (x) − hp̄∗ , g(x)i, x∈E

où p̄∗ ≤ 0 vérifie la condition de Kuhn-Tucker

(KT) : p̄∗ .g(x) = 0

Réciproquement si x̄ est une solution optimale du problème sans contrainte


(Pp̄∗ ) (avec p̄∗ ≤ 0) telle que g(x̄) ≤ 0, et si le couple (x̄, p̄∗ ) vérifie la condi-
tion de Kuhn-Tucker (KT), alors x̄ est solution optimale du problème (P), et
p̄∗ est un système de multiplicateurs de Lagrange pour (P).
Démonstration : i) Supposons que x̄ est solution optimale du problème
(P ). Soit p̄∗ un système de multiplicateurs de Lagrange pour (P) (Corollaire
8.6.11). On a donc :
f (x̄) = inf [f (x) − hp̄∗ , g(x)i] ≤ f (x̄) − hp̄∗ , g(x̄)i
x

Par conséquent hp̄∗ , g(x̄)i


≤ 0 (noter que f (x̄) ≤ f (x0 ) < +∞, donc f (x̄) est
finie). Mais p̄ .g(x̄) ≥ 0 puisque p̄∗ ≤ 0 et g(x̄) ≤ 0. Les nombres p∗i gi (x̄) sont

positifs, de somme négative : ils sont donc tous nuls. D’où la condition (KT)
est vérifiée et x̄ est solution optimale de Pp∗ .
ii) Réciproquement, supposons que x̄ est une solution optimale du problème
sans contrainte (Pp̄∗ ), avec p̄∗ ≤ 0, g(x̄) ≤ 0 et (KT). On a donc :
∀x ∈ E, f (x) − hp̄∗ , g(x)i ≥ f (x̄) − hp̄∗ , g(x̄)i = f (x̄)
124 CHAPITRE 8. FONCTIONS CONVEXES CONJUGUÉES

Si de plus g(x) ≤ 0, on a f (x) − hp̄∗ , g(x)i ≤ f (x), d’où f (x) ≥ f (x̄).


Remarque 8.6.14. 1) La condition de qualification de Slater n’est pas requise
dans la démonstration de la réciproque de la Proposition 8.6.13.
2) Supposons que l’espace E est de dimension finie ou est un espace de Hilbert
[ou plus généralement un espace réflexif]. Si la fonction f est sci de même que
les fonctions gi , i = 1, . . . , m et si par exemple f (x) → +∞ lorsque kxk →
∞, alors (P) admet des solutions optimales : en effet dans ce cas le convexe
C0 = {x / g(x) ≤ 0} est fermé, et on peut appliquer le Théorème 6.1.1. On a
la même conclusion lorsque C0 est borné, sans hypothèse sur le comportement
de f à l’infini.
3) Dire que x̄ est solution du problème sans contrainte (Pp∗ ) revient à dire
que 0 est dans le sous-différentiel de la fonction x → L(x, p̄∗ ) au point x̄.
Supposons par exemple les fonctions gi continues et la fonction f sci. Dans
Pmcas le
ce Théorème 7.3.9 montre que cette condition équivaut à 0 ∈ ∂f (x̄) −
p∗ ∂g(x̄), ou encore :
i=1 i

m
X
∂f (x̄) ∩ ( p∗i ∂g(x̄)) 6= ∅
i=1
Bibiographie
Oeuvres générales pour d’élargir ses connaissances :

[1] L. D. Berkovitz, Convexity and Optimization in Rn , Wiley-Interscience


2001
[2] S. Boyd, L. Vandenberghe, Convex Optimization, Cambridge University
Press 2004
[3] I. Ekeland, R. Temam, Analyse convexe et problèmes variationnels, Dunod
1974
[4] J.-B. Hiriart-Urruty, C. Lemaréchal, Fundamentals of Convex Analysis,
Grundlehren Text Editions, Springer 2001
[5] R. Tyrell Rockafellar, Convex Analysis, Princeton University Press 1996

Références pour Théorème 5.5.3 :


[6] E. J. Candès, The restricted isometry property and its implications for
compressed sensing, C. R. Acad. Sci. Paris, Ser. I 346 (2008), 589-592.
[7] R. Vershynin, On the role of sparsity in Compressed Sensing and random
matrix theory, 2009 3rd IEEE International Workshop on CAMSAP,
Aruba, Dutch Antilles, 2009, 189-192.

125
Index

Acquisition comprimée, 82 ouvert, 16


Adhérence d’une partie, 18 Enveloppe convexe, 2
Application monotone, 104 Enveloppe convexe fermée, 27
Arêtes d’un convexe, 10, 71 Epigraphe d’une fonction, 13
Espaces
Cône, 3 de Hilbert, 85
asymptotique, 57 euclidiens, 16
convexe engendré, 4 isométriques, 21
convexe saillant, 52 isomorphes, 21
tangent, 41 préhilbertiens, 16
Coeur d’un convexe, 41 separables, 25
Combinaison convexe, 1
Compact, 19 Face d’un convexe, 10
Condition de Slater, 122 exposée, 11
Continuité des fonctions convexes, 99Facette d’un convexe, 10
Convexe, 1 Fonction
∗-polyédral, 66 caractéristique, 13
polyédral, 62 coercive, 85
conjuguée, 114
Décomposition en dimension finie
convexe, 11, 13
des cônes convexes fermés, 53
convexe impropre, 14
des convexes fermés, 60
convexe propre, 14
des convexes fermés ne contenant
d’appui, 115
pas de droite, 58
localement lipschitzienne, 100
des convexes polyédraux, 65
objectif, 73
Dérivées directionnelles, 102
régularisée convexe sci d’une, 114
Demi-espaces, 8
s.c.i., 32, 34
Dimension d’un convexe, 7, 40
strictement convexe, 12
Direction d’un sous-espace affine, 6
Fréchet différentiabilité, 105
Domaine effectif d’une fonction, 12
Dual d’un EVN, 23 Génératrice extrémale, 54
Ensemble Gâteau différentiabilité, 103
dense, 30 Hyperplan affine, 7
fermé, 17

127
128 INDEX

Hyperplan d’appui d’un convexe, 10 voisins, 72


Sous-espace affine engendré, 6
Indépendance affine, 6 Sous-espace facial d’un convexe, 96
Intérieur d’une partie, 18 Sous-espaces affines, 5
Intérieur relatif d’un convexe, 47 Sous-gradient, 106
Jauge d’un convexe, 26 Théorème
Langrangien, 122 de Carathéodory, 51
Lemme de Farkas, 68 de Fenchel-Rockafellar, 121
de Hahn-Banach en dimension fi-
Minimum d’une fonction convexe, 102 nie #1, 45
Gâteaux différentiable, 103 de Hahn-Banach en dimension fi-
s.c.i. sur l’espace de Hilbert, 85 nie #2, 45
Multiplicateurs de Lagrange, 122 de Hahn-Banach en dimension fi-
nie #3, 46
Norme d’une forme linéaire, 23 de Hahn-Banach géométrique, 93
Normes équivalentes, 15 de Hahn-Banach géométrique Hil-
bertien, 89
Point exposé d’un convexe, 11
de Krein-Milman, 96
Point extrémal d’un convexe, 9
de Krein-Milman en dimension fi-
Polaire d’une partie, 61
nie, 50
Polytope, 66
de Krein-Milman Hilbertien, 91
Problème dual, 119
de Krein-Milman pour les cônes
Programmation linéaire, 69
en dimension finie, 55
Programme
de Kuhn-Tucker, 123
admissible, 69
de la biconjuguée, 116
optimal, 69
de Lyapounov, 97
Programmes de base, 74
de projection dans les espaces eu-
paramétrisation des, 76
clidiens de dimension finie, 42
voisins, 76
de séparation d’un point et d’un
Projection dans les espaces de Hilbert,
convexe ouvert en dimension
87
finie, 44
Prolongement convexe, 12
de séparation #1, 93
Prolongement convexe s.c.i., 36
de séparation #2, 94
Prolongement s.c.i., 35
de séparation d’un point et d’un
Règles de Fermat, 102, 103, 107 convexe fermé dans un espace
Repère affine, 7 de dimension finie, 43
de séparation dans un espace de
Solution optimale, 85 Hilbert #1, 87
d’un problème et de son dual, 119 de séparation dans un espace de
Sommets, 64 Hilbert #2, 88
INDEX 129

de séparation fonctionnel, 110 120


du bipolaire, 61
sur l’égalité des solutions optimales, Vecteur parcimonieux, 83
Vecteur test, 78

Vous aimerez peut-être aussi