CH.1-1.2 1
CH.1-1.2 1
CH.1-1.2 1
1.2.1 Définitions
Soit K ⸦ IRn un ensemble convexe non vide et f: K IR. F est dite convexe sur K si:
x,yϵK, λϵ[0,1] alors f(λx+(1-λ)y) ≤ λf(x)+(1-λ)f(y), f est strictement convexe sur K si:
x,yϵK, x≠y, λϵ]0,1[ alors f(λx+(1-λ)y) < λf(x)+(1-λ)f(y).
f est dite concave sur K si (-f) est convexe sur K.
x1 x2 x x1 x2 x
λx1+(1-λ)x2 fonction concave
Fonction convexe y
[u,v]=[(x1,y1),(x2,y2)]={λu+(1-λ)v/λϵ[0,1]} u•
La corde [u,v] est au-dessus de l’arc de courbe de f correspondant •v
•
a x b a x b
Remarque:
Une fonction peut-être convexe dans un domaine mais pas dans IRn.
Exemple:
f(x) = x3 n’est pas convexe dans IR, mais convexe dans le domaine K = {xϵIR / x ≥ 0}.
Propriétés:
a) Soient α > 0 et f une fonction convexe, alörs αf est convexe.
b) La somme de deux fonctions convexes est convexe.
�
c) Soient f1, f2, ...,fm : IRn IR fonctions convexes, alors f(x) = � � (�)
�=1 � �
où αi > 0 pour
i=1,2,...,m est une fonction convexe.
5
1.2.3 Théorème de Jensen:
Si f est convexe sur un ensemble convexe K, alors pour tout x1, x2, ...,xm ϵK et tous les λi ≥ 0
pour i = 1,2,..., m tel que � � = 1, f( �
�=1 �
� � ≤ �
�=1 � � )
� � (� ).
�=1 � � �
Preuve: par récurrence sur m.
1.2.4 Définition.
On appelle épigraphe de f noté epi(f), la partie de l’espace IRnxIR qui est au-dessus de son graphe,
Epi(f) = {(x,t) / f(x) ≤ t}.
Proposition:
Une fonction f est convexe si et seulement si son épigraphe est un sous-ensemble convexe de IRnxIR.
Exemple:
epi(f) epi(f)
y=f(x) y=f(x)
t
x
Preuve:
Si f est convexe,
(x1,t1), (x2,t2) ϵ epi(f) donc, f(x1) ≤ t1 et f(x2) ≤ t2,
λ(x1,t1)+(1-λ) (x2,t2) = (λx1+(1-λ)x2 , λt1+(1-λ)t2),
f(λx1+(1-λ)x2) ≤ λf(x1)+(1-λ)f(x2) ≤ λt1+(1-λ)t2,
λx1+(1-λ)x2 ϵ K alors (λx1+(1-λ)x2 , λt1+(1-λ)t2) ϵ epi(f)
epi(f) est convexe.
Réciproquement :
Si epi(f) est convexe, avec t1 = f(x1), t2 = f(x2) et (x1, f(x1)), (x2, f(x2)) ϵ epi(f)
(λx1+(1-λ)x2 , λf(x1)+(1-λ)f(x2)) ϵ epi(f), par définition, f(λx1+(1-λ)x2) ≤ λf(x1)+(1-λ)f(x2),
f est donc convexe.
Lemme:
� �
On considère une matrice symétrique H = , alors:
� �
H est s-D.P ɑ ≥ 0, c ≥ 0 et ɑc - b2 ≥ 0.
H est D.P ɑ > 0 et ɑc - b2 > 0.
Remarque:
H est s-D.N (-H) est s-D.P
H est D.N (-H) est D.P
6
Théorème: Algorithme de superdiagonalisation
Soit H = (hij)1 ≤ i, j≤ n matrice symétrique carrée d’ordre n.
1) Si i ϵ {1,2,...,n} avec hii ≤ 0 alors A est non D.P.
2) Si i ϵ {1,2,...,n} avec hii < 0 alors A est non s-D.P.
3) Si i,j ϵ {1,2,...,n} i ≠ j avec hii = 0 et hij ≠ 0alors A est non s-D.P.
0 0
0
H est s-D.P A est s-D.P
ℎ11 . . . ℎ1�
ℎ2�
.
5) Si H = où h11 > 0. On échelonne pour obtenir,
.
.
ℎ�1
ℎ11 ℎ1�
ℎ
�= � où iϵ{2,3,...,n}, �'� = �� - ℎ �1 �1 , alors:
11
�2 �� � < 1
Exemple: K = {xϵ IR / -1 ≤ x ≤ 1} et f(x) = 3 ;
�� � = 1
2
7
1.5 Convexité et différentiabilité:
Soit f : IRn IR, f admet des dérivées partielles d’ordre 1.
Définition:
On appelle Gradient de f, le vecteur: ▽f(x) =
�� �� ��
(�), (�), . . . , (�) T.
��1 ��2 ���
Si f est de classe C2, la matrice Hessienne de f est la matrice Hf définie comme suit:
�2 �
Hf = (hij) où hij = �� �� (�), 1 ≤ i,j ≤ n.
� �
Définition:
f est différentiable en x0 , si:
i) Le vecteur gradient ▽f(x) existe,
�(�0 +ℎ)−�(�0)−��(�0)� .ℎ
ii) lim ℎ
= 0.
ℎ→0
Dérivée directionnelle:
f est définie au Vα(x0) et dϵIRn. On dit que f admet une dérivée directionnelle en x0 dans la direction
��
d, notée �� (x0) si:
�(�0 +ℎ.�)−�(�0) ��
lim
ℎ
= ��
(x0) existe.
ℎ→0
Propriété:
��
Si f est différentiable en x0 alors, �� (x0) existe pour toute direction d et on a,
8
x,yϵK, λϵ[0,1], λx+(1-λ)yϵK, on écrit: λx+(1-λ)y = y+λ(x-y)ϵK, alors,
f(y+λ(x-y)) ≤ λf(x)+(1-λ)f(y),
f(y+λ(x−y)) �(�)
�
≤ f(x) - f(y)+ � ,
f(y+λ(x−y))−f(y)
f(x) ≥ f(y)+ �
quand λ 0,
f(x) ≥ f(y)+f ’(y)(x-y), en renversant les variables:
λy+(1-λ)x = x+λ(y-x), on obtient:
f(y) ≥ f(x)+f ’(x)(y-x).
Réciproque:
x,yϵK, f(y) ≥ f(x)+f ’(x)(y-x).
Soit x ≠ y , λϵ[0,1] et soit z = λx+(1-λ)y,
Pour x et z : f(x) ≥ f(z)+f ’(z)(x-z),
Pour y et z : f(y) ≥ f(z)+f ’(z)(y-z), on obtient:
λf(x)+(1-λ)f(y) ≥ f(z)+f ’(z)[λ(x-z)+(1-λ)(y-z)], alors
=0
f est convexe.
Interprétation géométrique:
f est convexe, alors f(y) ≥ f(x)+f ’(x)(y-x), x,yϵK.
L’équation de la tangente à la courbe de f au point x0: y-f(x0) = f ’(x0)(x-x0) y = f(x0)+f ’(x0)(x-x0).
(T):tangente
y x y x
f(y) ≥ f(x)+f ’(x)(y-x) f(y) ≤ f(x)+f ’(x)(y-x)
Si f est convexe, alors la courbe de f est si f est concave, alors la courbe
toujours au-dessus de sa tangente. de f est toujours au-dessous de sa
tangente.
Propriétés: 2eme formule de convexité
9
Remarque:
1/ pour une fonction de IR dans IR, f est convexe f ’’(x) ≥ 0 xϵK.
2/ si Hf est D.P xϵK f est strictement convexe sur K. La réciproque est fausse.
Si f est strictement convexe sur K Hf est s-D.P xϵK.
C. exemple:
f(x) = x4 est strictement convexe sur IR mais f ’’(0) = 0.
Exemples:
x eax est convexe sur IR, aϵIR*.
x xa est convexe sur ��∗+ a ≤ 0 ou a ≥ 1,
et concave pour 0 ≤ a ≤ 1.
x |x|p , p ≥ 1 sont convexes sur IR.
x Lnx est convexe sur IR*.
x xLnx est convexe sur IR*,
���� �� ����∗+
x est convexe sur IR+.
0 �� � = 0
�2
f(x,y) = � , y ≠ 0, y > 0, f est convexe.
N: IRn IR une norme sur IRn est convexe.
10