Chapitre 3 Optimisation non linaire avec contraintes - PowerPoint PPT Presentation

1 / 65

About This Presentation

Title:

Chapitre 3 Optimisation non linaire avec contraintes

Description:

Un vecteur admissible est un vecteur qui v rifie les contraintes. ... Le vecteur dk 0 est une direction admissible en xk s'il existe e 0 tel que ... – PowerPoint PPT presentation

Number of Views:354

Avg rating:3.0/5.0

Slides: 66

Provided by: michelbi9

Category:

more less

Transcript and Presenter's Notes

Title: Chapitre 3 Optimisation non linaire avec contraintes

1
Chapitre 3Optimisation non linéaireavec
contraintes

Optimisation I
Systèmes de Communication

2
Optimisation sur un convexe
3
Introduction

Problème
min f(x)
s.c. x ? X
où
X est un sous-ensemble non vide, convexe et fermé
de IRn,
f est continûment différentiable sur X.

4
Introduction

Souvent, X possède une structure spécifiée par
des équations et des inéquations.
Dans ce chapitre, on ne tient pas compte de cette
structure.
Le chapitre sur les multiplicateurs de Lagrange
sera consacré à cela.

5
Conditions doptimalité

Définitions
Un vecteur admissible est un vecteur qui vérifie
les contraintes.
x est admissible ssi x ? X.
Un vecteur x ? X est un minimum local de f sur X
sil existe ? gt 0 tel que
f(x) f(x) ?x ? X tel que x-xlt ?
Un vecteur x ? X est un minimum global de f sur
X si
f(x) f(x) ?x ? X

6
Conditions doptimalité

Définitions
Un vecteur x ? X est un minimum local strict de
f sur X sil existe ? gt 0 tel que
f(x) lt f(x) ?x(?x) ? X tel que x-xlt ?
Un vecteur x ? X est un minimum global strict de
f sur X si
f(x) lt f(x) ?x(?x) ? X

7
Conditions doptimalité

Propriétés
Si f est une fonction convexe, alors un minimum
local de f sur X est aussi un minimum global.
Si, de plus, f est strictement convexe sur X,
alors il existe au plus un minimum global de f
sur X.

8
Conditions doptimalité

Idée
A un minimum local x, les variations du premier
ordre ?f(x)T?x seront non négatives lorsque ?x
est petit et admissible.
Comme X est convexe, les ?x admissibles seront de
la forme
?xx-x, avec x ? X.

9
Conditions doptimalité

Propriété
Si x est un minimum local de f sur X, alors
?f(x)T(x-x) ³ 0, ?x?X.
Si f est convexe sur X, la condition est
également suffisante pour que x minimise f sur
X.

10
Conditions doptimalité

Preuve
Supposons par labsurde quil existe x ? X tel
que
?f(x)T(x-x) lt 0.
Théorème de la valeur moyenne
?y,z ?x ? conv(y,z) tel que f(y)-f(z)?f(x)T(y-z)
Pour tout ? gt 0 y?x?(x-x), z?x
il existe x ?conv(x, x?(x-x)) tel que
f(x?(x-x)) - f(x) ??f(x)T(x-x)
Posons x xs?(x-x)
Pour tout ? gt 0 il existe s ?0,1 tel que
f(x?(x-x)) - f(x) ??f(xs?(x-x))T(x-x)

11
Conditions doptimalité

Preuve (suite)
Comme ?f est continue, pour ? suffisamment petit
on a
?f(xs?(x-x))T(x-x) lt 0.
cest-à-dire
f(x?(x-x)) lt f(x).
Comme X est convexe, si ? ? 0,1, x?(x-x) est
admissible.
Cest contradictoire avec loptimalité de x.

12
Conditions doptimalité
X
?f(x)
x
13
Conditions doptimalité
X
?f(x)
x
14
Conditions doptimalité

Définition
Un vecteur x vérifiant les conditions
nécessaires doptimalité est appelé un point
stationnaire.

15
Conditions doptimalité

Exemple
X x x ³ 0.
Condition nécessaire doptimalité

Fixons i, et posons
xjxj pour j ? i.
xi xi 1

16
Conditions doptimalité

Exemple (suite)
On obtient

Si xi gt 0, posons
xjxj pour j ? i.
xi ½ xi

17
Conditions doptimalité

Exemple (suite)
On obtient

cest-à-dire
18
Conditions doptimalité
X
?f(x)
x
19
Conditions doptimalité
X
?f(x)
x
20
Conditions doptimalité

Exemple
X x a x b.
Conditions nécessaires doptimalité

21
Directions admissibles

Définition
Soit xk un vecteur admissible. Le vecteur dk ? 0
est une direction admissible en xk sil existe e
gt 0 tel que
xk a dk ? X ? 0 a e.

22
Directions admissibles
direction non admissible
direction admissible
toutes les directions sont admissibles
direction admissible
23
Directions admissibles

Interprétation des conditions doptimalité
Aucune direction admissible nest une direction
de descente.
Soit x ? X
Direction admissible d x-x
Direction de descente ?f(x)Td lt 0
Cond. doptimalité ?f(x)T(x-x) ³ 0

24
Méthode des directions admissibles

Soit une solution admissible x0 ? X.
Pour k0,
Si xk est stationnaire, STOP.
xk1 xk ak dk
où
dk est une direction admissible
?f(xk)Tdk lt 0
ak gt 0 est tel que xk1 ? X.

25
Méthode des directions admissibles

Lorsque X est convexe, les directions admissibles
dk sont de la forme
dk g(yk-xk) g gt 0,
où yk est un vecteur admissible différent de xk.

dk
X
yk
xk
26
Méthode des directions admissibles

Soit une solution admissible x0 ? X.
Pour k0,
Si xk est stationnaire, STOP.
xk1 xk ak (yk xk)
où
yk ? X, yk ? xk
?f(xk)T(yk-xk) lt 0
ak ? 0,1.

27
Méthode de Frank-Wolfe

Pour trouver yk ? X vérifiant
?f(xk)T(yk-xk) lt 0,
on résout
miny ?f(xk)T(y-xk)
s.c. y ? X

28
Méthode de Frank-Wolfe

Choix du pas
Règle de minimisation
ak argmina ? 0,1 f(xka(yk-xk))
Règle dArmijo
f(xkak(yk-xk)) f(xk)akb1?f(xk)T(yk-xk)
b1 ? 0,1

29
Méthode de Frank-Wolfe

Notes
Le sous-problème possède une solution admissible
car X est fermé.
Cette méthode nest opérationnelle que si le
sous-problème est simple à résoudre.
Cest le cas lorsque X est défini par des
contraintes linéaires, cest-à-dire X est un
polyèdre.
Le sous problème est alors un programme linéaire.

30
Méthodes du gradient projeté

La méthode de Frank-Wolfe se base sur un
sous-problème à coût linéaire.
Les méthodes du gradient projeté se basent sur un
sous-problème à coût quadratique.
Il est plus difficile à résoudre, mais la
convergence est meilleure.

31
Méthodes du gradient projeté

Définition
Soit z ? IRn.
Soit x solution (unique) de
minx z-x2
s.c. x ? X.
x est la projection de z sur X.
On notera
x z

32
Méthodes du gradient projeté

Propriété
Soit z ? IRn et x ? X.
x z
si et seulement si
(z-x)T(x-x) 0 ?x ? X

x
X
z
x
33
Méthodes du gradient projeté

Soit une solution admissible x0 ? X.
Pour k0,
Si xk est stationnaire, STOP.
xk1 xk ak (yk xk)
où
yk xk - sk ?f(xk)
ak ? 0,1,
sk ? IR, sk gt 0.

34
xk
xk ak(yk-xk)
yk
xk- sk?f(xk)
xk- sk?f(xk)
35
Méthodes du gradient projeté

Notes
La méthode nest opérationnelle que si
lopération de projection est suffisamment
simple.
Si xk- sk?f(xk) est admissible, il sagit dune
itération de la plus forte pente.

36
Méthodes du gradient projeté

Propriété
x x - s?f(x) ?sgt0
si et seulement si
x est stationnaire.
Preuve
Tous les points suivants sont équivalents
x est stationnaire
?f(x)T(x-x) ³ 0 ?x ? X
-s?f(x)T(x-x) 0 ?x ? X, ?s gt 0
(x - s?f(x) - x)T(x-x) 0 ?x ? X, ?s gt 0

37
Méthodes du gradient projeté

Preuve (suite)
(x - s?f(x) - x)T(x-x) 0 ?x ? X, ?s gt 0
Posons z x - s?f(x)
(z - x)T(x-x) 0 ?x ? X, ?s gt 0
x z ?s gt 0
x x - s?f(x) ?s gt 0

38
Méthodes du gradient projeté

Choix des pas sk et ak.
1) Armijo le long de la direction admissible
sk s, k0,1
ak est choisi par la règle dArmijo sur
lintervalle 0,1
Soient b ? 0,1, s ? 0,1
ak bmk où mk est le premier entier positif tel
que
f(xk)-f(xkbm(yk-xk)) ³ -sbm?f(xk)T(yk-xk)

39
Méthodes du gradient projeté

2) Armijo le long de larc de projection
ak 1, k0,1,
Le pas sk est déterminé en appliquant une règle
de style Armijo le long de larc de projection
xk(s) s gt 0 xk-s?f(xk) s gt 0

40
Méthodes du gradient projeté

Exemple x(x1,x2)T?IR2
f(x) (x13)2 4(x2-1)2
X (x1,x2)T x1 ³ 0, x2 ³ 0
xk (5,5)T
?f(x) (2x16, 8 x2 -8)T
?f(xk) (16,32)T
xk-s ?f(xk) (5-16s,5-32s)T

41
xk
xk(s)xk-s?f(xk)
xk -s ?f(xk)
42
Méthodes du gradient projeté

Exemple (suite)
xk(s)
(5-16s,5-32s) si 0 s 5/32
(5-16s,0) si 5/32 s 5/16
0 si s gt 5/16
f(xk(s))
4352s2-1280s128 si 0 s 5/32
256s2-256s68 si 5/32 s 5/16
f(0) si s gt 5/16

43
s5/32
s5/16
f(xk(s))
s
44
Méthodes du gradient projeté

Soient s gt 0, b?0,1, s?0,1
sk bmk où mk est le premier entier positif tel
que
f(xk)-f(xk(bms)) ³ s?f(xk)T(xk-xk(bms))
ou encore
f(xk(bms))-f(xk) s?f(xk)T(xk(bms)-xk)

45
f(xk(s))-f(xk)
s?f(xk)T(xk(s)-xk)
Pas acceptables
s
46
Méthodes du gradient projeté

Notes
Coût élevé pour le calcul de la projection.
Convergence lente.
Nécessité de préconditionner.

47
Méthode du gradient projeté préconditionné

Soit une matrice Hk définie positive.
Hk LkLkT
Changement de variable
x Lk-T z.
Problème
min hk(z)f(Lk-Tz)
s.c. z ? Zk
Zkz Lk-Tz ? X

48
Méthode du gradient projeté préconditionné

Itération du gradient projeté
zk1 zk ak(yk-zk)
avec
ykzk - sk?hk(zk)
ou encore
yk argminy ? Zk y-zk sk?hk(zk)2

49
Méthode du gradient projeté préconditionné

y-zk sk?hk(zk)2
(sk)2 ?hk(zk)2 2sk?hk(zk)T(y-zk)
y-zk2
Donc,
yk argminy ? Zk 2sk?hk(zk)T(y-zk) y-zk2
ou encore
yk argminy ? Zk ?hk(zk)T(y-zk) y-zk2/ 2sk
Posons
LkTy y, LkTyk yk, LkTxkzk
Comme hk(z)f(Lk-Tz) , on a
?hk(zk) Lk-1 ?f(xk)

50
Méthode du gradient projeté préconditionné

yk argminy ? Zk ?hk(zk)T(y-zk) y-zk2/ 2sk
LkTyk argminLkTy ? Zk ?f(xk)TLk-T(LkTy -LkTxk)
LkTy -LkTxk 2 / 2sk
yk argminy ? X ?f(xk)T(y-xk)
(y-xk)TLkLkT(y-xk) /2sk
yk argminy ? X ?f(xk)T(y-xk) (y-xk)THk(y-xk)
/ 2sk
Une itération de la méthode
zk1 zk ak(yk-zk)
LkTxk1 LkTxk ak(LkTyk-LkTxk)
xk1 xk ak(yk-xk)

51
Méthode du gradient projeté préconditionné

Note
Un programme quadratique doit être résolu à
chaque itération.
La convergence dépend des valeurs propres de
Lk-1?f2(xk)Lk-T
Choix naturel pour Hk ?f2(xk)
Méthode de Newton contrainte

52
Problème quadratique

Analysons plus en détail le programme quadratique
dans le cas où les contraintes sont linéaires.
Problème 1
min ½ x2 cTx
s.c. Ax 0
équivalent à
min ½ x2 cTx ½c2 cx2
s.c. Ax 0
Cest la projection de -c sur les contraintes.

53
Problème quadratique

x est lunique projection de c sur
X x Ax 0
si et seulement si
(cx)Tx0 ?x tel que Ax 0.
Le vecteur
x AT(AAT)-1Ac c
vérifie cette condition.
Note on suppose A de rang plein.

54
Problème quadratique

Problème 1
min ½ x2 cTx
s.c. Ax 0
Solution
x AT(AAT)-1Ac c

55
Problème quadratique

Problème 2
miny ½ a2(y-xk)TH(y-xk)cT(y-xk)
s.c. Ay b
avec xk vérifiant Axkb.
Soit HLLT. Posons z aLT(y-xk).
min ½ zTL-1LLTL-Tz cTL-Tz/a
s.c. Axk AL-Tz /a b
ou encore
min ½ zTz cTL-Tz /a
s.c. AL-Tz/a 0

56
Problème quadratique

Cest le problème 1 où
c est remplacé par L-1c/a
A est remplacé par AL-T/a
La solution est donc
az L-1AT(AL-TL-1AT)-1AL-TL-1c L-1c
az L-1AT(AH-1AT)-1AH-1c L-1c
a2LT(y-xk) L-1AT(AH-1AT)-1AH-1c L-1c
a2LT(y-xk) L-1ATl L-1c
avec l (AH-1AT)-1AH-1c

57
Problème quadratique

a2LT(y-xk) L-1ATl L-1c
y-xk (H-1ATl H-1c)/a2
y xk H-1(ATl c)/a2
avec l (AH-1AT)-1AH-1c
solution de
min ½ a2(y-xk)TH(y-xk)cT(y-xk)
s.c. Ay b

58
Programmation linéaire

Appliquons la méthode du gradient projeté
préconditionné à un programme linéaire en forme
standard.
min cTx
s.c. Ax b
x³0
La solution se trouve sur un sommet du polyèdre
des contraintes.
Lalgorithme va lapprocher de lintérieur du
polyèdre.

59
Programmation linéaire