Chapitre 3 - Régulation Par Retour Détat

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 6

Chapitre 3 Régulation par retour d'état linéarisant

Chapitre 3 :
Régulation par retour d'état linéarisant : linéarisation entrée/sortie.

1. Linéarisation locale et stabilisation


Une méthode simple consiste à linéariser la dynamique non linéaire du système (approximation du
premier ordre) autour d’un point de fonctionnement de telle sorte que les outils de la commande
linéaire peuvent être utilisés pour la synthèse d’une loi de commande. Cependant, cette méthode
n’est valable que localement autour du point de fonctionnement considéré.
Soit le système non linéaire suivant : 𝑥 = 𝑓(𝑥, 𝑢) avec le point de fonctionnement 𝑥𝑒 , 𝑢𝑒 qui
vérifie 𝑓 𝑥𝑒 , 𝑢𝑒 = 0. Si 𝑢𝑒 = 0, on parle de point d’équilibre. Le système linéarisé autour de ce
point de fonctionnement est donné par : 𝑥𝛿 = 𝐴𝑥𝛿 + 𝐵𝑢𝛿 où 𝑥𝛿 = 𝑥 − 𝑥𝑒 , 𝑢𝛿 = 𝑢 − 𝑢𝑒 ,
𝜕𝑓 (𝑥,𝑢) 𝜕𝑓 (𝑥,𝑢)
𝐴= ,𝐵= .
𝜕𝑥 𝑥=𝑥 𝑒 ,𝑢=𝑢 𝑒 𝜕𝑢 𝑥 =𝑥 𝑒 ,𝑢=𝑢 𝑒

Si la paire (𝐴, 𝐵) est commandable, on peut calculer un retour d’état de la forme : 𝑢𝛿 = −𝐾𝑥𝛿 par
la méthode d’imposition des pôles par exemple.
Exemple : Soit le modèle d’un pendule
𝑥1 = 𝑥2 𝑔 𝑘 1
, 𝑎 = 𝑙 > 0, 𝑏 = 𝑚 > 0 et c= 𝑚 𝑙 2 > 0
𝑥2 = −𝑎 sin 𝑥1 − 𝑏𝑥2 + 𝑐𝑢
𝑥1 = 𝜃, 𝑥1 = 𝜃
Objectif : Stabiliser le pendule à 𝜃 = 𝜃. Alors, 𝑥1 = 𝜃 ⇒ 𝑥1𝑒 = 𝜃, d’où il vient :
𝑥1𝑒 = 𝑥2𝑒 = 0 𝑎
⇒ 𝑥1𝑒 = 𝜃 , 𝑥2𝑒 = 0, 𝑢𝑒 = 𝑐 sin⁡𝜃 .
𝑥2𝑒 = −𝑎 sin 𝑥1𝑒 − 𝑏𝑥2𝑒 + 𝑐𝑢𝑒 = 0
Le système linéairisé autour de ce point de fonctionnement est donné par :
𝑥𝛿 = 𝐴𝑥𝛿 + 𝐵𝑢𝛿 , 𝑥𝛿 = 𝑥 − 𝑥𝑒 , 𝑢𝛿 = 𝑢 − 𝑢𝑒 ;
𝜕𝑓 (𝑥,𝑢) 0 1 0 1
𝐴= = = ,
𝜕𝑥 𝑥=𝑥 𝑒 ,𝑢=𝑢 𝑒 −𝑎 cos 𝑥1 −𝑏 𝑥=𝑥 𝑒 ,𝑢=𝑢 𝑒 −𝑎 cos 𝜃 −𝑏
𝜕𝑓 (𝑥,𝑢) 0
𝐵= =
𝜕𝑢 𝑥=𝑥 𝑒 ,𝑢=𝑢 𝑒 𝑐
La paire 𝐴, 𝐵 est commandable, et si on choisit une loi de commande linéaire de la forme :
𝑢𝛿 = −𝑘𝑥𝛿 où 𝑘 = 𝑘1 𝑘2 , le système bouclé s’écrit : 𝑥𝛿 = 𝐴 − 𝐵𝐾 𝑥𝛿 où
0 1
𝐴 − 𝐵𝐾 = .
− 𝑎 cos 𝜃 + 𝑐𝑘1 −(𝑏 + 𝑐𝑘2 )
Les gains 𝑘1 et 𝑘2 peuvent être calculés par la méthode d’imposition de pôles. Si on impose au
système bouclé les pôles 𝑝1 et 𝑝2 , on obtient : det 𝑠𝐼 − 𝐴 − 𝐵𝐾 = 𝑠 − 𝑝1 𝑠 − 𝑝2 = 𝑠 2 −
𝑝1 + 𝑝2 𝑠 + 𝑝1 𝑝2 .
𝑎 cos 𝜃 + 𝑐𝑘1 = 𝑝1 𝑝2
Par identification on obtient : , ce qui donne :
𝑏 + 𝑐𝑘2 = − 𝑝1 + 𝑝2
1
Chapitre 3 Régulation par retour d'état linéarisant

𝑘1 = 1 𝑐 𝑝1 𝑝2 − 𝑎 cos 𝜃
.
𝑘2 = − 1 𝑐 𝑝1 + 𝑝2 + 𝑏
et la loi de commande finale est donnée par : 𝑢 = 𝑢𝑒 − 𝑘1 𝑥1 − 𝜃 − 𝑘2 𝑥2 .
2. Notions de géométrie différentielle
2.1. Champ de vecteur : on appelle champ de vecteur une fonction :𝑓 ∶ Ω ⊆ ℝ𝑛 ⟶ ℝ𝑛 ,
donnée par :
𝑓1 (𝑥1 , … , 𝑥𝑛 )
𝑓 𝑥 = ⋮ .
𝑓𝑛 (𝑥1 , … , 𝑥𝑛 )
2.2. Gradient : Pour une fonction scalaire 𝑕 𝑥1 , … , 𝑥𝑛 ∶ Ω ⊆ ℝ𝑛 ⟶ ℝ, le gradient est défini
𝜕𝑕 𝜕𝑕
par : ∇𝑕 = ,…, (vecteur ligne).
𝜕𝑥 1 𝜕𝑥 𝑛
2.3. Jacobien : Le Jacobien (ou matrice Jacobienne) d’un champs de vecteur 𝑓 𝑥 est donné par:
∇𝑓1
𝜕𝑓
∇𝑓 = 𝜕𝑥 = ⋮ (matrice 𝑛 × 𝑛).
∇𝑓𝑛
2.4. Difféomorphisme : Une fonction 𝜙 ∶ Ω ⊆ ℝ𝑛 ⟶ ℝ𝑛 est un difféomorphisme si son
inverse 𝜙 −1 existe, et 𝜙 𝑥 et 𝜙 −1 (𝑥) sont continûment dérivables.
𝜕𝜙
Remarque : 𝜙 𝑥 est un difféomorphisme si est seulement si est inversible pour tout x ∈ Ω.
𝜕𝑥
Si Ω ≡ ℝ𝑛 et lim 𝑥 →∞ 𝜙 𝑥 = ∞, on parle de difféomorphisme global.
2.5. Dérivée de Lie : Soit une fonction scalaire 𝑕(𝑥) et un champ de vecteur 𝑓(𝑥), la dérivée de
Lie de 𝑕(𝑥) par rapport à 𝑓(𝑥) ou le long de 𝑓(𝑥), est une fonction scalaire donnée par :
𝑛
𝜕𝑕 𝜕𝑕
𝐿𝑓 𝑕 𝑥 = ∇𝑕. 𝑓 = 𝑓 𝑥 = 𝑓 𝑥
𝜕𝑥 𝜕𝑥𝑖 𝑖
𝑖=1

Les dérivées de Lie d’ordre supérieur sont données par :


𝐿0𝑓 𝑕 = 𝑕
𝐿𝑖𝑓 𝑕 = 𝐿𝑓 𝐿𝑖−1 𝑖−1
𝑓 𝑕 = ∇ 𝐿𝑓 𝑕 𝑓, 𝑖 ≥ 1

Exemple :
Soit la fonction scalaire 𝑕 𝑥 = 𝑥12 + 𝑥1 𝑥2 ,
−2𝑥1 + 𝑥2
et le champs de vecteur 𝑓 𝑥 = .
−𝑥2 cos 𝑥1
Alors le gradient de 𝑕 𝑥 est : ∇𝑕 𝑥 = (2𝑥1 + 𝑥2 𝑥1 ).
−2 1
et le Jacobien de 𝑓 𝑥 est : ∇𝑓 = .
𝑥2 sin 𝑥1 − cos 𝑥1
𝜕𝑕 𝜕𝑕
La dérivée de Lie : 𝐿𝑓 𝑕 𝑥 = ∇𝑕. 𝑓 = 𝜕𝑥 𝑓1 + 𝜕𝑥 𝑓2 = 2𝑥1 + 𝑥2 −2𝑥1 + 𝑥2 − 𝑥1 𝑥2 cos 𝑥1 =
1 2
−4𝑥12 + 𝑥22 − 𝑥1 𝑥2 cos 𝑥1 .

2
Chapitre 3 Régulation par retour d'état linéarisant

2.6. Degré relatif


𝑥 =𝑓 𝑥 +𝑔 𝑥 𝑢
Le système est dit de degré relatif 𝑟 si :
𝑦=𝑕 𝑥
𝐿𝑔 𝐿𝑖𝑓 𝑕 𝑥 = 0, 0<𝑖 <𝑟−1

𝐿𝑔 𝐿𝑟−1
𝑓 𝑕 𝑥 ≠0

3. Linéarisation par bouclage


L’idée de cette technique s’appuie d’une part, sur la remarque que le principal obstacle dans la
synthèse de lois de commande pour les systèmes non linéaires est la présence des non-linéarités
dans le système et d’autre part, qu’il existe un nombre important de techniques efficaces de
synthèse dans le cas de systèmes linéaires. Si l’on est capable par des transformations adéquates de
linéariser toute (ou une partie de) la dynamique du système non linéaire, on peut ensuite utiliser les
techniques de synthèse de lois de commande des systèmes linéaires. C’est la philosophie de la
linéarisation par bouclage. La classe de systèmes non linéaires considérée est la classe dite affine en
𝑥 =𝑓 𝑥 +𝑔 𝑥 𝑢
l’entrée : , 𝑥 ∈ ℝ𝑛
𝑦=𝑕 𝑥
3.1. Linéarisation entrée-sortie
C’est une technique de commande où la sortie y du système est dérivée plusieurs fois jusqu’à
l’apparition de l’entrée de commande u dans la dérivée d’ordre r. Ensuite, l’entrée de commande u
est utilisée pour avoir une relation linéaire de la forme : 𝑦 (𝑟) = 𝑣 où v est une nouvelle entrée de
commande, et r est appelé le degré relatif du système. Si 𝑟 = 𝑛 , on obtient une linéarisation
complète de la dynamique du système, et si 𝑟 < 𝑛 , on a une linéarisation partielle de la dynamique
du système. Dans ce dernier cas, on aura une dynamique interne ou dynamique des zéros.
3.2. Linéarisation entrée-état
C’est une technique de commande qui permet de linéariser complètement le système non linéaire.
Dans cette technique, on cherche une nouvelle sortie 𝑦𝑛 = 𝑕𝑛 (𝑥) de telle sorte que 𝑟 = 𝑛 . En
d’autre terme, un système est linéarisable entrée-état si il existe une transformation d’état 𝑧 = 𝑇(𝑥)
(un difféomorphisme) qui transforme le système non linéaire original à un système linéaire de la
forme : 𝑧 = 𝐴𝑧 + 𝐵(𝛽 𝑥 𝑢 + 𝛼 𝑥 ), avec (𝐴, 𝐵) commandable et 𝛽 𝑥 inversible.
3.3 Procédure de linéarisation entrée-sortie
𝑥 =𝑓 𝑥 +𝑔 𝑥 𝑢
Considérons le système : , 𝑥 ∈ ℝ𝑛 , 𝑦 ∈ ℝ, 𝑢 ∈ ℝ
𝑦=𝑕 𝑥
1) Dériver la sortie 𝑦 jusqu’à l’apparition de l’entrée u.
𝑦 = 𝑕(𝑥),
𝑦 = 𝐿𝑓 𝑕 𝑥 , 𝐿𝑔 𝑕 𝑥 = 0,
𝑦 = 𝐿2𝑓 𝑕 𝑥 , 𝐿𝑔 𝐿𝑓 𝑕 𝑥 = 0,
⋮ ⋮
𝑦 𝑟−1
= 𝐿𝑟−1
𝑓 𝑕 𝑥 , 𝐿𝑔 𝐿𝑟𝑓−2 𝑕 𝑥 = 0,
𝑦 (𝑟) = 𝐿𝑟𝑓 𝑕 𝑥 + 𝐿𝑔 𝐿𝑟𝑓−1 𝑕 𝑥 𝑢, 𝐿𝑔 𝐿𝑟−1
𝑓 𝑕 𝑥 ≠0
3
Chapitre 3 Régulation par retour d'état linéarisant

Alors, le degré relatif du système est égal à r.


2) Si le degré relatif 𝑟 < 𝑛, vérifier la stabilité asymptotique de la dynamique des zéros.
1
3) Choisir une loi de commande linéarisante de la forme : 𝑢 = −𝐿𝑟𝑓 𝑕 𝑥 + 𝑣 . on
𝐿𝑔 𝐿𝑟−1
𝑓 𝑕 𝑥

obtient ainsi le modèle linéaire (chaîne d’intégrateurs) : 𝑦 (𝑟) = 𝑣


4) Suivant les objectifs de commande, calculer la loi de commande linéaire v du système : 𝑦 (𝑟) = 𝑣.
On peut utiliser tous les outils de synthèse des systèmes linéaires.

3.4 Commande d’une chaîne d’intégrateurs


Soit le système linéaire : 𝑦 (𝑟) = 𝑣
Objectif de commande : Poursuite d’une trajectoire désirée ou de référence donnée 𝑦𝑑 (𝑡)

4
Chapitre 3 Régulation par retour d'état linéarisant

(𝑟) (𝑟)
Pour cela, on définit l’erreur de poursuite par : 𝑒 = 𝑦𝑑 − 𝑦 ⇒ 𝑒 (𝑟) = 𝑦𝑑 − 𝑦 (𝑟) = 𝑦𝑑 − 𝑣
(𝑟)
Si on choisit 𝑣 de la forme : 𝑣 = 𝑦𝑑 + 𝑘𝑟−1 𝑒 (𝑟−1) + ⋯ + 𝑘1 𝑒 + 𝑘0 𝑒.

La dynamique du système bouclé devient : 𝑒 (𝑟) + 𝑘𝑟−1 𝑒 (𝑟−1) + ⋯ + 𝑘1 𝑒 + 𝑘0 𝑒 = 0


Le polynôme caractéristique de cette dynamique est donnée par : 𝑃 𝑆 = 𝑆 𝑟 + 𝑘𝑟−1 𝑆 𝑟−1 + ⋯ +
𝑘1 𝑆 + 𝑘0 .
Les paramètres 𝑘𝑖 , 𝑖 = 0, … , 𝑟 − 1, peuvent être calculer par la méthode d’imposition des pôles de
la boucle fermée. Soit 𝑝1 , … , 𝑝𝑟 , les pôles désirés du système en boucle fermée, on a alors :
𝑃 𝑆 = 𝑆 𝑟 + 𝑘𝑟−1 𝑆 𝑟−1 + ⋯ + 𝑘1 𝑆 + 𝑘0 = (𝑆 − 𝑝1 ) … (𝑆 − 𝑝𝑟 ).

3.5 Forme normale et dynamique des zéros


𝑥 =𝑓 𝑥 +𝑔 𝑥 𝑢
Considérons le système : , 𝑥 ∈ ℝ𝑛 , 𝑦 ∈ ℝ, 𝑢 ∈ ℝ
𝑦=𝑕 𝑥
Pour un degré relatif r, on a : 𝑦 (𝑟) = 𝐿𝑟𝑓 𝑕 𝑥 + 𝐿𝑔 𝐿𝑟−1
𝑓 𝑕 𝑥 𝑢. Lorsque le degré relatif du système
est tel que 𝑟 < 𝑛, on peut mettre le système sous une forme particulière appelée forme normale qui
est donnée par :

𝑦 𝑕(𝑥)
𝑧1
𝑧2 𝑦 𝐿𝑓 𝑕 𝑥
𝑧1 = 𝑧2 ⋮ ⋮

𝑧2 = 𝑧3 𝑧𝑟 𝑦 (𝑟−1)
𝑟−1
𝐿𝑓 𝑕(𝑥)
𝑧
⋮ 𝑟 𝑛 −𝑟 …
𝑧𝑟−1 = 𝑧𝑟 , 𝑦 = 𝑧1 , 𝑧 ∈ ℝ , 𝑞 ∈ ℝ , =

=

= = 𝑇(𝑥)
𝑞 ⋯
𝑧𝑟 = 𝑣 𝑞1 𝑞1 𝜑1 (𝑥)
𝑞 = 𝜓 𝑞, 𝑧 ⋮ ⋮
𝑞𝑛−𝑟 ⋮
𝑞𝑛−𝑟
𝜑𝑛−𝑟 (𝑥)

avec 𝑦 (𝑟) = 𝐿𝑟𝑓 𝑕 𝑥 + 𝐿𝑔 𝐿𝑟−1


𝑓 𝑕 𝑥 𝑢. Les fonctions 𝜑1 𝑥 , …, 𝜑𝑛−𝑟 (𝑥) , sont choisies telles que :
𝜕𝜑 𝑖 𝑥
𝜑𝑖 0 = 0 et 𝑔 𝑥 = 0, 1 ≤ 𝑖 ≤ 𝑛 − 𝑟, et la transformation 𝑇(𝑥) est un difféomorphisme,
𝜕𝑥
c’est-à-dire, le Jacobien ∇𝑇(𝑥) est inversible (𝑑𝑒𝑡∇𝑇(𝑥) ≠ 0 ).

5
Chapitre 3 Régulation par retour d'état linéarisant

3.5.1 Dynamique des zéros


L’équation 𝑞 𝑥 = 𝜓 𝑞, 0 représente la dynamique interne ou la dynamique des zéros du système.
Le système est dit à minimum de phase si l’origine de la dynamique des zéros est asymptotiquement
stable.
Remarque :
– Le degré relatif r est égale au nombre de fois de dérivation de la sortie y pour faire apparaître
l’entrée de commande u.
– L’ordre du système linéarisé correspond au degré relatif r.
– La dynamique des zéros correspond à la dynamique du système quand la sortie y est ses
dérivées jusqu’à l’ordre 𝑟 − 1 sont maintenues à zéro 𝑧 ≡ 0).
– Pour un système avec une dynamique des zéros qui n’est pas asymptotiquement stable, la
méthode de linéarisation entrée-sortie ne doit pas être utilisée.
– Après la linéarisation entrée-sortie, la dynamique des zéros devient une dynamique non
observable dans le système.

Vous aimerez peut-être aussi