XXX Espacio de Estados
XXX Espacio de Estados
XXX Espacio de Estados
2.1 INTRODUCION
Definiciones
Variables de estado. Las variables de estado de un sistema dinámico son las que
conforman el conjunto más pequeño de variables que determinan el estado del sistema
dinámico. Para describir en su totalidad el comportamiento de un sistema dinámico se
requiere de por lo menos n variables x1 , x2 , x3 , ... , xn , dichas variables de estado se
consideran un conjunto de variables de estado. Las variables de estado no necesitan ser
físicamente cantidades medibles u observables. Sin embargo, en la práctica, lo conveniente
es seleccionar cantidades fácilmente medibles como variables de estado.
Si el sistema de control está representado por las ecuaciones (2.3) y (2.4) y en su forma no
lineal se puede expandir mediante series de Taylor respecto de un punto (x, u ) como sigue
x (t ) f (x, u ) f (x, u )(x(t ) x) f (x, u )(u(t ) u ) (2.9)
x u
y (t ) g(x, u ) g(x, u )(x(t ) x) g(x, u )(u(t ) u ) (2.10)
x u
Definiendo las siguientes expresiones
x f (x, u ) , y g(x, u ) , x(t ) x(t ) x , u(t ) u(t ) u
A f (x, u ) , B f (x, u ) , C g(x, u ) , D g(x, u )
x u x u
Las ecuaciones (2.9) y (2.10) se pueden aproximar y escribir como
x (t ) Ax(t ) Bu(t ) (2.11)
y(t ) Cx(t ) Du(t ) (2.12)
Las matrices A, B, C, y D expresan las matrices jacobianas como sigue
f1 f1 ∂ f1 ∂ f1
x x ∂ u
∂ur
1 n ∂ 1
A f ( x, u ) , B f ( x, u )
x ∂
f n f n ∂ ∂
u fn fn
x1 xn ∂ ∂u r
u1
g1 g1 g1 g1
x
x n u u r
1 1
C g ( x, u ) , D g ( x, u )
x u
g m g m g m g m
x1 x n u1 u r
Las ecuaciones (2.11), (2.12) son de la misma forma que las ecuaciones (2.7) y (2.8) y por
lo tanto representan a un sistema lineal invariante en el tiempo.
x1 (t ) 0 0 0 an x1 (t ) bn anb0
x (t ) 1 0 0 an 1 x2 (t ) bn 1 an 1b0
2
u (t ) (2.19)
xn 1 (t ) 0 0 0 a2 xn 1 (t ) b2 a2b0
xn (t ) 0 0 1 a1 xn (t ) b1 a1b0
x1 (t )
x (t )
y (t ) 0 0 1 2 b0u (t ) (2.20)
xn (t )
Si se invierte el orden de las variables de estado, es decir, si se define nuevas variables de
estado, de acuerdo con la forma
xˆ1 (t ) 0 0 0 1 x1 (t )
ˆ
x2 (t ) 0 0 1 0 x2 (t )
xˆn 1 (t ) 0 1 0 0 xn 1 (t )
xˆ n (t ) 1 0 0 0 xn (t )
entonces las ecuaciones de estado y de salida también están en su forma canónica
controlable y se pueden escribir respectivamente como sigue:
xˆ (t ) a 1 0 0 xˆ1 (t ) b1 a1b0
1 1
xˆ (t ) a2 0 0 0 xˆ2 (t ) b2 a2b0
2
u (t ) (2.21)
ˆ
xˆ (t ) an 1 0 0 1 xn 1 (t ) bn 1 an 1b0
n 1
xˆn (t ) an 0 0 0 xˆn (t ) bn anb0
xˆ1 (t )
xˆ (t )
y (t ) 1 0 0 2 b0u (t ) (2.22)
xˆ n (t )
ˆ xˆ (t ) D
y(t ) C ˆ u(t ) (2.32)
Demostrando así que la representación en el espacio de estado, dadas por las ecuaciones
(2.7) y (2.8) es equivalente a la representación en el espacio de estado dada por las
ecuaciones (2.30) y (2.32).
Forma canónica controlable. El sistema definido por las ecuaciones (2.7) y (2.8)
se puede transformar en su forma canónica controlable, mediante la matriz de
transformación
T MW (2.34)
donde
M B AB A 2 H G n 1B
y
an 1 an 2 a1 1
a
n 2 an 3 1 0
W
a1 1 0 0
1 0 0 0
Los elementos ai mostrados en la matriz W son coeficientes de la ecuación característica
sI A s n a1s n 1 a2 s n 2 an 1s an 0 (2.35)
Definiendo el siguiente vector de estado
x(t ) Txˆ (t ) (2.36)
donde la matriz de transformación T está dada por la ecuación (2.34). Entonces las
ecuaciones (2.7) y (2.8) se convierten en
xˆ (t ) T1ATxˆ (t ) T1Bu(t ) A ˆ xˆ (t ) Bˆ u(t ) (2.37)
y(t ) CTxˆ (t ) Du(t ) C ˆ xˆ (t ) Dˆ u(t ) (2.38)
donde
ˆ T1AT ,
A ˆ T1B ,
B ˆ CT ,
C ˆ Db
D 0
es decir
xˆ1 (t ) 0 1 0 0 xˆ1 (t ) 0
xˆ2 (t ) 0 0 1 0 xˆ2 (t ) 0
u (t ) (2.39)
xˆn 1 (t ) 0 0 0 1 xˆn 1 (t ) 0
xˆ (t ) a an 1 an 2 a1 xˆn (t ) 1
n n
xˆ1 (t )
xˆ (t )
y (t ) bn anb0 bn1 an1b0 b1 a1b0 2 b0u (t ) (2.40)
xˆ n (t )
Los bi son los coeficientes que aparecen en el denominador de la funciona de transferencia.
Forma canónica observable. El sistema definido por las ecuaciones (2.7) y (2.8) se
puede transformar en su forma canónica observable, mediante la matriz de transformación
Q WN (2.41)
donde
N C CA CAn 1 T
y
an 1 an 2 a1 1
a an 3 1 0
n2
W
a1 1 0 0
1 0 0 0
Definiendo el siguiente vector de estado
x(t ) Qxˆ (t ) (2.42)
donde la matriz de transformación Q está dada por la ecuación (2.41). Entonces las
ecuaciones (2.7) y (2.8) se convierten en
xˆ (t ) Q1AQxˆ (t ) Q1Bu(t ) A ˆ xˆ (t ) B
ˆ u(t ) (2.43)
y(t ) CQxˆ (t ) Du(t ) C ˆ xˆ (t ) Dˆ u(t ) (2.44)
donde
ˆ Q1AQ , B
A ˆ Q1B , C ˆ CQ , D ˆ Db
0
es decir
xˆ1 (t ) 0 0 0 an xˆ1 (t ) bn an b0
xˆ 2 (t ) 0 0 0 an 1 xˆ2 (t ) bn 1 an 1b0
u (t ) (2.45)
xˆn 1 (t ) 0 0 0 a2 xˆ n 1 (t ) b2 a2b0
xˆ (t ) 0 0 1 a1 xˆn (t ) b1 a1b0
n
xˆ1 (t )
xˆ (t )
y (t ) 0 0 1 2 b0u (t ) (2.46)
xˆ n (t )
Forma canónica diagonal. Si los valores característicos o valores propios pi de la matriz A
del sistema definido por las ecuaciones (2.7) y (2.8) son distintos, entonces los vectores
característicos correspondientes ξ1, ξ2, ..., ξn también son distintos.
Definiendo la matriz de transformación P en función de los vectores característicos de la
matriz A como sigue
P 1 2 n (2.47)
Definiendo el siguiente vector de estado
x(t ) Pxˆ (t ) (2.48)
Entonces las ecuaciones (2.7) y (2.8) se convierten en
xˆ (t ) P 1AP xˆ (t ) P 1Bu(t ) A ˆ xˆ (t ) B ˆ u(t ) (2.49)
Definiendo la matriz de transformación P como sigue
y(t ) CPxˆ (t ) Du(t ) C ˆ xˆ (t ) D ˆ u(t ) (2.50)
donde
Aˆ P 1AQ , B ˆ P 1B , C ˆ CP , D ˆ Db
0
es decir
xˆ1 (t ) p1 0 0 xˆ1 (t ) 1
xˆ2 (t ) 0 p2 0 xˆ2 (t ) 2
u (t ) (1.51)
xˆn (t ) 0 0 pn xˆn (t ) n
xˆ1 (t )
xˆ (t )
y (t ) 1 2 n 2 b0u (t ) (1.52)
xˆ n (t )
donde las αi y las βi son constantes, tales que αiβi es el residuo en el polo z = pi , cuando se
expande la función de transferencia de la ecuación (2.14) en fracciones parciales como
sigue:
Y ( s) 11
2 2 n n b0 (2.53)
U ( s) s p1 s p2 s pn
La matriz de transición de estado Φ(t ) es única y contiene toda la información sobre los
movimientos libres del sistema. En términos de la matriz de transición de estado la
solución de la ecuación de estado se puede escribir como
t
x(t ) Φ(t )x(0) Φ(t )Bu( )d (2.63)
0
3.1 INTRODUCION
3.2 CONTROLABILIDAD
3.3 OBSERVABILIDAD
C
CA
N CA 2 (3.4)
CA n1
Para que el sistema expresado mediante las ecuaciones (3.1) y (3.1) sea completamente
observable, el rango de la matriz de observabilidad N debe ser n.
x(t)
u(t) x (t ) Ax (t ) Bu (t ) y(t)
y (t ) Cx(t ) Du (t )
x(t)
-K
donde los vectores ζ i son los vectores característicos de (A-BK) que satisfacen la siguiente
ecuación
ζ i A i I 1 B , i 1, 2, , n
Esta técnica de diseño se utiliza para sistemas de control con entrada de referencia
diferente de cero. En este método se considera la colocación de polos para un sistema de
seguimiento en el cual se desea que el sistema compensado sea capaz de seguir a una
entrada de referencia de escalón.
Al realizar el método de ubicación de polos se modifica la ganancia del sistema en lazo
cerrado, y este cambio depende de la posición elegida para los polos del sistema en lazo
cerrado.
Este diseño no es robusto ante imprecisiones en el modelo, perturbaciones y señales de
ruido debido que se utiliza un control en lazo abierto para eliminar el error en estado
estacionario ante una entrada de un escalón.
Entonces es necesario colocar una ganancia ajustable k0 a la entrada del sistema
compensado para conseguir la ganancia deseada.
Sea el sistema de control de simple entrada descrito por las ecuaciones (3.1) y (3.2)
definidas como
x (t ) Ax (t ) Bu(t )
y(t ) Cx(t ) Du(t )
La variable de control u(t) no acotada se puede expresar como
u(t ) Kx(t ) k0 r (t ) (3.22)
donde K es la matriz de ganancia de realimentación de estado de dimensión 1×n, y el
escalar k0 es un compensador ajustable proporcional.
En la figura 3.4 se muestra el diagrama de bloques correspondiente a las ecuaciones (3.1),
(3.2), y (3.22) que representa un sistema de control en lazo cerrado.
x(t)
K
Para usar el método de ubicación de polos del sistema representado en la figura 3.4 se debe
de transformar a un sistema de regulación alrededor de x(∞). Evaluando al sistema de
control cuando t→∞ se obtiene
x () Ax () Bu() (3.23)
u() k0 r () Kx() (3.24)
Si se define la variación del estado actual con el estado en el infinito del sistema como
x(t ) x(t ) x() , u(t ) u(t ) u() (3.25)
La entrada r(t) de referencia se considera un escalón por lo tanto se obtiene
r (t ) r (0) r () r (3.26)
Restando las ecuaciones (3.1) y (3.23) se obtiene
x (t ) x () A(x(t ) x()) H(u(t ) u()) (3.27)
Evaluando las variables residuales en la ecuación (3.27) se obtiene
x (t ) Ax(t ) Bu(t ) (3.28)
Restando las ecuaciones (3.22) y (3.24) se obtiene
u(t ) u() k0 (r (t ) r ()) K(x(t ) x()) (3.29)
Evaluando las variables residuales en la ecuación (3.29) se obtiene
u(t ) Kx(t ) (3.30)
Las ecuaciones (3.28) y (3.30) representan un sistema de regulación del sistema alrededor
de x(∞) entonces al reemplazar la ecuación (3.30) en la ecuación (3.28) se obtiene la
ecuación con realimentación de estados como
x (t ) Ax(t ) BKx(t ) (A BK)x(t ) (3.31)
La matriz K de realimentación de estados del sistema obtenido en lazo cerrado de la
ecuación (3.31) se elige para que el sistema satisfaga las especificaciones para el régimen
transitorio y se determina de tal forma que los valores característicos de la matriz (A-BK)
sean los polos en lazo cerrado deseados: -μ1, -μ2, ..., -μn. los que resultan de la ecuación
característica siguiente
zI A BK 0 (3.32)
El diseño de la matriz K se realiza utilizando cualquiera de los métodos de diseño de un
sistema regulador visto en la sección 3.3 mediante el método de ubicación de polos de tal
manera que el sistema debe ser asintóticamente estable.
Al reemplazar la ecuación (3.22) en la ecuación (3.1) se obtiene
x (t ) Ax (t ) BKx(k ) Bk0 r (t ) (3.33)
x (t ) (A BK)x(k ) Bk0 r (t ) (3.34)
Reemplazando la ecuación (3.22) en la ecuación (3.2) se obtiene la ecuación de respuesta
del sistema
y(t ) Cx(t ) DKx(t ) Dk0 r (t ) (3.35)
y(t ) (C DK)x(t ) Dk0 r (t ) (3.36)
La ganancia k0 se selecciona para que el sistema en lazo cerrado tenga una ganancia
unitaria en estado permanente, eliminado el error en estado estacionario ante una entrada
escalón, r(t)=r.
Como el sistema debe permanecer en el punto de equilibrio, en el cual se tiene que
x () 0 . Entonces la ecuación de estados del sistema escribe como:
x () (A BK )x() Bk0 r 0 (3.37)
es decir
x() A BK 1 Bk0 r (3.38)
La ecuación de salida del sistema en estado permanente se obtiene como
y() (C DK)x() Dk0 r (C DK)A BK 1 Bk0 r Dk0 r (3.39)
La salida en estado permanente debe ser igual a la entrada r, por tanto de la ecuación (3.39)
se obtiene
y() (C DK)A BK 1 B D k0 r r (3.40)
De la ecuación (3.40) se obtiene el precompensador de ganancia k0 expresado como
k0 (C DK)A BK 1 B D
1
(3.41)
La solución de la ecuación de estado es
t
x(t ) e ( ABK)t x(0) e ( ABK)(t ) Bu ( )d (3.42)
0
Caso particular
Si la salida y(t) es igual a uno de los estados xi(t) es decir y(t ) xi (t ) la variable de control
u(t) de la ecuación (3.22) se puede escribe como
u(t ) K1x(t ) ki (r (t ) y(t )) (3.43)
Para obtener un sistema de control que sea robusto ante imprecisiones en el modelo,
perturbaciones y señales de ruido, es necesario que la función de transferencia pulso del
sistema en lazo abierto, incluya uno o más integradores para eliminar el error en estado
permanente ante una entrada de un escalón, de una rampa según sea el caso.
Sea el sistema de control de simple entrada descrito por las ecuaciones (3.1) y (3.2)
definidas como
(t ) Ax (t ) Bu (t )
x
y(t ) Cx(t ) Du(t )
Figura
3.6 Sistema de control con realimentación de estados e integrador
ˆ C 0
C de dimensión 1×(n+1)
ˆ D
D de dimensión 1×1
K̂ K k I de dimensión 1×(n+1)
Las ecuaciones (3.50), (3.51) y (3.52) se pueden escribir respectivamente como
xˆ (t ) A
ˆ xˆ (t ) Bˆ u(t ) Eˆ r (t ) (3.53)
y(t ) C ˆ xˆ (t ) D
ˆ u(t ) (3.54)
u(t ) K ˆ xˆ (t ) (3.55)
Para usar el método de ubicación de polos del sistema representado en la figura 3.6 se debe
de transformar el sistema a uno de regulación alrededor de xˆ () . Evaluando al sistema de
control cuando t→∞ como sigue
xˆ () A
ˆ xˆ () B
ˆ u() E ˆ r () (3.56)
u() K ˆ xˆ () (3.57)
Si se define la variación del estado actual con el estado en el infinito del sistema como
xˆ (t ) xˆ (t ) xˆ () , u(t ) u(t ) u() (3.58)
La entrada r(t) de referencia se considera un escalón por lo tanto se obtiene
r (t ) r (0) r () r (3.59)
Restando las ecuaciones (3.53) y (3.56) se obtiene
xˆ (t ) xˆ () A ˆ (xˆ (t ) xˆ ()) B ˆ (u(t ) u()) E ˆ (r (t ) r ()) (3.60)
Evaluando las variables residuales de la ecuación (3.58) en la ecuación (3.60) se obtiene
xˆ (t ) A ˆ xˆ (t ) Bˆ u(t ) (3.61)
Restando las ecuaciones (3.55) y (3.57) se obtiene
u(t ) u() K ˆ (xˆ (t ) xˆ ()) (3.62)
Evaluando las variables residuales de la ecuación (3.58) en la ecuación (3.62) se obtiene
u(t ) K ˆ xˆ (t ) (3.63)
Las ecuaciones (3.61) y (3.63) representan un sistema de regulación del sistema alrededor
de x(∞) entonces al reemplazar la ecuación (3.63) en la ecuación (3.61) se obtiene la
ecuación con realimentación de estados como
xˆ (t ) Aˆ xˆ (t ) B ˆK ˆ xˆ (t ) (A ˆ B ˆKˆ )xˆ (t ) (3.64)
La matriz K̂ de realimentación de estados del sistema obtenido en lazo cerrado de la
ecuación (3.64) se elige para que el sistema satisfaga las especificaciones para el régimen
transitorio y se determina, de tal forma que los valores característicos de la matriz
Aˆ BˆK
ˆ sean los polos en lazo cerrado deseados: -μ1 , -μ2 , ... , -μn+1 , los que resultan de
la ecuación característica siguiente
ˆ B
sIˆ A ˆKˆ 0 (3.65)
En la práctica no todas las variables de estado estarán accesibles, de forma que algunas de
ellas no se podrán medir. Para aplicar el método de localización de polos, es necesario
estimar aquellas variables que no se puedan medir directamente.
Un observador o estimador de predicción de estados, es un subsistema del sistema de
control que lleva a cabo una estimación de las variables de estado del sistema a partir de las
medidas de las variables de salida y las variables de control del sistema.
Un observador de orden completo es cuando estima todas las variables de estado del
sistema, es de orden reducido cuando no estima todas las variables de estado y es de orden
mínimo cuando estima únicamente las variables no medibles.
Teniendo en cuenta que las señales y(t) e ~ y (t ) se pueden medir por lo tanto la ecuación
dinámica del observador de estados y se escribe como
x (t ) A~
~ x(t ) Bu(t ) K e ( y(t ) ~
y (t )) (3.70)
~
y (t ) C~
x(t ) Du(t ) (3.71)
donde Ke es una matriz de ponderación de estados de dimensión n×1.
Las ecuaciones (3.1), (3.2), (3.70) y (3.71) se representan en un diagrama de bloques en la
figura 3.6
Ke
~
x (t )
~ x (t ) ~
y (t )
B C
x (t ) A~
~ x (t ) Bu (t ) K e C(x(t ) ~
x (t ))
~
x (t )
Para determinar los valores de la matriz Ke se obtiene la ecuación de error del observador
restando la ecuación (3.72) de la ecuación (3.1) como sigue
x (t ) A(x(t ) ~
x (t ) ~ x(t )) K eC(x(t ) ~
x(t )) (3.73)
Definiendo un vector e(t) que representa la diferencia entre x(t) y x (t ) ~
e(t ) x(t ) ~ x(t )
Empleando el vector e(t) en la ecuación (3.73) se determina la ecuación siguiente
e (t ) Ae (t ) K eCe(t )
e (t ) (A K eC)e(t ) (3.74)
La ecuación (3.74) describe la dinámica del observador por lo que se debe diseñar la
ganancia Ke de forma muy apropiada para que el vector del error e(t) tienda
asintóticamente a cero a una velocidad lo suficientemente rápido. Para determinar el valor
de Ke se puede utilizar el método de la ubicación de polos de tal manera que los valores
propios de la matriz (A-KeC) sean estables.
sI A K eC (s 1 )(s 2 )(s n ) (3.75)
las ecuaciones (3.76) y (3.76) aplicando la fórmula de la ecuación (3.19) del siguiente
modo
K 0 0 0 1 (NT ) 1 (G T ) (3.91)
Utilizando directamente la ecuación (3.83) se obtiene la ecuación
K e K T ( A T )T N T 0
1 T
0 0 1T
Aplicando propiedades de matrices se obtiene finalmente la expresión de la ganancia del
estimador de predicción Ke mediante la fórmula de Ackermann
0
0
K e ( A)N 1 (3.92)
0
1
La matriz N de la ecuación (3.92) es la misma matriz de la ecuación (3.90)
La matriz (A) de la ecuación (3.92) es la misma matriz de la ecuación (3.20)
(A) A n 1A n1 2 A n2 n1A n I
Donde los coeficientes (A) son los coeficientes del polinomio característico como
resultado de ubicar los polos arbitrarios en el plano S para el observador.
En el proceso del diseño de ubicación de polos, se había supuesto que el vector de estado
verdadero x(t) estaba disponible para la realimentación, pero en la práctica en vector de
estado real x(t) puede ser no medible, por lo que es necesario utilizar un vector de estado
estimado ~ x (t ) u observado, en lugar del vector de estado verdadero x(t), sobre la ecuación
característica de un sistema de control en lazo cerrado.
Considerando el sistema de control completamente controlable y completamente
observable descrito por las ecuaciones (3.1) y (3.2) definidas por
x (t ) Ax (t ) Bu(t )
y(t ) Cx(t ) Du(t )
Para el control con realimentación del vector de estado basado en el vector de estado
estimado ~ x (t ) de tiene
Ke
~
x (t )
~ x (t )
B C
-K
Figura 3.8 Sistema de control con realimentación del vector de estado estimado
sI A BK BK
0 (3.97)
0 sI A K e C
La expresión (3.97) aplicando propiedades del determinante se vuelve a escribir como
zI A BK zI A K eC 0 (3.98)
La expresión (3.98) significa que el diseño del controlador y el diseño del estimador u
observador son independientes uno del otro y se pueden aplicar métodos de diseño por
separado y combinarse en forma independiente para formar el sistema de control con
realimentación de estado observado.
Este mismo principio de diseño se aplica a sistemas de control con entrada de referencia
distintas a cero, inclusive a sistemas de seguimiento que incluyen un integrador en lazo
cerrado, conduciéndolo a un sistema de regulación.
Por lo general el observador se diseña de tal modo que su velocidad de respuesta sea más
rápida que la respuesta del controlador. Los polos en lazo cerrado que se desea que se
genere mediante realimentación de estados se seleccionan para que el sistema satisfaga los
requisitos de desempeño. Los polos del observador se seleccionan para que el error de
estimación tienda asintóticamente a cero a una velocidad suficientemente alta. Como el
observador generalmente no es una estructura de hardware, sino un algoritmo, es posible
aumentar la velocidad para que el vector de estado estimado converja con rapidez al vector
de estado real.
Reemplazando la ecuación (3.93) en la ecuación (3.1) se obtiene la expresión
x (t ) Ax (t ) BK~x(t ) (3.99)
Reemplazando la ecuación (3.93) en la ecuación (3.72) se obtiene la expresión
x (t ) A~
~ x(t ) BK~ x(t ) K eC(x(t ) ~
x(t ))
x (t ) K Cx(t ) A BK K C ~
~
e e x(t ) (3.100)
Para efectos de simulación una vez diseñado el sistema de control con vector de estado
observado se puede obtener una nueva representación de estado para sistema de regulación
haciendo uso de las ecuaciones (3.99) y (3.100) como
x (t ) A BK x(t )
~x (t ) K C A BK K C ~ (3.101)
e e x (t )
Reemplazando la ecuación (3.93) en la ecuación (3.2) se obtiene la expresión de la salida
como
y(t ) Cx(k ) DK~ x(t )
x(t )
y (t ) C DK ~ (3.102)
x (t )
La ecuación (3.93) de la expresión de la ley de control se puede modificar como
x(t )
u (t ) 0 K ~ (3.103)
x (t )