AL Cap4

Capı́tulo 4
Valores e vectores próprios
Valores e vectores próprios desempenham um papel central em diversas áreas da ma-

temática aplicada, da fı́sica, da economia, da engenharia etc.. Intimamente relacionado
com os conceitos de valores e vectores próprios destaca-se a diagonalização de matri-
zes, que desempenha um papel crucial no estudo de sistemas de equações diferenciais.
Na Secção 4.1 estudam-se as propriedades que resultam da definição de valor e vec-
tor próprio de uma matriz. A Secção 4.2 é dedicada ao problema da diagonalização de
matrizes. Mais tarde, no Capı́tulo 7, estuda-se a diagonalização (ortogonal) de matrizes
simétricas e aplica-se esta diagonalização na identificação de cónicas e superfı́cies.
No plano das aplicações é dado destaque aos sistemas dinâmicos. Em particular,
é ilustrado o papel dos valores e vectores próprios no algoritmo PageRank usado pelo
motor de busca Google, e na previsão a prazo de sistemas descritos por matrizes de
Markov, os quais modelam vários problemas de que a dinâmica de populações é um
exemplo. A Secção 4.4.2, é dedicada à resolução de sistemas lineares de equações
diferenciais ordinárias descritos por matrizes diagonalizáveis. Nesta secção, introduz-
se ainda a exponencial de uma matriz como sendo uma solução (particular) de um
sistema linear de equações diferenciais.
4.1 Valores e vectores próprios de matrizes

Os valores próprios de uma matriz quadrada são escalares associados a uma certa
equação matricial. Recorde-se que quando nos referimos a escalares estamos a con-
siderar números reais ou complexos. A cada valor próprio correspondem certos vec-
tores que recebem a designação de vectores próprios. Números complexos não podem
ser evitados quando se lida com valores próprios, uma vez que mesmo uma matriz
real pode ter valores próprios complexos. É assim essencial que o leitor possua al-
guns conhecimentos de números complexos (pelo que deve consultar o Anexo A caso
necessite).
Eis a definição de valor e vector próprio de uma matriz.
147
148 Valores e vectores próprios
Definição 4.1. Um escalar λ diz-se um valor próprio de uma matriz quadrada A se

existe um vector não nulo x, tal que
Ax = λx. (4.1)
A um vector não nulo x que verifica a equação (4.1) chama-se vector próprio de A
associado ao valor próprio λ.
O par (λ, x) diz-se um par próprio de A se λ é um valor próprio de A e x é um
vector próprio de A associado a λ.
O conjunto dos valores próprios de uma matriz A designa-se por espectro de A e
denota-se por σ(A).
A terminologia inglesa para valor e vector próprio é respectivamente “eigenvalue” e
“eigenvector”, enquanto que em português do Brasil se usam as designações de auto-
valor e autovector.

4 2
Exemplo 4.1. O vector x = (2, 1) é um vector próprio da matriz A = já que
2 1

4 2 2 10 2
Ax = = =5 = 5x.
2 1 1 5 1
Da igualdade anterior, concluimos que x é um vector próprio de A associado ao valor
próprio λ = 5. Ou seja, (5, x) é um par próprio de A.

A equação Ax = λx pode reescrever-se na seguinte forma equivalente
Ax = λx ⇐⇒ Ax − λx = 0 ⇐⇒ (A − λI)x = 0, (4.2)
onde I é a matriz identidade. Assim, a definição de vector próprio é equivalente à
existência de uma solução não nula do sistema homogéneo (A − λI)x = 0. Ora, um
sistema homogéneo com matriz dos coeficientes quadrada possui soluções não nulas
se e só se o determinante da matriz dos coeficientes é nulo (Proposição 2.2, pág. 84).
Podemos portanto enunciar a proposição:
Proposição 4.1. O escalar λ é um valor próprio da matriz quadrada A se e só se
satisfaz a equação
det(A − λI) = 0. (4.3)
Um vector próprio x associado ao valor próprio λ é uma solução não nula do sistema
homogéneo (A − λI)x = 0.
A equação (4.3) e a solução geral do sistema (A − λI)x = 0, recebem designações

que a seguir se especificam.
Definição 4.2. Chama-se equação caracterı́stica da matriz A à equação (na variável
λ)
det(A − λI) = 0.
O espaço gerado pelos vectores próprios associados a um valor próprio λ é deno-
minado espaço próprio de λ e será designado por E(λ).
Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

Valores e vectores próprios de matrizes 149
Note-se que o espaço próprio E(λ) é a solução geral do sistema (A − λI)x = 0,

ou seja, o núcleo de (A − λI). Isto é,
E(λ) = N (A − λI).
É importante observar que resulta imediatamente da igualdade Ax = λx que, se

A é uma matriz real e λ é um valor próprio complexo não real, um vector próprio x
associado a λ é necessariamente um vector complexo. Portanto, quando A é real e λ é
um valor próprio complexo de A—ou se A é uma matriz complexa—o espaço próprio
E(λ) = N (A − λI) é necessariamente um subespaço de Cn . No caso em que λ é um
valor próprio real da matriz real A, um vector próprio x associado a λ (isto é, um vector
não nulo que verifica Ax = λx) tanto pode ser considerado como um vector de Rn
como de Cn . No entanto, tal como temos vindo a considerar, é natural tomar o núcleo
de uma matriz real como um subespaço de Rn . Por isso, quando uma matriz real A só
possui valores próprios reais, consideramos os espaços próprios E(λ) = N (A − λI)
como subespaços de Rn , caso contrário estes espaços são considerados subespaços de
Cn .
Exemplo 4.2. Determinar os valores próprios e os espaços próprios da matriz

1 −1/2
A= .
−1/2 1
Os valores próprios são as soluções da equação caracterı́stica det(A − λI) = 0,
isto é,

= (1 − λ)2 − 1 = 0 ⇐⇒ 1 − λ = ± 1
1 − λ −1/2
det(A − λI) =
−1/2 1 − λ 4 2
3 1
⇐⇒ λ = ou λ = .
2 2
Assim, os valores próprios de A são λ1 = 23 e λ2 = 12 .
Os espaços próprios de λ1 = 32 e λ2 = 21 são, respectivamente, as soluções gerais
dos sistemas homogéneos (A − λi I)x = 0 para i = 1, 2. Assim,

3 −1/2 −1/2 a 0
A − I x = 0 ⇐⇒ = ⇐⇒ −a − b = 0.
2 −1/2 −1/2 b 0
Logo,
3
E = {(−b, b); b ∈ R} = Span{(−1, 1)}.
2
Para λ2 = 12 , tem-se

1 1/2 −1/2 a 0
A − I x = 0 ⇐⇒ = ⇐⇒ a − b = 0.
2 −1/2 1/2 b 0
Portanto,
1
E = {(b, b); b ∈ R} = Span{(1, 1)}.
2


A equação caracterı́stica de uma matriz A de ordem n é uma equação polinomial

uma vez que det(A − λI) é um polinómio de grau n em λ. É fácil verificar que
assim é usando a definição de determinante como a soma de produtos elementares de
entradas (multiplicados pelo respectivo sinal). De facto, como a matriz (A − λI) difere
da matriz A apenas nas entradas da diagonal principal, todos os produtos elementares
de entradas de (A − λI) são polinómios em λ de grau inferior ao grau do produto
elementar (a11 − λ) · · · (ann − λ), o qual é obviamente um polinómio de grau n em
λ. Assim, det(A − λI) é a soma de um polinómio de grau n com polinómios de grau
inferior, ou seja, det(A − λI) é um polinómio de grau n.
Definição 4.3. Seja λ um escalar, A uma matriz n × n, e I a matriz identidade

de ordem n. O polinómio de grau n em λ, definido por p(λ) = det(A − λI), é
denominado polinómio caracterı́stico de A.
A seguir sumarizamos algumas equivalências anteriormente referidas.
Proposição 4.2. Se A é uma matriz quadrada e λ um escalar, são equivalentes as

afirmações:
a) λ é um valor próprio de A;
b) O sistema (A − λI)x = 0 tem soluções não nulas;
c) O núcleo de (A − λI) não é trivial, isto é, N (A − λI) 6= {0};
d) Existe um vector x não nulo tal que Ax = λx;
e) λ é uma raiz do polinómio caracterı́stico p(λ) = det(A − λI).
O Teorema Fundamental da Álgebra1 afirma que um polinómio (numa variável),

de coeficientes complexos (ou reais), de grau n ≥ 1 tem n raı́zes (contando as raı́zes
repetidas de acordo com a sua multiplicidade). Estas raı́zes podem ser simples ou
múltiplas (com diferentes graus de multiplicidade) e as raı́zes complexas ocorrem aos
pares de conjugados.
Por conseguinte, o polinómio caracterı́stico de uma matriz A de ordem n,
p(λ) = det(A − λI) = b0 + b1 λ + · · · + bn−1 λn−1 + (−1)n λn , (4.4)
tem n raı́zes λ1 , . . . , λn , podendo pois ser factorizado como um produto de n factores
p(λ) = det(A − λI) = (λ1 − λ)(λ2 − λ) · · · (λn − λ). (4.5)
Note-se que na factorização (4.5) pode haver factores repetidos.

De seguida introduzimos alguma terminologia usada para caracterizar valores próprios.
1 Existe um grande número de provas do denominado Teorema Fundamental da Álgebra, algu-
mas de natureza topológica, outras de natureza algébrica ou ainda de natureza analı́tica. As pro-
vas analı́ticas são do âmbito da Análise complexa e usam nomeadamente o Teorema do inte-
gral de Cauchy, ou o Teorema de Liouville ou ainda o designado princı́pio do argumento. No
site http://www.cut-the-knot.org/do_you_know/fundamental2.shtml, poderá encon-
trar várias provas deste teorema bem como várias referências.

Definição 4.4. Seja λ um valor próprio da matriz A.

• A multiplicidade algébrica de λ é número de vezes que a raiz λ aparece re-
petida no polinómio caracterı́stico de A. Isto é, mult alg(λi ) = ki se e só se
p(λ) = (λ1 −λ)k1 · · · (λs −λ)ks , onde o espectro de A é σ(A) = {λ1 , . . . , λs },
com λi 6= λj .
• λ diz-se um valor próprio simples quando mult alg(λ) = 1.
• A multiplicidade geométrica de λ é a dimensão do núcleo de (A − λI), isto
é, dim E(λ). Dito de outra forma: a mult geom(λ) é o número máximo de
vectores próprios linearmente independentes associados a λ.
• λ diz-se um valor próprio semi-simples quando mult alg(λ) = mult geom(λ).
Na proposição seguinte apresentamos um resultado de utilidade prática, em parti-

cular quando se pretende decidir sobre a existência de valores próprios sem os calcular
explicitamente. Para tal, é necessário definir o que se entende por traço de uma matriz
quadrada.
Definição 4.5. Chama-se traço de uma matriz quadrada à soma das entradas da sua
diagonal principal, e designamos por tr(A) o traço de A .
Proposição 4.3. Seja A = [aij ]i,j=1,...,n e λ1 , λ2 , . . . , λn os valores próprios de A.

São satisfeitas as igualdades:
det(A) = λ1 λ2 · · · λn ,
e
tr(A) = a11 + a22 + · · · + ann = λ1 + λ2 + · · · + λn .
Antes de passarmos à demonstração desta proposição, notemos que no caso particular

de uma matriz 2 × 2 a sua demontração é muito simples. O polinómio caracterı́stico da
matriz A = [aij ]i,j=1,2 é

a11 − λ a12
p(λ) = det(A − λI) = = (a11 − λ)(a22 − λ) − a12 a21
a21 a22 − λ
= λ2 − (a11 + a22 ) λ + a11 a22 − a12 a21 .
| {z } | {z }
traço de A det(A)
Por outro lado, se λ1 e λ2 são as raı́zes de p(λ), então podemos escrever o polinómio
na forma
p(λ) = (λ1 − λ)(λ2 − λ) = λ2 − (λ1 + λ2 )λ + λ1 λ2 .
Comparando as duas expressões obtidas para p(λ) segue o resultado enunciado na
proposição.
Demonstração. O termo independente do polinómio caracterı́stico de A, p(λ) = det(A−

λI), é p(0) = det(A). Por outro lado, usando a factorização de p em termos das suas

raı́zes (expressão (4.5)) temos p(0) = λ1 λ2 · · · λn , ficando assim mostrado que o pro-
duto dos valores próprios é igual ao determinante da matriz.
Para provar a relação entre o traço da matriz e os seus valores próprios, note-se que
usando a factorização (4.5), o coeficiente do termo λn−1 de p é
(−1)n−1 (λ1 + λ2 + · · · + λn ).
Se mostrarmos que este coeficiente é igual a (−1)n−1 (a11 +a22 +· · ·+ann ), provamos
que o traço de A é igual à soma dos valores próprios. Para tal, vamos usar indução sobre
n. Quando n = 1, o resultado é trivialmente satisfeito.
Suponha-se (hipótese de indução) que para qualquer matriz de ordem (n − 1),
seja An−1 = [aij ], o coeficiente do termo em λn−2 do seu polinómio caracterı́stico é
(−1)n−2 (a11 + a22 + · · · + an−1,n−1 ). Isto é,
det(An−1 −λI) = (−1)n−1 λn−1 +(−1)n−2 (a11 +a22 +· · ·+an−1,n−1 )λn−2 + t.o.i.,
(4.6)
onde t.o.i. designa termos de ordem inferior, ou seja, termos que envolvem potências
λk com k < n − 2.
Recorrendo ao desenvolvimento de Laplace (ver página 86) segundo a última linha
da matriz A (de ordem n), tem-se

a11 − λ a12 ··· a1n

a12 a22 − λ · · · a2n

det(A − λI) = . . ..
.. .. .

an1 an2 · · · ann − λ
= (ann − λ) det(An−1 − λI) + an1 Cn1 + · · · + an,n−1 Cn,n−1
= (ann − λ) det(An−1 − λI) + an1 q1 (λ) + · · · + an,n−1 qn−1 (λ),
onde os qj ’s designam polinómios em λ de grau menor ou igual a (n − 2).
Usando a hipótese de indução, nomeadamente a expressão (4.6), o primeiro termo
da soma anterior satisfaz a igualdade
(ann − λ) det(An−1 − λI) = (−1)n λn +
+ (−1)n−1 λn−1 (a11 + a22 + · · · + an−1,n−1 + ann ) + t.o.i..
Finalmente, substituindo a expressão anterior na expressão de det(A − λI), tem-se
det(A − λI) = (−1)n λn + (−1)n−1 λn−1 (a11 + a22 + · · · + an−1,n−1 + ann ) + t.o.i.,
e portanto o enunciado é válido para qualquer n.
Exemplo 4.3. Consideremos a matriz
 
3 1 4
A = 0 2 0 .
0 0 3
Como A é triangular superior, a matriz (A − λI) também o é, e portanto o seu determi-
nante é igual ao produto das entradas da sua diagonal principal. Ou seja, o polinómio
caracterı́stico de A é p(λ) = (3 − λ)2 (2 − λ). Assim, a matriz A tem:

• um valor próprio igual a 3 de multiplicidade algébrica dois.
• um valor próprio simples que é 2.
Refira-se que o polinómio caracterı́stico é do terceiro grau e as suas três raı́zes são
contadas considerando a raiz 3 duas vezes e a raiz 2 uma vez.
Confirmando os resultados da proposição anterior, tem-se
det(A) = 3 × 3 × 2 = 18 e tr(A) = 3 + 3 + 2 = 8,
onde a raiz repetida do polinómio caracterı́stico é considerada de acordo com a sua

multiplicidade.
Nota 23. No que se segue abreviamos por vezes o enunciado da proposição anterior
dizendo que o determinante (resp. o traço ) de uma matriz é igual ao produto (resp. a
soma) dos valores próprios da matriz, subentendendo que os valores próprios múltiplos
são considerados de acordo com as suas multiplicidades.
É consequência imediata da proposição anterior o resultado que a seguir se enuncia.
Corolário 4.1. Uma matriz é invertı́vel se e só se zero não é um valor próprio da
matriz.
4.1. Mostre que se (λ, x) é um par próprio de uma matriz invertı́vel A, então
Exercı́cio

1
, x é um par próprio de A−1 . N
λ
Matrizes reais podem ter valores próprios complexos (ver Exemplo 4.4). Como as
raı́zes complexas de polinómios ocorrem aos pares de conjugados, isto significa que se
(a + ib) é um valor próprio de uma matriz então o seu conjugado (a − ib) também é
valor próprio dessa matriz.
Antes de estabelecermos a relação existente entre vectores próprios corresponden-
tes a valores próprios complexos conjugados vamos definir o conjugado de uma matriz.
Definição 4.6. O conjugado de uma matriz C é a matriz C cujas entradas são os

conjugados das entradas de C.
O conjugado de um vector u é o vector u cujas componentes são os conjugados
das componentes de u.
Refira-se que o conjugado de um número real coincide consigo próprio, e portanto

se C é uma matriz real tem-se C = C.
Proposição 4.4. Se λ ∈ C é um valor próprio de uma matriz real A, então λ também

é um valor próprio de A. Além disso, se u é um vector próprio de A associado a
λ ∈ C, então u é um vector próprio de A associado a λ.

Demonstração. Seja (λ, u) um par próprio de A, isto é, Au = λu. Tomando o conju-
gado da igualdade Au = λu, tem-se
Au = (λu) ⇐⇒ Au = λu ⇐⇒ Au = λu,
onde aplicámos a igualdade A = A uma vez que, por hipótese, A é real.

Por definição de valor e vector próprio de A, a igualdade Au = λu significa que λ
é um valor próprio de A e u é um vector próprio associado.

0 −1
Exemplo 4.4. A matriz A = possui os seguintes valores próprios:
1 0

−λ 1
det(A − λI) = = λ2 + 1 = 0 ⇐⇒ λ = i ou λ = −i.
−1 −λ
O espaço próprio E(i) é o núcleo da matriz (A − iI), ou seja o conjunto dos vectores
x que verificam

−i −1 a 0
(A − iI)x = 0 ⇐⇒ = ⇐⇒ −ia = b.
1 −i b 0
Logo, E(i) = {(a, −ia) : a ∈ C} = Span{(1, −i)}. Como a valores próprios conju-
gados correspondem vectores próprios conjugados, tem-se
n o
E(−i) = (ā, (−ia)) : a ∈ C = {ā (1, i) : a ∈ C} = Span{(1, i)}.
4.1.1 Valores próprios e comportamento de f (x) = Ax

Nesta secção analisamos algumas relações entre os valores e vectores próprios de uma
matriz real A de ordem n e o comportamento da função f : Rn → Rn que aplica um
vector x ∈ Rn no vector Ax ∈ Rn , x 7→ Ax.
A função f , definida por f (x) = Ax, é uma função linear, ou seja, uma função que
verifica f (αx + βy) = αf (x) + βf (y) para quaisquer α, β ∈ R e x, y ∈ Rn . Como
veremos no Capı́tulo 6, qualquer função linear de Rn em Rn pode ser escrita na forma
Ax.
Estudaremos aqui com algum detalhe dois casos: 1) A matriz A só tem valores
próprios reais; 2) A matriz A é 2 × 2 e tem um par de valores próprios complexos
conjugados. Como veremos ainda neste capı́tulo, estes dois casos são aqueles que
importa estudar se se pretende entender o caso geral de funções f definidas por matrizes
A que sejam diagonalizáveis.
Caso 1: A matriz A só tem valores próprios reais.
Seja λ um valor próprio real da matriz real A e f (x) = Ax. O espaço próprio
E(λ) é o espaço gerado pelos vectores próprios associados ao valor próprio λ da
matriz A, logo
f (x) = Ax = λx, para todo x ∈ E(λ).

A igualdade anterior diz-nos que, se x ∈ E(λ) então o vector f (x) é um múltiplo

de x, e portanto f (x) também pertence a E(λ).
Ou seja, se λ ∈ R qualquer vector do espaço próprio E(λ) é aplicado por f num
vector do espaço próprio. Na Figura 4.1 ilustramos este facto.
f (x) = Ax
x x
0 0 f (x) = Ax
E(λ) E(λ)
|λ| > 1 |λ| < 1
Figura 4.1: Os subespaços próprios de valores próprios reais são invariantes por f .
Quando qualquer vector de um subconjunto S do domı́nio de uma função g é

aplicado por g num vector de S dizemos que o conjunto S é invariante por g.
Se A é uma matriz real de ordem n, os subespaços próprios correspondentes a

valores próprios reais são subespaços de Rn invariantes por f (x) = Ax.
Exemplo 4.5. A matriz A do Exemplo 4.2 (pág. 149) tem espectro σ(A) =
{ 32 , 12 }. A função f (x) = Ax é
 
x1 − x22
1 −1/2 x1
f (x) = f (x1 , x2 ) = = .
−1/2 1 x2 −x1
2 + x 2
x2 −x1
Ou seja, f (x1 , x2 ) = (x1 − 2 , 2 + x2 ).
Os espaços próprios de A, obtidos no referido exemplo, são

3 1
E = Span{(−1, 1)} e E = Span{(1, 1)}.
2 2
Geometricamente, estes espaços próprios são rectas que passam pela origem e
têm as direcções dos vectores (−1, 1) e (1, 1). Assim, a função
f : contrai vecto-
res na direcção definida por E 12 já que, para x ∈ E 21 a respectiva imagem
3
por f é f (x) = x2 ; e expande
vectores na direcção definida por E 2 , visto que
f (x) = 3x 2 para x ∈ E 3
2 . Na Figura 4.2 ilustramos este facto.
Caso 2: A é uma matriz real, 2 × 2, e tem um par de valores próprios complexos conju-
gados.
Do caso anterior, sabemos que os subespaços próprios de valores próprios reais,
de uma matriz real A, são subespaços invariantes para a função f : Rn → Rn ,

x2
f (x) = 32 x
x
x
f (x) = 12 x
x1
E(1/2) E(3/2)
3

4.2: A função f expande vectores na direcção E
Figura 2 e contrai na direcção
E 12 .
definida por f (x) = Ax. Quando os valores próprios de A são complexos, os

respectivos espaços próprios não são subespaços de Rn , apesar da função f estar
definida de Rn em Rn .
Consideremos a matriz A do Exemplo 4.4 (pág. 154) e a função f (x) = Ax.
Essa matriz tem valores próprios complexos ±i, e a função f (x) = Ax é defi-
nida por

0 −1 x1 −x2
f (x) = Ax ⇐⇒ f (x1 , x2 ) = = .
1 0 x2 x1
Geometricamente, f actua no vector x rodando-o em torno da origem de um

π
ângulo no sentido directo (ou anti-horário). A Figura 4.3 ilustra este facto.
2
Como se observa neste exemplo, se aplicarmos f , sucessivamente, a um vector
x, ao fim de 4 aplicações voltamos a obter o vector x. Na Figura 4.3 denotamos
por
f k (x) = (f ◦ f ◦ · · · ◦ f )(x),
| {z }
k vezes
a composição de f consigo própria k vezes (isto é, a transformação obtida por

k aplicações sucessivas de f ). Note-se que sendo f (x) = Ax se tem f k (x) =
Ak x.
É óbvio que, exceptuando a origem, nenhum vector de R2 é aplicado num múl-
tiplo de si próprio. Ou seja, os únicos subespaços de R2 invariantes por f são
{(0, 0)} e R2 .
Consideremos agora uma matriz A do tipo 2×2 com valores próprios complexos
λ = a ± ib, com b 6= 0,
a −b
A= .
b a
Recorde (Anexo A) que há uma correspondência biunı́voca entre pontos do plano
de coordenadas (a, b) e números complexos a + ib.
Usando coordenadas polares, a = ρ cos θ e b = ρ sen θ, o número complexo
λ = a + ib escreve-se na forma polar: λ = ρ(cos θ + i sen θ). O valor ρ =

x2 x = f 4 (x)
x = f 4 (x) f (x)
f (x)
x1 f 3 (x)
f 2 (x)
Figura 4.3: A função, f (x) = Ax, em que A tem valores próprios ±i representa uma
rotação em R2 .
√
|λ| = a2 + b2 é a distância de λ à origem, e θ é o ângulo entre a parte positiva
do eixo real e o ponto (a, b) (com −π < θ ≤ π). A Figura A.2 da página 427,
ilustra a representação polar de um número complexo a + ib.
Assim, a matriz A pode escrever-se como um produto de duas matrizes

a −b ρ 0 cos θ − sen θ
A= = = DR.
b a 0 ρ sen θ cos θ

cos θ − sen θ
A matriz R = é uma matriz de rotação, visto que para x ∈ R2
sen θ cos θ
o vector Rx é o vector de R2 que se obtém rodando x de um ângulo θ, no sentido
directo, em torno da origem (como facilmente se verifica).

ρ 0
A matriz D = representa uma expansão se ρ = |λ| > 1, e uma
0 ρ
contracção se ρ = |λ| < 1 já que, Dx = ρx.
Assim, a função f (x) = Ax = DR x actua sobre um vector x ∈ R2 rodando
este vector e depois expandindo, contraindo ou mantendo-o, respectivamente nos
casos em que |λ| > 1, |λ| < 1 e |λ| = 1. A Figura 4.4 ilustra esse comporta-
mento de f sobre vectores de R2 .
f (x)
Rx
x f (x) x Rx x
f (x)
|λ| < 1 |λ| = 1 |λ| > 1
Figura 4.4: O valor próprio λ de A é complexo e f (x) = Ax = DRx.

Como veremos na secção seguinte, o comportamento geral de uma função f :

Rn → Rn definida por f (x) = Ax, em que A é uma matriz (real) diagonalizável é
bem ilustrado pelos dois casos apresentados.
Consideremos agora um exemplo de uma matriz A possuindo valores próprios reais
e complexos.
√ 
3 1
2 −
√2
0
 
Exemplo 4.6. Consideremos f (x) = Ax com A =  1 3
0 .
2 2
0 0 1.2
√ √
3
A matriz A tem valores próprios λ1 = 2 + i 21 , λ2 = 2
3
− i 12 e λ3 = 1.2.
O valor próprio λ3 é real e o seu espaço próprio é gerado pelo vector (0, 0, 1) (isto
é, E(1.2) é o eixo dos zz). Logo, vectores do eixo dos zz são aplicados por f em
vectores do eixo dos zz por uma expansão de factor 1.2.
Atendendo à forma da matriz A (diagonal por blocos) é fácil verificar que f aplica
vectores do plano xy em vectores deste plano. Como
q o valor próprio λ1 (e portanto
o seu conjugado λ2 ) tem módulo |λ1 | = |λ2 | = 34 + 41 = 1, a função f aplica um
vector u do plano xy num vector que se obtém de u por rotação (em torno do eixo dos
zz).
√
O ângulo
√
desta rotação é π/6 (note que sen π/6 = 1/2). Por exemplo f (1, 1, 0) =
( 3−1
2 , 3+1
2 , 0). Para qualquer outro vector v = (s1 , s2 , s3 ), a imagem por f deste
vector é o vector f (v) que tem terceira coordenada 1.2s3 (expansão na direcção do
eixo dos zz), e duas primeiras coordenadas respectivamente, cos(π/6)s1 − sen(π/6)s2
e sen(π/6)s1 + cos(π/6)s2 (rotação de (s1 , s2 ) de π/6 em torno da origem).
A Figura 4.5 ilustra aplicações sucessivas de f ao vector u do plano xy, ao vector
w do eixo dos zz, e ao vector v que não pertence a estes subespaços. Esta figura ilustra
ainda o facto das imagens de aplicações sucessivas de f a vectores v não pertencentes
ao eixo dos zz nem ao plano xy, estarem sobre hélices inscritas num cilindro (uma vez
que os valores próprios complexos de A têm módulo igual a 1).
f 2 (w)
f (w)
f 2 (v)
w
f (v)
v
f 2 (u)
u f (u)
Figura 4.5: Aplicações sucessivas de f (x) = Ax para a matriz A do Exemplo 4.6.

Diagonalização de matrizes 159
4.2 Diagonalização de matrizes

O problema central tratado nesta secção é o de saber se dada uma matriz de ordem n
existe uma base de Cn formada por vectores próprios. Quando tal acontece a matriz
diz-se diagonalizável, ou seja, é semelhante a uma matriz diagonal. O processo de
diagonalização de matrizes desempenha um papel relevante em álgebra linear sendo
inúmeras as suas aplicações. Por exemplo, a diagonalização de matrizes é utilizada na
interpretação da dinâmica de modelos fı́sicos, em computação gráfica, e na identificação
e superfı́cies.
Definição 4.7. Duas matrizes quadradas A e B dizem-se semelhantes se existe uma

matriz invertı́vel P tal que
A = P BP −1 .
Definição 4.8. Uma matriz quadrada A diz-se diagonalizável se é semelhante a uma

matriz diagonal D. Isto é, se existe uma matriz invertı́vel P tal que
A = P DP −1 .
A uma matriz P tal que, A = P DP −1 com D diagonal, chama-se matriz que diago-
naliza A, ou matriz diagonalizante de A.
Comecemos por mostrar que os valores próprios de matrizes semelhantes são iguais.
Proposição 4.5. Matrizes semelhantes têm o mesmo polinómio caracterı́stico. Em
particular, os valores próprios são os mesmos e ocorrem com as mesmas multiplici-
dades.
Demonstração. Sejam A e B matrizes semelhantes, isto é, existe uma matriz invertı́vel
P tal que A = P BP −1 . Tem-se

det(A − λI) = det(P BP −1 − λI) = det P (B − λI)P −1
= det P det(B − λI) det(P −1 ) = det(B − λI).
Nas igualdades anteriores aplicámos os seguintes factos: o determinante do produto é

igual ao produto dos determinantes; o determinante da inversa é o inverso do determi-
nante. Da última igualdade segue que o polinómio caracterı́stico de A é igual ao de B
e portanto A e B possuem os mesmos valores próprios com as mesmas multiplicida-
des.
Da Proposição 4.3 sabemos que o traço e o determinante de uma matriz de ordem
n são respectivamente iguais à soma e ao produto dos n valores próprios da matriz, por
conseguinte, da proposição anterior, segue o corolário que passamos a enunciar.
Corolário 4.2. Matrizes semelhantes têm o mesmo traço e o mesmo determinante.
Se A é uma matriz diagonalizável, isto é, A = P DP −1 com D diagonal, pela

Proposição 4.5 os valores próprios de D são os valores próprios de A. Como D é
diagonal, os seus valores próprios são as entradas da sua diagonal principal. Logo,
D = diag (λ1 , λ2 , . . . , λn ), onde λ1 , λ2 , . . . , λn são os valores próprios de A.

No caso de A ser diagonalizável, a questão que agora se coloca é a de saber cons-

truir uma matriz P que diagonaliza A. O teorema seguinte mostra como construir uma
tal matriz, oferecendo simultaneamente uma condição necessária e suficiente para que
uma matriz seja diagonalizável.
Teorema 4.1. Uma matriz A do tipo n × n é diagonalizável se e só se possui n

vectores próprios linearmente independentes. Ou seja, se e só se existe uma base de
Cn constituı́da por vectores próprios de A.
Além disso, se A = P DP −1 com D = diag (λ1 , λ2 , . . . , λn ), então para todo
i = 1, . . . , n, a coluna i de P é um vector próprio de A associado ao valor próprio λi .
Demonstração. A igualdade A = P DP −1 é equivalente a AP = P D. O produto AP

é a matriz cujas colunas são o produto de A pelas colunas de P (ver Definição 1.12,
pág. 38). Assim, designando as colunas de P por ci , tem-se
   
AP = A c1 c2 ··· cn  = Ac1 Ac2 ··· Acn  .
Por outro lado,

 
  λ1 0 ··· 0
0 λ2 ··· 0 
 
P D = c1 c2 ··· cn   . .. .. 
 .. . . 
0 0 ··· λn
 
= λ1 c1 λ2 c2 ··· λn cn  .
Logo, AP = P D se e só se a i-ésima coluna de P verifica Aci = λi ci , para todo

i = 1, . . . , n. Ou seja, se e só se ci é um vector próprio de A associado ao valor
próprio λi .
A matriz P é invertı́vel se e só se tem n colunas linearmente independentes (propo-
sições 3.14 e 3.15, pág. 130). Conclui-se portanto que é necessário e suficiente para que
A seja diagonalizável que existam n vectores próprios de A linearmente independentes.
Note-se que nem todas as matrizes são diagonalizáveis como se verifica no exemplo
seguinte.
 
2 0 0
Exemplo 4.7. Considere a matriz A = 0 1 1.
0 0 1
Verifiquemos se esta matriz é ou não diagonalizável.
Uma vez que a matriz A é triangular, os valores próprios de A são λ1 = 2 e
λ2 = 1 (as entradas da diagonal principal). O valor próprio 2 é simples e o valor

próprio 1 tem multiplicidade algébrica 2, visto que o polinómio caracterı́stico de A é

p(λ) = (2 − λ)(1 − λ)2 .
Para que A seja diagonalizável têm de existir 3 vectores próprios linearmente inde-
pendentes. Determinemos os espaços próprios.
    
0 0 0 a 0
−b + c = 0
(A − 2I)x = 0 ⇐⇒ 0 −1 1   b  = 0 ⇐⇒
c=0
0 0 −1 c 0
Logo,

E(2) = (a, b, c) ∈ R3 : b = c = 0 = {(a, 0, 0) : a ∈ R} = Span {(1, 0, 0)} .
Para λ2 = 1:
    
1 0 0 a 0
a=0
(A − I)x = 0 ⇐⇒ 0 0 1  b  = 0 ⇐⇒
c=0
0 0 0 c 0

E(1) = (a, b, c) ∈ R3 : a = c = 0 = {(0, b, 0) : b ∈ R} = Span {(0, 1, 0)} .
Como a dimensão de cada espaço próprio é igual a 1, existem no máximo dois vectores
próprios linearmente independentes (um vector retirado de cada espaço próprio). Ou
seja, não existe um número suficiente de vectores próprios (que seria 3) para a matriz
ser diagonalizável. Portanto, a matriz A não é diagonalizável.
Pelo teorema anterior sabemos que é condição necessária e suficiente para uma
matriz A, de ordem n, ser diagonalizável que possua n vectores próprios linearmente
independentes, ou seja, que exista uma base do espaço linear complexo Cn formada
por vectores próprios de A. Como veremos adiante (Proposição 4.6 e Corolário 4.4),
esta condição é equivalente à soma das dimensões dos espaços próprios ser igual a n.
O resultado que segue mostra que vectores próprios de espaços próprios associados
a valores próprios distintos são necessariamente linearmente independentes.
Proposição 4.6. A valores próprios distintos correspondem vectores próprios line-

armente independentes. Isto é, se u1 , . . . , uk são vectores próprios associados res-
pectivamente a λ1 , . . . , λk , com λi 6= λj para todo i 6= j e i, j = 1, . . . k , então
{u1 , . . . , uk } é linearmente independente.
Demonstração. Sejam λ1 e λ2 valores próprios distintos de uma matriz A, e v1 e v2

vectores próprios associados respectivamente a λ1 e λ2 . Vejamos que v1 e v2 são
linearmente independentes. Para tal, considere-se a combinação linear
α1 v1 + α2 v2 = 0. (4.7)
Multiplicando a equação (4.7) por A, resulta
α1 Av1 + α2 Av2 = 0 ⇐⇒ α1 λ1 v1 + α2 λ2 v2 = 0. (4.8)

Multiplicando a combinação linear (4.7) por λ1 , tem-se
α1 λ1 v1 + α2 λ1 v2 = 0.
Subtraindo esta equação à equação (4.8), obtemos
α2 (λ1 − λ2 )v2 = 0 ⇐⇒ α2 = 0,
onde a equivalência anterior é válida uma vez que (λ2 − λ1 ) 6= 0 e v2 6= 0 ( v2 é um

vector próprio).
Da mesma forma, multiplicando (4.7) por λ2 e subtraindo à equação (4.8), obtemos
α1 (λ2 − λ1 )v1 = 0, o que dá α1 = 0. Assim, a única solução de (4.7) é α1 = α2 = 0,
ou seja, v1 e v2 são linearmente independentes.
Como corolário da proposição anterior e do Teorema 4.1 podemos enunciar o se-

guinte resultado.
Corolário 4.3. Uma matriz n × n com n valores próprios distintos é diagonalizável.
Apresentamos em seguida alguns exemplos.

 
4 0 1
Exemplo 4.8. Verifiquemos que A = 2 3 2 é diagonalizável, e determinemos
1 0 4
uma matriz P que diagonaliza A.
O polinómio caracterı́stico de A é

4 − λ 0 1
4 − λ 1
det(A − λI) = 2 3 − λ 2 = (3 − λ) 1

1 4 − λ
0 4 − λ

= (3 − λ) λ2 − 8λ + 15 = (3 − λ)2 (5 − λ).
Assim, a matriz A tem valores próprios λ1 = 3 e λ2 = 5, de multiplicidades algébricas

2 e 1, respectivamente. Saliente-se ainda que no cálculo de det(A − λI) aplicámos
o desenvolvimento de Laplace utilizando a segunda coluna, o que produziu imediata-
mente uma factorização do polinómio (e portanto uma raiz).
Calculemos bases para os espaços próprios de A.
    
1 0 1 a 0
(A − 3I)x = 0 ⇐⇒ 2 0 2  b  = 0 ⇐⇒ a + c = 0
1 0 1 c 0

E(3) = (a, b, c) ∈ R3 : a = −c = {(−c, b, c) : b, c ∈ R}
= Span {(−1, 0, 1), (0, 1, 0)} .

    
−1 0 1 a 0
−a + c=0
(A − 5I)x = 0 ⇐⇒  2 −2 2   b  = 0 ⇐⇒
2a − 2b + 2c = 0
1 0 −1 c 0
⇐⇒ a = c e b = 2a.

E(5) = (a, b, c) ∈ R3 : a = c e b = 2a = {(a, 2a, a) : a ∈ R}
= Span {(1, 2, 1)} .
Como {(−1, 0, 1), (0, 1, 0)} e {(1, 2, 1)} são bases, respectivamente, dos subespaços
E(3) e E(5), tem-se
dim E(3) = 2 e dim E(5) = 1.
Conclui-se portanto que a multiplicidade geométrica de λ = 3 é dois, e a de λ = 5 é
um. Por conseguinte, a matriz A só tem valores próprios semi-simples. Existem três
vectores próprios de A linearmente independentes, e portanto A é diagonalizável.
Uma matriz P que diagonaliza A (isto é, A = P DP −1 com D diagonal), é uma
matriz cujas colunas formam uma base constituı́da por vectores próprios de A. É claro
que P depende da forma como se constrói a matriz D. Assim, se escolhermos D =
diag(3, 5, 3), a matriz P possui, na 1a e 3a colunas vectores próprios associados ao
valor próprio λ1 = 3, e na segunda coluna um vector próprio associado a λ2 = 5. Para
que P seja invertı́vel, temos de escolher vectores próprios linearmente independentes.
Por exemplo,    
−1 1 0 3 0 0
P =  0 2 1 e D = 0 5 0 .
1 1 0 0 0 3
Também podemos considerar, por exemplo,
   
−1 0 1 3 0 0
P =  0 1 2 e D = 0 3 0 ,
1 0 1 0 0 5
correspondendo a uma outra colocação dos valores próprios de A na diagonal principal
de D.
 
2 5 0
Exemplo 4.9. Seja A = −1 0 0.
0 0 5
Usando o desenvolvimento de Laplace ao longo da terceira coluna de (A − λI),
temos

2 − λ 5 0

det(A−λI) = −1 −λ 0 = (5−λ) [−λ(2 − λ) + 5] = (5−λ)(λ2 −2λ+5).
0 0 5 − λ
Logo, 5 e 1 ± 2i são valores próprios de A, já que
√
2 2± −16
(λ − 2λ + 5) = 0 ⇐⇒ λ = = 1 ± 2i.
2

A matriz A é diagonalizável uma vez que tem três valores próprios distintos (cf. Co-
rolário 4.3). Para factorizar A na forma A = P DP −1 vamos calcular os espaços
próprios considerando-os como subespaços de Cn (a matriz é real mas tem valores
próprios complexos).
    
−3 5 0 a 0
−3a + 5b = 0
(A−5I)x = −1 −5 0  b  = 0 ⇐⇒ ⇐⇒ a = b = 0.
−a − 5b = 0
0 0 0 c 0
Logo,
E(5) = {(0, 0, c) : c ∈ C} = Span{(0, 0, 1)}.
    
1 − 2i 5 0 x 0
(A − (1 + 2i)I)x =  −1 −1 − 2i 0   y  = 0
0 0 4 − 2i z 0

−x − (1 + 2i)y = 0
⇐⇒ ⇐⇒ x = −(1 + 2i)y e z = 0.
(4 − 2i)z =0
Note-se que a matriz A − (1 + 2i)I deverá ter determinante igual a zero uma vez que
1 + 2i é valor próprio de A. Ou seja, as linhas de A − (1 + 2i)I são linearmente
dependentes. Desta observação podemos concluir (sem verificação adicional) que as
duas primeiras linhas da matriz são linearmente dependentes, e consequentemente o
sistema (A − (1 + 2i)I)x = 0 reduz-se às duas equações indicadas acima. Logo,
E(1 + 2i) = {(−(1 + 2i)y, y, 0) : y ∈ C} = Span{(1 + 2i, −1, 0)}.
Como a valores próprios complexos conjugados correspondem vectores próprios con-
jugados, tem-se
E(1 − 2i) = {(−(1 − 2i)ȳ, ȳ, 0) : y ∈ C} = Span{(1 − 2i, −1, 0)}.
Assim, uma matriz P que diagonaliza A e a correspondente matriz diagonal D podem
ser    
1 + 2i 1 − 2i 0 1 + 2i 0 0
P =  −1 −1 0 , D =  0 1 − 2i 0 .
0 0 1 0 0 5
Sugere-se que confirme a igualdade A = P DP −1 .
Como vimos, uma matriz A de ordem n é diagonalizável se e só se a soma das
dimensões dos espaços próprios de A (ou seja, a soma das multiplicidades geométricas
dos valores próprios de A) for igual a n. Já se observou no Exemplo 4.7 que existem
matrizes cuja soma das multiplicidades geométricas dos seus valores próprios é inferior
à ordem da matriz. Coloca-se naturalmente a questão de saber se essa soma pode
ser superior a n. A resposta a esta questão é negativa como se deduz da proposição
seguinte.
Proposição 4.7. Se λ é um valor próprio da matriz A, então
mult geom(λ) ≤ mult alg(λ).

Demonstração. Seja A uma matriz de ordem n e µ um valor próprio de A de multipli-

cidade algébrica igual a k. O polinómio caracterı́stico de A é portanto da forma
p(λ) = (µ − λ)k q(λ),
onde q é um polinómio de grau (n − k) que não possui µ como raiz.
Suponha-se, por redução ao absurdo, que mult geom(µ) = r > k. Ou seja, que
existem r vectores próprios u1 , . . . , ur linearmente independentes associados ao valor
próprio µ.
É óbvio que se µ é o único valor próprio de A (isto é, k = n) temos uma contradição
uma vez que qualquer base de N (A − µI) tem no máximo n vectores e portanto não
podem existir mais do que n vectores próprios linearmente independentes.
Considere-se agora que r > k e que µ não é o único valor próprio de A. Podemos
completar o conjunto {u1 , . . . , ur } por forma a obter uma base de Cn . Seja B =
{u1 , . . . , ur , v1 , . . . , vn−r } uma tal base, e P a matriz cujas colunas são os vectores
de B, colocados segundo a ordem pela qual aparecem em B. As primeiras r colunas
ui de P verificam Aui = µui , e portanto P AP −1 é uma matriz em blocos da forma

T T12
P AP −1 = T = 11 ,
0 T22
onde T11 é uma matriz diagonal do tipo r × r com todas as entradas na diagonal prin-
cipal iguais a µ, isto é, T11 = µIr . A matriz A e a matriz T = P AP −1 têm o mesmo
polinómio caracterı́stico (conforme Proposição 4.5), ou seja

T11 − λIr T12
p(λ) = det(A − λI) = det(T − λI) = .
0 T22 − λIn−r
Efectuando r aplicações sucessivas do desenvolvimento de Laplace segundo a primeira
coluna, tem-se
p(λ) = det(T − λI) = det(T11 − λIr ) det(T22 − λIn−r ) = (µ − λ)r s(λ),
onde s é um polinómio de grau n − r. Da expressão anterior conclui-se que µ é uma
raiz de p com multiplicidade algébrica pelo menos r > k, o que é uma contradição.
A soma das multiplicidades algébricas dos valores próprios de uma matriz de ordem
n é exactamente n, consequentemente segue como corolário da proposição anterior, da
Proposição 4.6 e do Teorema 4.1, o seguinte:
Corolário 4.4. Uma matriz é diagonalizável se e só se qualquer valor próprio λ da
matriz verifica
mult alg(λ) = mult geom(λ).
Ou seja, uma matriz é diagonalizável se e só todos os valores próprios são semi-
simples.
Terminamos esta secção referindo alguns resultados sobre diagonalização de ma-
trizes reais com valores próprios complexos.

Valores próprios complexos

Recordemos que se λ é um valor próprio complexo não real de uma matriz real A de
ordem n, e x um vector próprio associado a λ, então x não é um vector de Rn . Assim,
se a matriz real A é diagonalizável e tem valores próprios complexos, então a matriz P
na factorização A = P DP −1 possui entradas complexas (ver Exemplo 4.9). É habitual
designar-se este facto dizendo que a matriz A é diagonalizável em Cn .
Quando uma matriz diagonalizável A tem valores próprios complexos a factoriza-
ção A = P DP −1 (com D diagonal), não é a factorização mais conveniente para, por
exemplo, estudar o comportamento geométrico da função f : Rn → Rn , definida por
x 7→ Ax = P DP −1 x, uma vez que P −1 x não pertence a Rn . No sentido de esclarecer
esta questão, iremos mostrar que se A é diagonalizável em Cn , então existem matrizes
reais M e Σ tais que A = M ΣM −1 , com Σ uma matriz diagonal por blocos, com um
bloco diagonal (correspondente aos valores próprios reais), e blocos 2 × 2 da forma

a −b
S= . (4.9)
b a
(correspondentes a cada par de valores próprios complexos λ = a ± bi). Ou seja,

 
D 0 ··· 0
 0 S1 · · · 0 
 
Σ=. .. .. ..  , (4.10)
 .. . . . 
0 0 ··· Sk
onde as matrizes Si são da forma (4.9), a matriz D é uma matriz diagonal tendo na sua
diagonal principal os valores próprios reais de A e 0 designa matrizes nulas.
Antes de procedermos à demonstração deste teorema estabelecem-se alguns resul-
tados preliminares.
Define-se a parte real e a parte imaginária de um vector u ∈ Cn como sendo os vec-
tores de Rn cujas componentes são, respectivamente, a parte real e a parte imaginária
de u. Por exemplo, se u = (5 − i, −2 + 3i), então Re u = (5, −2) e Im u = (−1, 3).
Lema 4.1. Os vectores u ∈ Cn e u ∈ Cn são linearmente independentes se e só se

Re u e Im u são vectores (de Rn ) linearmente independentes.
Demonstração. Qualquer vector u de Cn escreve-se na forma u = Re u + i Im u.

Como Re u = Re u e Im u = − Im u, tem-se
(α + iβ)u + (γ + iδ)u = (α + iβ) (Re u + i Im u) + (γ + iδ) (Re u − i Im u)
= [(α + γ) Re u + (δ − β) Im u] + i [(β + δ) Re u + (α − γ) Im u] .
Logo, (α + iβ)u + (γ + iδ)u = 0 + 0i é equivalente ao sistema

(α + γ) Re u + (δ − β) Im u = 0
(4.11)
(β + δ) Re u + (α − γ) Im u = 0.

Uma vez que se verifica a equivalência



 α+γ =0

α−γ =0
α = β = γ = δ = 0 ⇐⇒

 δ+β =0

δ − β = 0,
os vectores u e u são linearmente independentes se e só se Re u e Im u são linearmente
independentes.
Proposição 4.8. Seja A uma matriz real 2 × 2 com valores próprios a ± bi (b 6= 0) e

v ∈ C2 um vector próprio associado a λ = a − bi. Então,
 

a −b
A = M SM −1 , com M = Re v Im v e S = ,
b a
onde Re v e Im v designam, respectivamente, a parte real e a parte imaginária do

vector v.
Demonstração. O Lema 4.1 garante que as colunas de M são linearmente independen-
tes, uma vez que o vectores v e v são vectores próprios associados a valores próprios
distintos, e portanto linearmente independentes (conforme Proposição 4.6). Assim,
M é invertı́vel e A = M SM −1 é equivalente a AM = M S. Necessitamos pois de
mostrar que AM = M S, com M e S da forma indicada no enunciado. Ora,
 

a −b
M S = Re v Im v
 
b a

a −b
= M M (pela Definição 1.12)
b a
 
= a Re v + b Im v −b Re v + a Im v (pela Definição 1.11)
e
   
AM = A Re v Im v = A Re v A Im v (pela Definição 1.12).
Da definição de valor e vector próprio, temos

Av = λv ⇐⇒ A (Re v + i Im v) = (a − ib) (Re v + i Im v)
⇐⇒ A Re v + iA Im v = (a Re v + b Im v) + i (−b Re v + a Im v)
⇐⇒ A Re v = a Re v + b Im v e A Im v = −b Re v + a Im v,
onde na última equivalência aplicámos o facto de dois números complexos serem iguais
se e só se as respectivas partes reais e imaginárias forem iguais.
Por conseguinte, a igualdade AM = M S é satisfeita.

Enunciemos agora o teorema já referido.
Teorema 4.2. Seja A uma matriz real, n×n, diagonalizável, e com p valores próprios
reais e k pares de valores próprios complexos conjugados (p + 2k = n). Existem
matrizes reais M e Σ tais que A = M ΣM −1 . A matriz Σ é uma matriz diagonal por
blocos da forma  
D 0 ··· 0
 0 S1 · · · 0 
 
Σ=. .. .. ..  .
 .. . . . 
0 0 ··· Sk
Os blocos (na diagonal) de Σ são:
• O bloco D é uma matriz diagonal de ordem p com entradas na diagonal prin-
cipal iguais aos valores próprios reais de A, repetidos de acordo com as suas
multiplicidades.

a −bj
• Cada bloco Sj é um bloco 2 × 2 da forma j , com aj ± ibj um par de
b j aj
valores próprios complexos conjugados de A.
As colunas de M são:
• As primeiras p colunas são vectores próprios associados aos valores próprios
reais de A.
• As colunas de p + 1 a n são, respectivamente, os pares de vectores Re vj e
Im vj , (j = 1, . . . , k), onde vj é um vector próprio associado ao valor próprio
(complexo) λj = aj − ibj .
Demonstração. A matriz A é diagonalizável e portanto existe uma base de Cn cons-

tituı́da por vectores próprios de A. Seja {u1 , . . . , up , v1 , v1 , . . . , vk , vk } uma base
de Cn , em que ui é um vector próprio associado a um valor próprio real e vj , vj são
vectores próprios associados, respectivamente, ao par de valores próprios complexos
aj − ibj , aj + ibj . Do Lema 4.1 segue que
B = (u1 , . . . , up , Re v1 , Im v1 , . . . , Re vk , Im vk )
é uma base ordenada de Rn .

Coloque-se os vectores da base B numa matriz M por colunas, respeitando a ordem
de B. Efectuando os produtos M A e ΣM , e aplicando a Proposição 4.8, obtém-se
M A = ΣM . Como as colunas de M formam uma base, a matriz M é invertı́vel e
portanto M A = ΣM é equivalente a M AM −1 = Σ.
Ilustremos a aplicabilidade deste teorema à matriz do Exemplo 4.9. Nesse exemplo,
verificámos que o espectro de A é σ(A) = {5, 1 + 2i, 1 − 2i}, e consequentemente A
é diagonalizável. Os espaços próprios são
E(5) = Span{(0, 0, 1)}, E(1 − 2i) = Span{(1 − 2i, −1, 0)}.

Seja v = (1 − 2i, −1, 0) um vector próprio associado a λ = 1 − 2i. Os vectores Re v

e Im v são    
1 −2
Re v = −1 e Im v =  0  .
0 0
Por conseguinte, o Teorema 4.2 diz-nos que podemos tomar para M e Σ as matrizes
   
0 1 −2 5 0 0
M = 0 −1 0  e Σ = 0 1 −2 .
1 0 0 0 2 1
Ou seja, A = M ΣM −1 com M e Σ reais. Sugerimos que compare esta factorização

com a factorização A = P DP −1 obtida no Exemplo 4.9.
Finalizamos esta secção fazendo uma referência breve ao comportamento da função

f : Rn → Rn , definida por f (x) = Ax, no caso em que A é diagonalizável e possui
valores próprios complexos.
Seja A uma matriz real, n×n, diagonalizável. Então, A = M ΣM −1 com M real e
Σ uma matriz real diagonal por blocos da forma (4.10). A matriz M é invertı́vel, e pelo
Teorema 3.8 a matriz M realiza a mudança da base constituı́da pelos vectores coluna
de M (que é uma base de Rn constituı́da por vectores próprios de A correspondentes
a valores próprios reais, e pelos vectores das partes reais e imaginárias de vectores
próprios associados aos valores próprios complexos) para a base canónica de Rn . A
matriz M permite efectuar a mudança de variáveis de x para y, mediante a igualdade
x = M y, ou seja, f (x) = Ax = M ΣM −1 x = M Σy.
A acção de f sobre um vector x (ou equivalentemente a acção de A sobre x) pode
traduzir-se do seguinte modo: (i) fazer a mudança de variáveis de x para y; (ii) fazer
actuar a matriz Σ em y; (iii) seguidamente, sobre o vector obtido, efectuar a mudança
de variáveis (inversa) para a variável inicial. No diagrama seguinte ilustram-se estes
factos.
A
Rn ∋ x −−−−→ Ax ∈ Rn
 x
 
M −1 y M
Σ
Rn ∋ y −−−−→ Σy ∈ Rn
A matriz Σ é constituı́da por blocos diagonais e por blocos associados a pares de va-
lores próprios complexos conjugados os quais são matrizes do tipo estudado no Caso
2 da Secção 4.1.1(ver página 155). Do estudo efectuado nessa secção, sabemos como
actuam os blocos de Σ em vectores de Rn . Nomeadamente: (i) Σ aplica vectores de um
espaço próprio de um valor próprio real num vector do mesmo espaço; (ii) Σ roda (com
possı́vel expansão ou contracção) vectores pertencentes ao espaço gerado pelas partes
real e imaginária dos vectores de uma base do espaço próprio de um valor próprio
complexo λ.
"√ √ #
3 − 3
2 √2
Exemplo 4.10. Considere-se a matriz A = 1 3 .
√
2 3 2

√
Esta matriz possui valores próprios λ = 12 ( 3 ± i). De facto, podemos verificar
√
−i 3 √
que v = é um vector próprio de A associado ao valor próprio λ = 21 ( 3 − i),
1
já que "√
3
√ #
− 3 √ √ √
2 2 −i 3 3 − i −i 3
Av = 1
√
3 = = λv.
√
2
1 2 1
2 3
A Proposição 4.8 garante que a matriz A é da forma A = M SM −1 , com

 
"√
3 −1
# √
0 − 3
S = 21 √2
3
e M= = Re v Im v .
1 0
2 2
Atendendo ao estudo realizado na Secção 4.1.1-Caso 2, sabemos que a matriz S é uma

matriz de rotação (os valores próprios têm módulo igual a 1), e que S actua em vectores
de R2 rodando-os (no sentido directo) em torno da origem de um ângulo π6 (note que
√
cos π6 = 23 e sen π6 = 12 ) .
Na Figura 4.6 encontram-se representadas sucessivas aplicações de S ao vector
x0 = (1, 3) através de pontos a cor azul. Cada um destes pontos é obtido do anterior
por uma rotação de π/6, ou seja, os pontos correspondentes a aplicações sucessivas de
S situam-se sobre uma circunferência √ de centro na origem e raio igual à distância de
x0 à origem, isto é, de raio igual a 10.
As imagens de aplicações sucessivas de A ao mesmo ponto x0 (representadas na
Figura 4.6 a vermelho) estão por sua vez sobre uma elipse. Note-se que x = M y é da
forma √
x − 3y1
x = M y ⇐⇒ 0 = ,
x1 y0
e portanto se x = (x0 , x1 ) pertence à circunferência de equação x20 + x21 = 10, então
y2 3 2
o ponto y = (y0 , y1 ) pertence à elipse definida por 100 + 10 y1 = 1.
Ax0 Sx03 x0
A2 x0 S 2 x0
2
-4 -2 2 4
-1
-2
-3
Figura 4.6: Sucessivas aplicações de f (x) = Ax e de g(w) = Sw ao ponto x0 , onde

A = M SM −1 . A matriz A tem valores próprios complexos de módulo 1.

Potências de uma matriz e valores próprios 171
4.3 Potências de uma matriz e valores próprios

Certas propriedades dos valores e vectores próprios de potências de uma matriz de-
sempenham um papel fundamental em álgebra linear e nas aplicações. Neste texto
encontram-se alguns exemplos ilustrativos da relevância dos valores e vectores pró-
prios de potências de matrizes, nomeadamente no estudo do comportamento a longo
prazo de cadeias de Markov (estudadas na próxima secção), ou na determinação da
forma canónica de Jordan de uma matriz (tratada no Capı́tulo 8).
Comecemos por observar que sendo A é uma matriz diagonalizável de ordem n,
isto é, A = P DP −1 com D = diag (λ1 , . . . , λn ), qualquer potência positiva de A
também é uma matriz diagonalizável, visto que
Ak = (P DP −1 )(P DP −1 ) · · · (P DP −1 ) = P Dk P −1 , (4.12)
| {z }
k factores
onde Dk = diag (λk1 , . . . , λkn ). A igualdade P −1 Ak P = Dk implica que os valores

próprios de Ak são λk1 , . . . , λkn (a matriz Ak é semelhante à matriz Dk ). Além disso,
as colunas de P , que são vectores próprios de A, também são vectores próprios de Ak .
Como se prova facilmente (ver demonstração da próxima proposição), esta relação
entre os valores e vectores próprios de potências de uma matriz e os valores e vectores
próprios da matriz dada é válida em geral.
Proposição 4.9. Seja p(λ) = (−1)n λn + bn−1 λn−1 + · · · + b1 λ + b0 o polinómio

caracterı́stico da matriz A e u um vector próprio de A. Então

p(A)u = (−1)n An + bn−1 An−1 + · · · + b1 A + b0 u = 0.
Demonstração. Comecemos por mostrar que se (µ, u) é um par próprio de A, então

(µk , u) é um par próprio de Ak , para qualquer inteiro positivo k. De facto, se Au =
µu, resulta
Ak u = Ak−1 (Au) = Ak−1 (µu) = µAk−1 u = µAk−2 (Au) = µ2 Ak−2 u

= · · · = µk u.
Por definição de valor e vector próprio, a igualdade Ak u = µk u significa que µk é um

valor próprio de A e u é um vector próprio associado.
Para mostrar que p(A)u = 0 basta mostrar que p(A)u = p(µ)u, onde (µ, u) é um
par próprio de A. Aplicando o facto de (µk , u) ser um par próprio de Ak no cálculo de
p(A)u, tem-se
p(A)u = (−1)n An u + bn−1 An−1 u + · · · + b1 Au + b0 u

= (−1)n µn u + bn−1 µn−1 u + · · · + b1 µu + b0 u
= ((−1)n µn + bn−1 µn−1 + · · · + b1 µ + b0 )u = p(µ)u = 0 × u = 0,
onde a penúltima igualdade resulta do facto de µ ser valor próprio de A, e portanto raiz
de p.

Corolário 4.5. Seja p(λ) = (−1)n λn + bn−1 λn−1 + · · · + b1 λ + b0 = 0 a equação

caracterı́stica da matriz A. Se A tem n vectores próprios linearmente independentes,
a matriz A satisfaz a sua equação caracterı́stica. Isto é,
p(A) = (−1)n An + bn−1 An−1 + · · · + b1 A + b0 = O,
onde O designa a matriz nula.
Demonstração. Sejam u1 , . . . , un vectores próprios linearmente independentes de A e

X a matriz cujas colunas são estes vectores. Da proposição anterior tem-se p(A)ui = 0
para i = 1, . . . , n. Assim, usando a Definição 1.12 de produto de matrizes, obtemos
   
p(A)X = p(A) u1 u2 . . . un  = p(A)u1 p(A)u2 . . . p(A)un  = O.
Como as colunas de X são linearmente independentes, a matriz X é invertı́vel (Propo-

sição 3.15). Logo, multiplicando (à direita) a equação matricial p(A)X = O por X −1 ,
obtém-se p(A) = O.
O resultado do corolário anterior é igualmente válido no caso da matriz não admitir

n vectores próprios linearmente independentes. Esta generalização constitui o famoso
Teorema de Cayley-Hamilton2 que passamos a enunciar.
Teorema 4.3. Cayley-Hamilton

Toda a matriz quadrada verifica a sua equação caracterı́stica. Ou seja, se
(−1)n λn + bn−1 λn−1 + · · · + b1 λ + b0 é o polinómio caracterı́stico de A, então
(−1)n An + bn−1 An−1 + · · · + b1 A + b0 I = O.
O exercı́cio guiado seguinte apresenta uma demonstração do Teorema de Cayley-Hamil-

ton.
Exercı́cio 4.2. Mostre o Teorema de Cayley-Hamilton.

Comece por justificar por que razão a matriz adjunta adj(A − λI) pode ser escrita
na forma adj(A − λI) = Bn−1 λn−1 + · · · + B1 λ + B0 , onde Bi são matrizes n × n.
Aplique a fórmula (2.14), na página 89, à matriz (A − λI), e conclua que
−Bn−1 = (−1)n I
ABn−k − Bn−k−1 = bn−k I para k = 1, . . . , n − 1
AB0 = b0 I.
Multiplique as igualdades anteriores respectivamente por An , An−k e I, adicione, e

obterá p(A) = O.
N
2 Arthur Cayley (1821 – 1895), matemático inglês. Sir William Rowan Hamilton (1805 – 1865), fı́sico,
astrónomo e matemático irlandês.

Aplicações: Sistemas dinâmicos 173
4.4 Aplicações: Sistemas dinâmicos

Apresentamos nesta secção alguns exemplos ilustrativos da importância dos valores e
vectores próprios de uma matriz no estudo de certos modelos matemáticos. Em pri-
meiro lugar trataremos sistemas dinâmicos discretos e posteriormente equações dife-
renciais (sistemas dinâmicos contı́nuos).
Um sistema dinâmico é um modelo matemático que descreve a evolução no tempo
do estado de um dado sistema. O modelo matemático procura incorporar as carac-
terı́sticas de uma determinada experiência, efectuada repetidas vezes. Nos modelos
mais simples, o resultado de cada experiência depende apenas do resultado da ex-
periência anterior. Consideremos o exemplo seguinte.
Exemplo 4.11. Uma certa universidade tem na totalidade dos seus cursos de licenci-
atura (com a duração de três anos) um numerus clausus de 850 alunos. Em cada ano
lectivo, 80% dos estudantes dos cursos de licenciatura transitam de ano (ou terminam,
caso estejam no terceiro ano) e 20% ficam retidos no mesmo ano. O número de alunos
que frequentam as licenciaturas dessa universidade no ano lectivo k representa-se pelo
vector de estado xk ∈ R3 cujas componentes xk1 , xk2 e xk3 são, respectivamente, o
número de alunos no primeiro, segundo e terceiro ano das licenciaturas. Suponha-se
que número de alunos de licenciatura no ano lectivo 2010/11, era 1600 no primeiro
ano, 950 no segundo ano e 1100 no terceiro. Representamos o número de alunos de
licenciatura no ano lectivo 2010/11 pelo vector de estado x0 = (1600, 950, 1100). O
número de alunos de licenciatura no ano lectivo seguinte é representado pelo vector x1 .
De acordo com os dados do problema o vector x1 é
   
850 0.2 0 0
x1 =  0  + 0.8 0.2 0  x0 = b + Ax0 .
0 0 0.8 0.2
O número de alunos de licenciatura nos anos lectivos subsequentes é representado

pelos vectores de estado x2 , x3 , x4 , . . .. O vector de estado xk+1 é dado por
xk+1 = b + Axk k = 0, 1, 2, . . . (4.13)
A equação (4.13) é uma fórmula de recorrência que permite obter o vector de estado de
um determinado ano lectivo à custa dos vectores de estado de anos lectivos anteriores.
Ela é um exemplo de um sistema dinâmico discreto (não homogéneo).
Estudamos a seguir sistemas dinâmicos discretos lineares do tipo
xk+1 = Axk , com xk ∈ Rn e k = 0, 1, 2, 3, . . .
onde A é uma matriz de ordem n. Este tipo de sistemas é também designado por
equação às diferenças, de 1a ordem homogénea.
O análogo contı́nuo de uma equação às diferenças é uma equação diferencial. Uma
equação diferencial modela sistemas fı́sicos em que os estados em causa são observa-
dos de forma contı́nua. No final deste capı́tulo estudaremos este tipo de equações.

4.4.1 Sistemas dinâmicos discretos

Consideremos o sistema dinâmico discreto
xk = Axk−1 , k = 0, 1, 2, . . .
onde A é uma matriz real do tipo n × n.
Chamamos órbita do ponto xs ao conjunto de pontos da sucessão {xs }, isto é,
xs , xs+1 , xs+2 , xs+3 , . . .. A órbita do ponto inicial x0 é determinada pelas potências
Ak e por x0 , uma vez que
x1 = Ax0
x2 = Ax1 = A2 x0
..
.
xk = Axk−1 = Ak x0 , k ≥ 1.
Suponhamos que A é diagonalizável e que existe uma base B = (u1 , u2 , . . . , un ) de
Rn formada por vectores próprios de A. Nesta base, o ponto inicial x0 escreve-se como
combinação linear (única) dos vectores de B, seja
x0 = c1 u1 + c2 u2 + · · · + cn un .
Como vimos na demonstração da Proposição 4.9, se (λi , ui ) é um par próprio de A,
então (λki , ui ) é um par próprio de Ak . Por conseguinte, o estado do sistema no instante
k é dado por
xk = Ak x0 = Ak (c1 u1 + c2 u2 + · · · + cn un )
= c1 Ak u1 + c2 Ak u2 + · · · + cn Ak un (4.14)
= c1 λk1 u1 + c2 λk2 u2 + · · · + cn λkn un ,

onde (λi , ui ) é um par próprio de A, para i = 1, . . . , n.
A expressão (4.14) permite determinar o comportamento a longo prazo do sistema.
Este comportamento é dado pelo vector x∞ definido por

x∞ = lim xk = lim c1 λk1 u1 + c2 λk2 u2 + · · · + cn λkn un . (4.15)
k→∞ k→∞
Apresentamos a seguir alguns exemplos de sistemas dinâmicos discretos.
Números de Fibonacci e o Número de Ouro

É no mı́nimo surpreendente como, quer na Natureza quer em certas criações artı́sticas
em arquitectura e pintura, se podem encontrar os chamados números de Fibonacci.
Um exemplo é a flor do girassol que tem 233 sementes em 144 espirais, números
que correspondem aos 12o e 13o termos da sucessão de Fibonacci. Aconselhamos
uma visita ao site3 ou ao site de Ron Knott4 onde pode encontrar vários exemplos de
3 http://goldennumber.net/
4 http://www.mcs.surrey.ac.uk/Personal/R.Knott/Fibonacci/fibnat.html

como as sucessões de Fibonacci aparecem na Arte e na Natureza, bem como outras

curiosidades relacionadas com o “número de ouro”.
A sucessão de números de Fibonacci foi usada pelo seu criador, Leonardo de Pisa5
(mais tarde conhecido por Fibonacci), como um modelo matemático simples para des-
crever o crescimento de uma população de coelhos, nas seguintes condições:
1) Admite-se que os coelhos não morrem.
2) Supõe-se que um casal de coelhos demora dois meses a atingir a maturidade,
altura em que se reproduz dando origem a um novo casal de coelhos.
Denotemos por Fk o número de casais de coelhos no mês k. A evolução da população
de coelhos pode modelar-se da seguinte forma:
• O processo inicia-se no mês k = 1 com um casal de coelhos, isto é, F1 = 1.
• No mês seguinte o número de casais é ainda igual a 1, ou seja, F2 = 1, visto que
o casal original está ainda imaturo.
• Decorridos dois meses, tem-se F3 = 2, correspondente ao casal original e a um
casal recém-nascido.
A sucessão {Fk } obtida pelo processo anterior é designada por sucessão de Fibonacci.
O termo de ordem k da sucessão de Fibonacci, verifica
Fk+2 = Fk+1 + Fk com F1 = 1 e F2 = 1.
Os primeiros termos desta sucessão são
1, 1, 2, 3, 5, 8, 13, . . .
A sucessão de Fibonacci pode ser escrita na forma matricial da maneira que indi-
caremos a seguir. Usaremos os valores próprios e os vectores próprios da matriz que
define a sucessão para obter uma expressão explı́cita (não recursiva) de Fk e provar que
o crescimento da sucessão de Fibonacci
é do tipo exponencial.
Fk+1
Escrevendo xk−1 = , a equação Fk+2 = Fk+1 + Fk é equivalente a
Fk

Fk+2 1 1 Fk+1 1 1
= ⇐⇒ xk = x = Axk−1 , para k = 1, 2, . . .
Fk+1 1 0 Fk 1 0 k−1
(4.16)
1 F2
e x0 = = .
1 F1
Atendendo à expressão obtida em (4.14), se a matriz A for diagonalizável (e com
valores próprios reais), tem-se

Fk+1
xk−1 = = c1 λ1k−1 u1 + c2 λ2k−1 u2 , (4.17)
Fk
5 Leonardo de Pisa (1170 — 1250), matemático italiano considerado um dos mais talentosos matemático
da Idade Média.

onde (λ1 , u1 ) e (λ2 , u2 ) são pares próprios A, e (c1 , c2 ) é o vector das coordenadas de
x0 na base ordenada (u1 , u2 ).
Comecemos por calcular os valores próprios de A.

1 − λ 1
det(A − λI) = = λ2 − λ − 1.
1 −λ
As raı́zes de p(λ) = λ2 − λ − 1 são

√ √
1+ 5 1− 5
λ1 = ≈ 1.618 . . . e λ2 = ≈ −0.618 . . . .
2 2
O valor próprio λ1 é conhecido por número de ouro sendo habitualmente designado
pela letra φ.
A matriz A tem valores próprios reais e distintos, logo é diagonalizável (cf. Co-
rolário 4.3). Determinemos uma base de R2 constituı́da por vectores próprios de A.
Para i = 1, 2 temos

1 − λi 1 0 (1 − λi )a + b = 0
u = ⇐⇒ ⇐⇒ a = λi b.
1 −λi i 0 a − λi b = 0

λ1 λ2
Logo, podemos tomar u1 = e u2 = como vectores próprios associados,
1 1
respectivamente, a λ1 e λ2 . As coordenadas de x0 na base na base ordenada (u1 , u2 )
são:

1 λ1 λ2 c λ + c2 λ2 = 1
x0 = = c1 + c2 ⇐⇒ 1 1
1 1 1 c1 + c2 = 1
λ1 − 1 1 1
⇐⇒ c1 = 1 − c2 , c2 = ⇐⇒ c1 = √ φ, c2 = − √ λ2 .
λ1 − λ2 5 5
Assim, a expressão (4.17) toma a forma
 
√ !k √ √ !k √
Fk+1 1  1+ 5 1+ 5 1− 5 1− 5
xk−1 = = √ 2 − 2 .
Fk 5 2 1 2 1
Logo, os termos da sucessão de Fibonacci são dados por

 
√ !k √ !k
1  1+ 5 1− 5 
Fk = √ − , k = 1, 2, . . .. (4.18)
5 2 2
A fórmula (4.18) é conhecida como a fórmula de Binet para os números de Fibonacci.

√ k
Note que nesta fórmula temos que 1−2 5 → 0 quando k → ∞, já que 0 < λ2 < 1.
Por conseguinte, para k suficientemente grande, o valor de Fk pode aproximar- se por
√1 φk , onde λ1 = φ > 1 é o maior valor próprio de A.
5

Matrizes de Markov
As chamadas cadeias de Markov6 aparecem naturalmente na modelação matemática
de problemas de biologia, quı́mica, economia, etc.. Trata-se de sistemas dinâmicos
discretos, xk+1 = M xk , em que a matriz M é uma matriz cujos vectores coluna são
vectores de probabilidades, isto é, vectores de componentes não negativas e tais que
soma das suas componentes é igual a 1.
Por exemplo, suponha-se que o administrador de uma firma de aluguer de viaturas
pretende gerir a sua frota que se encontra distribuı́da por três agências localizadas em
cidades distintas. Admita-se que um cliente pode alugar uma viatura numa agência e
entregá-la noutra. É claro que o administrador da firma não pode saber de antemão qual
o número exacto de viaturas que será entregue numa dada agência, mas pode calcular
qual é a probabilidade das viaturas serem entregues numa dada agência. Designe-
se por xk = (xk1 , xk2 , xk3 ) o vector de estado do mês k, isto é, o vector em que
a componente xki representa a probabilidade de um carro da frota se encontrar na
agência i (i = 1, 2, 3) no mês k. Calculando as probabilidades, mensais, dos carros da
firma serem entregues na agência i quando no mês anterior se encontravam na agência
j, o administrador da firma concluiu que xk+1 = M xk , onde
 
1/2 0 1/10
M = 1/10 7/10 1/10 .
2/5 3/10 4/5
Este é um problema tı́pico que é modelado matematicamente por uma cadeia de

Markov com três estados (as agências). A entrada pij da matriz M = [pij ] designa
a probabilidade do sistema se encontrar no estado i quando na observação anterior se
encontrava no estado j. A matriz M é designada por matriz de transição da cadeia de
Markov. Como cada vector coluna de M é um vector de probabilidade, a matriz M
goza da propriedade de ter todas as entradas não negativas e da soma das entradas de
cada coluna ser constante e igual a 1. Estas matrizes são designadas por matrizes de
Markov ou matrizes estocásticas.
Seja M uma matriz de Markov. Uma cadeia de Markov associada a M é uma
sucessão de vectores de probabilidade, x0 , x1 , x2 . . . satisfazendo
xk+1 = M xk , k = 0, 1, 2, . . . (4.19)
Como se disse, as matrizes de Markov caracterizam-se por terem entradas não negativas
(dizendo-se matrizes não negativas) e a soma das entradas de cada coluna ser igual a 1.
Vemos a seguir que estas duas propriedades têm fortes implicações no tipo de valores
próprios destas matrizes e no comportamento a longo prazo das cadeias de Markov.
Se A é uma matriz tal que a soma das entradas de cada linha é constante igual a s,
então o vector u = (1, 1, . . . , 1) satisfaz a igualdade
Au = su.
6 Andrey Markov (1856-1922), matemático russo.

A igualdade anterior significa que s é um valor próprio de A e u é um vector próprio

associado. Como o determinante de uma matriz é igual ao determinante da sua trans-
posta, tem-se det(A − λI) = det(A − λI)T = det(AT − λI). Ou seja, as matrizes A
e AT têm os mesmos valores próprios. Por conseguinte, se uma matriz tem a soma das
entradas de cada coluna constante, esta constante é um valor próprio da matriz.
Proposição 4.10. Se uma matriz A tem a soma das entradas de cada coluna (ou de
cada linha) constante, então esta constante é um valor próprio de A.
Em particular, uma matriz de Markov tem λ = 1 como valor próprio.
Nota 24. Apesar de uma matriz e a sua transposta terem os mesmos valores próprios
isso não significa que pares próprios de A sejam também pares próprios de AT . Ou
seja, se v é um vector próprio de A associado ao valor próprio λ, não significa que v
seja um vector próprio de AT associado ao valor próprio λ. Deixamos como exercı́cio
encontrar um contra-exemplo.
Dada uma cadeia de Markov definida pela matriz M , um vector de equilı́brio, ou
vector estacionário, é um vector de probabilidades q que satisfaz
M q = q. (4.20)
Ou seja, um vector de equilı́brio é um vector próprio de M associado ao valor próprio

1 que é também um vector de probabilidades. Saliente-se que, se xk é um vector
de equilı́brio, então xj = xk para j ≥ k, o que justifica a designação de vector de
equilı́brio.
Para uma matriz de Markov, a existência de vectores próprios associados ao valor
próprio λ = 1 que sejam vectores de probabilidades decorre da teoria geral das matri-
zes não negativas. A teoria das matrizes não negativas (conhecida pela designação de
Teoria de Perron-Frobenius7) está fora do âmbito deste texto. Utilizamos no entanto
alguns resultados fundamentais desta teoria, convidando o leitor interessado a consul-
tar obras especializadas. Para os resultados que aqui utilizamos sugere-se a leitura de
Meyer [9].
Define-se raio espectral de uma matriz como sendo o máximo dos módulos dos
seus valores próprios. Isto é,
ρ(A) = max {|λi |} ,

i=1,...,n
onde λi é um valor próprio da matriz A (de ordem n). Resume-se no quadro seguinte
alguns resultados da Teoria de Perron-Frobenius.
A Teoria de Perron-Frobenius para matrizes não negativas garante que uma matriz
de Markov admite um vector próprio u, associado ao valor próprio λ = 1, com todas
as componentes positivas. Além disso, o raio espectral de uma matriz de Markov é
exactamente 1.
No caso da matriz de Markov M ser positiva (isto é, com todas as entradas posi-
tivas), a multiplicidade algébrica do valor próprio λ = 1 é igual a um.
7 Oskar Perron (1880 – 1975) e Ferdinand Georg Frobenius (1849 – 1917).

O facto de uma matriz de Markov M possuir um par próprio (1, u) em que o

vector próprio u = (u1 , . . . , un ) tem todas as componentes positivas vai implicar que
qualquer cadeia de Markov admita pelo menos um vector de equilı́brio. Com efeito,
o vector q = Pn1 ui u ainda é um vector próprio de M associado ao valor próprio
i=1
λ = 1, e além disso é um vector de probabilidades. Logo, q é um vector de equilı́brio.
Proposição 4.11. Qualquer cadeia de Markov admite pelo menos um vector de

equilı́brio.
Saliente-se que o valor próprio λ = 1 de matrizes de Markov não negativas pode

ter multiplicidade geométrica superior a um, e portanto haver mais do que um vector
de equilı́brio. No entanto, quando a matriz de Markov é positiva, a unicidade do vector
de equilı́brio está garantida, uma vez que o valor próprio λ = 1 é um valor próprio
simples. Além disso, se a matriz de Markov M é positiva a expressão (4.15) converge
para o (único) equilı́brio. De facto, como o raio espectral de M é igual a um, tem-se
1 = λ1 > |λ2 | > · · · > |λn | e a expressão (4.15) reduz-se a

x∞ = lim c1 λk1 u1 + c2 λk2 u2 + · · · + cn λkn un = c1 u1 ,
k→∞
Como x∞ é um vector de probabilidades (de facto é o equilı́brio), a constante c1 é igual

ao inverso da soma das componentes de um vector próprio (positivo) u1 associado a
λ1 = 1.
Exemplo 4.12. Suponha-se que anualmente 1.5% da população que vive na área me-
tropolitana de Lisboa (AML) muda-se para outras regiões do paı́s, e 9% da população
portuguesa muda-se para AML. Sabendo que no ano de 1970, 18% da população de
Portugal vivia na AML, pertende-se determinar qual a distribuição da população por-
tuguesa a longo prazo.
Tomando para vector de estado inicial x0 = (0.18, 0.82) o qual representa que em
1970 vivia na AML 18% da população de Portugal (e portanto 82% fora desta região),
a evolução no tempo da percentagem da população portuguesa vivendo na AML é
descrita pelo sistema xk = M xk−1 , k = 1, 2, . . . onde M é a matriz de Markov

0.985 0.09
M= .
0.015 0.91
A matriz M corresponde aos movimentos transcritos na tabela seguinte (onde FAML

designa não residentes na AML).
De
AML FAML
AML 0.985 0.09
Para
FAML 0.015 0.91
A matriz M é positiva e tem 1 como valor próprio visto que a soma das entradas
de cada coluna é igual a 1 (cf. Proposição 4.10). Como a soma dos valores próprios

é igual ao traço da matriz (Proposição 4.3), o outro valor próprio é λ2 = 0.895. Uma
vez que M é uma matriz positiva já sabı́amos que λ1 = 1 seria o maior valor próprio e
que a sua multiplicidade algébrica seria igual a um. São vectores próprios associados,
respectivamente a λ1 e a λ2 , os vectores u1 = (0.09, 0.015) e u2 = (−1, 1), como
pode confirmar calculando M u1 e M u2 .
Usando a equação (4.14), no ano k, a percentagem da população portuguesa na
AML e fora desta área é dada por

0.09 −1
xk = c1 + c2 (0.895)k , (4.21)
0.015 1
onde c1 e c2 são as coordenadas do vector inicial x0 = (0.18, 0.82) na base ordenada

(u1 , u2 ). A longo prazo, a distribuição da população portuguesa tende para

0.09
x∞ = c1 ,
0.015
uma vez que (0.895)k → 0 quando k → ∞. Este vector é de facto, o vector de

1
equilı́brio. Uma vez que x∞ é um vector de probabilidades tem-se c1 = 0.09+0.015 =
0.105. Pode confirmar-se este resultado calculando as coordenadas c1 e c2 de x0 na
base (u1 , u2 ).
1
Assim, a longo prazo temos x∞ = u1 ≈ (0.86, 0.14), ou seja, a longo prazo
0.105
86% da população portuguesa viverá na área metropolitana de Lisboa.
Exemplo 4.13. Este exemplo baseia-se no artigo de Kurt Bryan e Tanya Leise intitu-
lado: ”The $250000000008 eigenvector. The linear Algebra behind Google”, publicado
em 2006 pela SIAM Review [4].
Nos finais dos anos 90 a empresa fundadora do motor de busca Google9 apresentou
um processo de pesquisa na net de palavras chave que listava os resultados segundo a
sua relevância. Tal não acontecia com os motores de busca existentes à época, nos quais
o utilizador era obrigado a percorrer várias páginas de listagem de sites irrelevantes até
encontrar a informação desejada.
Um dos algoritmos usados pelo Google para seriar os sites por ordem decrescente
de importância é o denominado algoritmo PageRank.10
Apresentamos aqui um exemplo muito simples que ilustra a importância da álgebra
linear na quantificação da relevância dos sites da net. A relevância de uma dada página
é quantificada atribuindo-lhe uma classificação (um número real não negativo). Esta
classificação depende do número de links (ligações ou citações) que essa página faz
para outras páginas, bem como do número de citações que as outras páginas lhe fazem.
Suponha que o número de páginas (interligadas) numa rede é n > 1 e que cada
página é designada por um inteiro k. Cada link vai representar-se por uma seta. Uma
8O valor estimado da empresa Google quando em 2004 se tornou uma empresa pública.
9 Google é um trocadilho da palavra anglo-saxónica ”googol” a qual significa 10100 . O termo reflecte o
número enorme e sempre crescente de utilizadores da net.
10 PageRank foi desenvolvido na Universidade de Stanford (USA) por Larry Page e posteriormente por
Sergey Brin como parte de um projecto de investigação. Page e Brin fundaram a companhia Google em
1998.

seta com origem em A e ponto final B, indica um link da página A para a página B.
Um exemplo é a rede com cinco páginas representada pelo grafo direccionado11 da
Figura 4.7.
/
1 o> 2
^>>>> @ O ^>>>>>
>>>> >>>>
>>>> >>>>
> >
/
3 4 o 5
Figura 4.7: Uma rede com cinco páginas. Uma seta de A para B indica um link da
página A para a B.
Designemos por xk o valor da relevância (ou importância) da página k da rede. O

valor de xk é não negativo e xj > xk significa que a página j tem mais importância
que a página k. Uma forma simples de atribuir a importância a uma dada página k seria
considerar xk igual ao número de setas que entram na página k, ou seja, o número de
citações que as outras páginas da rede fazem à página k. Por exemplo, para a rede da
Figura 4.7 terı́amos x1 = 2, x2 = 4, x3 = 1, x4 = 3 e x5 = 1, significando que a
página mais relevante seria a página 2 e as menos importantes a 3 e a 5.
A caracterização anterior é insuficiente visto que uma citação proveniente de uma
página pouco importante não deve ter o mesmo valor que uma citação proveniente
de outra mais importante, e as autocitações não devem ser consideradas. Uma outra
forma de atribuir o valor da importância da página k seria considerar xk igual à soma
do valores das importâncias das páginas que a citam. Isso daria, x1 = x2 + x4 , x2 =
x1 + x3 + x4 + x5 , x3 = x1 , x4 = x1 + x3 + x5 e x5 = x2 . Há contudo uma outra
caracterı́stica a levar em conta neste modelo, nomeadamente o facto de uma página não
dever ganhar uma relevância superior só pelo simples facto de fazer muitas citações a
outras páginas. Neste sentido, o valor da importância de uma dada página deve ser
dividido pelo número de citações que faz a outras páginas da rede, ou seja, se a página
j faz um total de s links para as outras páginas da rede deve considerar-se que a sua
relevância é xj /s (note que s é o número de setas que saem do vértice j do grafo). Ou
seja, uma página que faz s citações confere a cada página citada o valor 1/s da sua
importância.
Desta forma, para a rede apresentada na Figura 4.7 terı́amos a seguinte modificação
nas relações obtidas anteriormente:
1
x1 = 2 x2 + 12 x4
1
x2 = 3 x1 + 12 x3 + 21 x4 + 21 x5
1
x3 = 3 x1 (4.22)
1
x4 = 3 x1 + 12 x3 + 21 x5
1
x5 = 2 x2
11 Um grafo consiste num conjunto de vértices e arestas. Cada aresta liga um par de vértices. Um grafo
diz-se direccionado se está atribuı́do um sentido às arestas.

As equações anteriores podem reescrever-se na forma matricial x = M x, onde M é a

matriz de Markov
 
0 12 0 12 0
1 0 1 1 1
 13 2 2 2
M =  31 0 01 0 01  e x = (x1 , x2 , x3 , x4 , x5 ).


3 0 2 0 2
0 12 0 0 0
Para determinar o valor das relevâncias das cinco páginas web representadas no grafo
da Figura 4.7 há que determinar o vector x que verifica as igualdades (4.22), ou seja, um
vector de equilı́brio da cadeia de Markov definida por M . Temos assim de determinar
um vector próprio associado ao valor próprio 1 de M que seja um vector de probabi-
lidades. O vector (15, 18, 5, 12, 9) é um vector próprio associado ao valor próprio 1, e
1
portanto um vector de equilı́brio é 59 (15, 18, 5, 12, 9) ≈ (0.25, 0.31, 0.09, 0.20, 0.15).
Logo, a página mais importante será a página 2, seguida de 1, 4, 5 e 3.
Evidentemente que no caso concreto da seriação realizada pelo Google a matriz M
terá uma grandeza da ordem dos biliões, pelo que no tratamento computacional deste
modelo assumem especial relevância os métodos numéricos para cálculo de valores e
vectores próprios de matrizes de grandes dimensões.
Convém referir que o vector de equilı́brio pode não ser único, uma vez que, como
se observa neste exemplo, a matriz que modela o funcionamento do Google não é
necessariamente positiva. Ou seja, o subespaço próprio associado ao valor próprio
1 pode ter dimensão superior a 1. Este caso, é tratado no artigo [4] anteriormente
referido, sendo aı́ apresentado um algoritmo, baseado numa modificação da matriz
original, que permite que o Google produza sempre uma listagem de sites ordenados
por ordem decrescente de relevância.
Aconselha-se ao leitor interessado em aprofundar os detalhes da implementação do
algoritmo PageRank e de outros motores de busca, a leitura de [7].
4.4.2 Equações diferenciais ordinárias

O análogo contı́nuo de um sistema dinâmico discreto são os sistemas modelados por
equações diferenciais, ou seja, por equações que envolvem uma função e as suas de-
rivadas. Nesta secção abordaremos alguns aspectos da resolução de equações diferen-
ciais ordinárias (EDO12 ) lineares, de primeira ordem. Trataremos equações do tipo
x′ (t) = Ax(t) + b(t), onde A é uma matriz real (constante), x(t) e b(t) são vectores
n × 1 cujas componentes são funções reais de variável real, e x′ (t) designa a derivada
de x(t), isto é, a função com valor em vectores cujas componentes são as derivadas em
ordem a t ∈ R das componentes de x(t). Eis a expressão matricial de x e x′ :
   ′ 
x1 (t) x1 (t)
 ..  ′  .. 
x(t) =  .  , x (t) =  .  .
xn (t) x′n (t)
12 A abreviatura EDO em lı́ngua inglesa é ODE, de “ordinary differential equation”.

Em particular, iremos determinar o conjunto de todas as soluções de um sistema de

equações diferenciais (lineares) da forma x′ (t) = Ax(t), em que A é uma matriz
diagonalizável. O caso em que A não é diagonalizável é tratado no Apêndice ??.
Para além do estudo da solução geral do sistema referido abordaremos outros tópicos
relacionados, nomeadamente a exponencial de matrizes e a redução de uma equação
diferencial de ordem n, homogénea e de coeficientes constantes, a um sistema do tipo
x′ (t) = Ax(t).
Comecemos por precisar a nomenclatura usada na classificação de equações dife-
renciais.
• Equação diferencial: uma equação que envolve uma função, por exemplo, x :
R → Rn , e as suas derivadas.
• Equação diferencial ordinária (EDO): uma equação que envolve uma função de
uma única variável real t, e as suas derivadas.
• Ordem de uma EDO: ordem da derivada de maior ordem que aparece na equação.
Alguns exemplos de equações diferenciais do tipo x′ (t) = Ax(t) + b(t):
(a) x′ − 2x = 5t (onde x(t) = [x(t)], b = [5t] e A = [−2])

′
x′1 (t) = 2x1 (t) − x2 (t) x1 2 −1 x1
(b) ⇐⇒ = ⇐⇒ x′ (t) = Ax(t).
x′2 (t) = 4x1 (t) + 10x2 (t) x′2 4 10 x2
Quando a matriz A é de ordem superior a 1, como no exemplo (b) anterior, a equação

x′ (t) = Ax(t) + b(t) é um sistema de EDOs lineares de 1a ordem. Neste texto usa-
remos indistintamente a designação EDO para uma equação diferencial ou para um
sistema de EDOs.
A equação
x′ (t) = Ax(t) + b(t)
diz-se homogénea se b(t) = 0. Em geral chama-se a
x′ (t) = Ax(t)
a equação homogénea associada à equação x′ (t) = Ax(t) + b(t).

Uma solução da equação diferencial x′ (t) = Ax(t) + b(t) é uma função (indefini-
damente diferenciável) u que verifica a equação, ou seja, tal que u′ (t) = Au(t)+ b(t).
Chama-se solução geral de uma equação diferencial ao conjunto de todas as soluções
da equação.
Estamos interessados em obter o conjunto de todas as soluções da equação dife-

rencial x′ (t) = Ax(t), onde A é uma matriz (constante) do tipo n × n. Para tal
comecemos por abordar o caso mais simples em que n = 1, ou seja, de uma equação
do tipo x′ (t) = kx(t), com k uma constante real.
Exemplo 4.14. Considere-se a equação x′ (t) = 3x(t). A solução geral desta equação
é o conjunto de todas as funções reais de variável real cuja derivada é o triplo da função.

Esse conjunto solução é constituı́do por todas as funções da forma x(t) = ce3t , onde c
designa uma constante real arbitrária. Não existe outro tipo de funções que verifiquem
a equação, como pode confirmar usando o Exercı́cio 4.3 adiante. Assim, a solução
geral da equação dada, é o subespaço

x(t) = ce3t : c ∈ R = Span{e3t } (4.23)
do espaço linear C das funções reais de variável real, contı́nuas com derivada contı́nua.
As operações de adição e multiplicação por escalares para as quais C é um espaço linear
são as operações definidas na página 142.
O conjunto (4.23) é uma famı́lia de funções parametrizadas por c ∈ R. Na Fi-
gura 4.8 encontram-se representados alguns elementos desta famı́lia.
y
2e3t e3t
5
−2 −1 1 t
−5
- e3t
−10
Figura 4.8: A solução geral da equação x′ = 3x é x(t) = ce3t . A vermelho a função

nula, correspondente a c = 0; a verde a solução correspondente a c = x(0) = 1; a azul
a solução correspondente a c = x(0) = −1.
Obtivemos uma infinidade de soluções para a equação x′ = 3x. Porém, se con-

siderarmos o problema de saber quantas soluções da equação tomam um certo valor
num dado ponto, a resposta é: uma única solução. Este tipo de problema é designado
por problema de valor inicial (ou abreviadamente p.v.i.). Por exemplo, o problema de
valor inicial ′
x = 3x
x(0) = 1,
apenas possui a solução x(t) = e3t , já que impondo a condição inicial x(0) = 1 na
solução geral da equação resulta
x(t) = ce3t ⇒ x(0) = 1 ⇒ c = 1.
Exercı́cio 4.3. Mostre que u(t) é uma solução de x′ = kx (com k uma constante real)
se e só se o produto u(t)e−kt é uma constante. N

Sistemas de EDOs lineares, de primeira ordem, homogéneos

Vimos que no caso de uma EDO homogénea do tipo x′ = kx (com x : R → R) o
conjunto solução geral é o espaço linear gerado por ekt . A solução geral de um sistema
de EDOs homogéneo do tipo x′ = Ax é igualmente um subespaço do espaço linear
das funções x : R → Rn , contı́nuas com derivada contı́nua, com as operações usuais
de adição de funções e multiplicação de uma função por um escalar. De facto, é fácil
mostrar que:
• A soma de duas soluções de x′ = Ax ainda é uma solução desta equação.
• O produto de uma solução de x′ = Ax por um escalar ainda é uma solução desta
equação.
Refira-se que a solução (constante) nula x(t) = (0, 0, . . . , 0) é sempre solução do
sistema x′ = Ax, como não podia deixar de ser uma vez que a solução geral é um
subespaço.
Como veremos, a solução geral de x′ = Ax, em que A é uma matriz de ordem
n, é um (sub)espaço linear de dimensão n. Assim, a determinação da solução geral
passa pela obtenção de uma base deste espaço. Uma base para a solução geral recebe
a designação de conjunto fundamental de soluções, atendendo a que qualquer solução
de x′ = Ax se obtém como combinação linear dos elementos do referido conjunto.
Para obter uma base para a solução geral, temos de saber determinar soluções line-
armente independentes da equação x′ = Ax. A Proposição 4.12 adiante, consequência
imediata do Teorema de existência e unicidade de soluções de problemas de valor ini-
cial, fornece-nos um teste para a independência linear de soluções da equação x′ = Ax.
Enunciamos em seguida uma versão do teorema referido cuja prova pode ser encon-
trada em qualquer livro dedicado ao estudo de equações diferenciais como, por exem-
plo, Braun [3].
Teorema 4.4. Existência e unicidade de soluções

Seja A uma matriz real de ordem n, x : R → Rn uma função contı́nua e x′ a sua
derivada.
Existe uma e uma só solução do problema de valor inicial
x′ = Ax e x(t0 ) = (x01 , x02 , . . . , x0n ).
Além disso, esta solução existe para todo t ∈ R.
Deixamos como exercı́cio a demonstração da unicidade de soluções de um pro-

blema de valor inicial.
O teorema anterior permite-nos provar que o conjunto solução geral da equação
x′ = Ax é um subespaço de dimensão n, onde n é a ordem da matriz A. No exercı́cio
a seguir sugere-se uma demonstração.
Exercı́cio 4.4. Mostre que o conjunto solução geral da equação x′ = Ax é um subespaço
de dimensão n, onde n é a ordem da matriz A.
Sugestão: Considere o conjunto B = {φ1 (t), . . . , φn (t)}, onde φj (t) é a solução
do problema de valor inicial x′ = Ax e x(0) = ej , com ej o vector da base canónica

de Rn , ej = (0, 0, . . . , 1, . . . , 0). Mostre que B é linearmente independente e que

qualquer solução da equação x′ = Ax é uma combinação linear dos elementos de B.
N
A proposição que enunciamos a seguir fornece um teste de grande utilidade prática

na verificação da independência linear de soluções de x′ = Ax. Nomeadamente,
essa proposição garante que as soluções u1 (t), . . . , uk (t) de x′ = Ax são linearmente
independentes se e só se os vectores de Rn , u1 (t0 ), . . . , uk (t0 ) são linearmente inde-
pendentes, onde t0 é um valor de t que podemos escolher da forma mais conveniente.
Proposição 4.12. Seja B = {u1 (t), . . . , uk (t)} um conjunto de soluções de x′ =

Ax e t0 um valor fixo de t. O conjunto B é linearmente independente se e só se
{u1 (t0 ), . . . , uk (t0 )} é linearmente independente.
Demonstração. Suponha-se que B é linearmente dependente. Ou seja, existem cons-

tantes c1 , . . . , ck não todas nulas, tais que c1 u1 (t) + · · · + ck uk (t) = 0. Calculando
esta igualdade em t = t0 , tem-se
c1 u1 (t0 ) + · · · + ck uk (t0 ) = 0,
com pelo menos um dos ci ’s é não nulo. Logo, {u1 (t0 ), . . . , uk (t0 )} é linearmente
dependente.
Para a implicação recı́proca, suponha-se que existem constantes c1 , . . . , ck , não
todas nulas, tais que c1 u1 (t0 ) + · · · + ck uk (t0 ) = 0. Construa-se a função
φ(t) = c1 u1 (t) + · · · + ck uk (t).
A função φ é uma solução da equação diferencial x′ = Ax já que, φ é uma combinação

linear de soluções. Além disso, φ(t0 ) = 0. Pelo Teorema de existência e unicidade de
soluções de um problema de valor inicial (Teorema 4.4), o problema de valor inicial
x′ = Ax com x(t0 ) = 0 só admite a solução nula. Logo, φ(t) = 0 para todo o t, e
portanto c1 u1 (t) + · · · + ck uk (t) = 0 com pelo menos um dos ci ’s não nulo. Ou seja,
B é linearmente dependente.
Pretendemos agora determinar a solução geral de x′ = Ax em que x : R → Rn

é uma função contı́nua e A uma matriz real n × n. Para tal, comecemos por abordar
o caso em que A é a matriz diagonal A = diag(λ1 , λ2 , . . . , λn ). O sistema x′ = Ax
reduz-se a n equações do tipo já estudado. Nomeadamente,
 ′
x = λ1 x1
 1′


 x2 = λ2 x2
x′ = Ax ⇐⇒ ..


 .
 ′
xn = λn xn .
Como vimos anteriormente, no Exercı́cio 4.3, a solução geral de cada equação x′i =
λi xi é dada por xi (t) = ci eλi t onde ci é uma constante real arbitrária. Logo, a solução

geral deste sistema é

   
x1 (t) c1 eλ1 t
 x2 (t)   c2 eλ2 t 
x(t) =  .  =  .  = c1 eλ1 t e1 + c2 eλ2 t e2 + · · · + cn eλn t en
   
 ..   .. 
xn (t) cn eλn t .
 
  c1
 c2 
 
= eλ1 t e1 eλ2 t e2 ··· eλn t en   .  = X(t)c,
 .. 
cn
n
onde e1 , e2 , . . . , en são os vectores da base canónica de
R . Assim, um conjunto
λ1 t λ2 t λn t
gerador da solução geral é e e1 , e e2 , . . . , e en . Este conjunto é uma base
em t0 = 0 se obtém
para a solução geral já que, avaliando os elementos deste conjunto
a base canónica de Rn , e portanto a Proposição 4.12 garante que eλ1 t e1 , . . . , eλn t en
é linearmente independente.
Podemos tirar as conclusões que se seguem relativas à solução geral do sistema de
EDOs x′ = Ax em que A é uma matriz diagonal do tipo n × n.
• Existem n soluções linearmente independentes da forma eλi t ei para x′ = Ax.
• A solução geral do sistema é da forma x(t) = X(t)c, onde X é uma matriz

que tem para colunas os n vectores eλi t ei , e c é um vector coluna constante
arbitrário. Como se verifica facilmente, os pares (λi , ei ) são pares próprios de
A.
• A matriz X(t) é invertı́vel, visto que as suas colunas são linearmente indepen-
dentes. Consequentemente det X(t) 6= 0 para todo o t.
• A derivada da matriz X(t) satisfaz a equação x′ = Ax, onde a derivada de uma

matriz é a matriz se que obtém derivando entrada a entrada. É fácil verificar que
de facto X ′ (t) = AX(t).
As conclusões anteriores, válidas para uma matriz diagonal, permanecem válidas para
qualquer matriz quadrada, como veremos a seguir.
Definição 4.9. Seja A uma matriz do tipo n × n. Chama-se matriz solução funda-
mental do sistema x′ = Ax a qualquer matriz X(t) cujas colunas sejam n soluções
linearmente independentes de x′ = Ax.
Visto que a solução geral de um sistema homogéneo de n equações diferenciais lineares

de 1a ordem é um espaço linear de dimensão n, as colunas de uma matriz solução
fundamental X formam uma base para este espaço. Assim, a solução geral de x′ = Ax
é o conjunto das combinações lineares das colunas de X.

A solução geral de x′ = Ax é dada por
x(t) = X(t)c,
onde X(t) é uma matriz solução fundamental do sistema e c é um vector coluna

constante arbitrário.
Note-se que, por definição de produto de uma matriz por um vector, a expressão X(t)c
designa precisamente uma combinação linear (arbitrária) das colunas de X.
Exercı́cio 4.5. Mostre que X(t) é uma matriz solução fundamental do sistema x′ =
Ax se e só se X ′ (t) = AX(t) e det(X(0)) 6= 0.
Relembre que a notação X ′ (t) designa a matriz cujas entradas são as derivadas das
entradas de X(t). N
Como determinar n soluções linearmente independentes para x′ = Ax? A propo-
sição seguinte responde (parcialmente) a esta questão.
Proposição 4.13. Seja A uma matriz real n × n, e u um vector constante não nulo.
(1) A função eλt u é solução de x′ = Ax se e só se λ é valor próprio de A com
vector próprio associado u.
(2) Se x(t) = x1 (t) + ix2 (t) é uma solução (complexa) de x′ = Ax, então
Re x(t) = x1 (t) e Im x(t) = x2 (t) são duas soluções reais de x′ = Ax.
(3) Se λ = a + ib, com b 6= 0, é um valor próprio (complexo) de A e u um
vector próprio associado, então Re(eλt u) e Im(eλt u) são duas soluções reais
linearmente independentes de x′ = Ax. Ou seja,
eat (cos(bt) Re u − sen(bt) Im u) e eat (sen(bt) Re u + cos(bt) Im u) ,
são duas soluções reais linearmente independentes de x′ = Ax.
Demonstração. (1) Como (eλt u)′ = λeλt u, tem-se que z′ = Az para z(t) = eλt u
se e só se
λeλt u = A(eλt u) ⇐⇒ λu = Au,
onde na equivalência anterior se aplicou o facto de eλt nunca se anular.
Ou seja, eλt u é solução de x′ = Ax se e só se u é um vector próprio de A
associado ao valor próprio λ.
(2) Dizer que x(t) = x1 (t) + ix2 (t) é uma solução complexa de x′ = Ax é equiva-
lente a
x′ (t) = Ax ⇐⇒ x′1 (t) + ix′2 (t) = A (x1 (t) + ix2 (t))

⇐⇒ x′1 (t) + ix′2 (t) = Ax1 (t) + iAx2 (t)
⇐⇒ x′1 (t) = Ax1 (t) e x′2 (t) = Ax2 (t).
Ou seja, Re x(t) = x1 (t) e Im x(t) = x2 (t) são duas soluções reais de x′ = Ax.

(3) Do item (1) tem-se que eλt u é uma solução (complexa) da equação diferencial,
e pelo item (2) resulta que Re(eλt u) e Im(eλt u) são duas soluções reais da
respectiva equação diferencial. A independência linear destas soluções segue do
Lema 4.1 (na página 166) e da Proposição 4.12 considerando t0 = 0.
Calculemos a parte real e imaginária de eλt u. Para tal, relembremos que eibt =
cos(bt) + i sen(bt) (ver (A.1) no Apêndice A).
e(a+ib)t (Re u + i Im u) = eat eibt (Re u + i Im u)

= eat (cos(bt) + i sen(bt))(Re u + i Im u)
= eat [(cos(bt) Re u − sen(bt) Im u)
+ i (sen(bt) Re u + cos(bt) Im u)] .
Assim, Re(eλt u) e Im(eλt u) são dadas pelas expressões no enunciado.
Podemos agora determinar a solução geral de x′ = Ax para matrizes diagonalizáveis

A. O caso em que A não é diagonalizável é tratado no Capı́tulo 8.
Recorde-se que uma matriz A, de ordem n, é diagonalizável se e só se admite n
vectores próprios linearmente independentes. Neste caso, pela Proposição 4.13, o sis-
tema x′ = Ax tem n soluções reais linearmente independentes da seguinte forma: (i)
eλt u com λ um valor próprio real de A e u um vector próprio associado; (ii) para cada
par de valores próprios complexos conjugados λ e λ, existem duas soluções reais (li-
nearmente independentes) da forma Re(eλt u) e Im(eλt u), onde u é um vector próprio
associado a λ. A solução geral de x′ = Ax é uma combinação linear destas n soluções
linearmente independentes.
Apresentamos a seguir um exemplo da determinação da solução geral de um sis-
tema x′ = Ax em que A possui valores próprios reais e complexos.
Exemplo 4.15. Determine-se a solução geral do sistema x′ = Ax, em que A é a matriz

do Exemplo 4.9 (pág. 163). O sistema correspondente é
 ′
 x1 = 2x1 + 5x2
x′ = −x1
 ′2
x3 = 5x3 .
A matriz A possui valores próprios 5 e 1 ± 2i e os espaços próprios são:
E(5) = Span {(0, 0, 1)} , E(1 + 2i) = Span {(1 + 2i, −1, 0)}
E(1 − 2i) = Span {(1 − 2i, −1, 0)} .

Usando a Proposição 4.13, são soluções (reais) linearmente independentes do sis-
tema:
       
0 1 + 2i 1 + 2i
e5t 0 , Re e(1+2i)t  −1  e Im e(1+2i)t  −1  .
1 0 0

Como e(1+2i)t = et e2it = et (cos(2t) + i sen(2t)), resulta

       
1 + 2i 1 2
Re e(1+2i)t  −1  = et cos(2t) −1 − sen(2t) 0
0 0 0
       
1 + 2i 1 2
Im e(1+2i)t  −1  = et sen(2t) −1 + cos(2t) 0 .
0 0 0
Conclui-se que a solução geral do sistema é o conjunto das funções

      
0 1 2
x(t) = c1 e5t 0 + c2 et cos(2t) −1 − sen(2t) 0 +
1 0 0
    
1 2
+ c3 et sen(2t) −1 + cos(2t) 0 ,
0 0
com c1 , c2 e c3 constantes reais arbitrárias.

Note-se que uma matriz solução fundamental para este sistema é
 
0 et (cos(2t) − 2 sen(2t)) et (sen(2t) + 2 cos(2t))
X(t) =  0 −et cos(2t) −et sen(2t) .
e5t 0 0
Exercı́cio 4.6. Para a matriz A do Exemplo 4.8 (pág. 163), mostre que uma matriz
solução fundamental para o sistema x′ = Ax é
 3t 
−e 0 e5t
X(t) =  0 e3t 2e5t  .
e3t 0 e5t
Calcule ainda X(t)X(0)−1 .

N
Da definição de matriz solução fundamental, vê-se facilmente que não existe uma
única matriz solução fundamental. Não é difı́cil mostrar que quaisquer duas matrizes
solução fundamental de um sistema, sejam X(t) e Y (t), satisfazem uma relação do
tipo Y (t) = X(t)K onde K é uma matriz (constante) invertı́vel.
Exercı́cio 4.7. Mostre que se X(t) e Y (t) são duas quaisquer matrizes solução fun-
damental do sistema x′ = Ax, então existe uma matriz real invertı́vel K tal que
Y (t) = X(t)K.
Sugestão: Escrever as colunas de Y como combinação linear das colunas de X e
usar os factos det Y (0) 6= 0 e det X(0) 6= 0 para mostrar que K é invertı́vel. N

A Proposição 4.13 diz-nos como determinar uma base do conjunto das soluções
de x′ = Ax no caso em que A é diagonalizável. Conhecida a solução geral da
equação homogénea x′ = Ax podemos determinar a solução geral da equação não
homogénea x′ = Ax + b(t) desde que se conheça uma solução desta equação. De
facto, à semelhança do que acontece para sistemas de equações lineares (não diferen-
ciais), tem-se:
A solução geral da equação x′ (t) = Ax(t) + b(t) é a soma de uma solução

particular xp da equação com a solução geral xh da equação homogénea associada,
x′ (t) = Ax(t). Ou seja, a solução geral é
{x(t) : x(t) = xp (t) + xh (t)} .
Deixamos como exercı́cio a demonstração deste resultado que se reduz a um mero

decalque da demonstração apresentada para o Teorema 3.7 da página 131.
No exemplo que se segue aplicamos o resultado anterior para determinar a solução
geral de uma equação diferencial não homogénea.
Exemplo 4.16. Considere-se a seguinte EDO não homogénea x′ − 3x = 2t − 3t2 .

A função v(t) = t2 é uma solução desta equação como facilmente se verifica. A
equação homogénea associada, x′ − 3x = 0, tem solução geral x(t) = ce3t , com
c ∈ R. Logo, a solução geral da equação não homogénea é: {ce3t + t2 : c ∈ R}.
Exponencial de matrizes
Como se viu, dada uma equação diferencial, x′ = Ax, existem várias matrizes solução
fundamental dessa equação. A exponencial eAt vai ser definida como sendo uma matriz
solução fundamental particular do sistema x′ = Ax. É possı́vel definir a matriz expo-
nencial eAt como uma série de potências da matriz At, semelhante à série de potências
que define a função exponencial real. No entanto essa via sai do âmbito deste texto, o
leitor interessado poderá consultar, por exemplo, Braun [3].
Relembremos (Exercı́cio 4.5) que uma matriz solução fundamental do sistema x′ =
Ax é uma matriz que verifica a equação diferencial para matrizes X ′ (t) = AX(t).
Definição 4.10. Seja A uma matriz quadrada. A exponencial eAt é a matriz solução
fundamental do sistema x′ = Ax cujo valor em t = 0 é a matriz identidade. Ou seja,
eAt é a solução do problema de valor inicial
′
X = AX
X(0) = I,
onde I designa a matriz identidade e X uma matriz da mesma ordem de A.
Nota 25. O problema de valor inicial na definição anterior é um problema de valor

inicial para matrizes. Este problema pode ser visto como n problemas de valor inicial
para o sistema x′ = Ax (correspondentes a problemas de valor inicial para as colunas
de X).

Tendo em conta a definição anterior e o resultado do Exercı́cio 4.7 (pág. 190),

podemos enunciar a proposição seguinte.
Proposição 4.14. Seja A uma matriz real n × n e X(t) uma qualquer matriz solução
fundamental do sistema x′ = Ax. A exponencial eAt é dada por
eAt = X(t)X(0)−1 .
Demonstração. Se eAt e X(t) são duas matrizes solução fundamental do sistema x′ =

Ax, do Exercı́cio 4.7, segue que
eAt = X(t)K,
onde K é uma matriz (constante) invertı́vel. Como por definição eA0 = I, resulta
eA0 = I = X(0)K ⇐⇒ K = X(0)−1 .
Por conseguinte, eAt = X(t)X(0)−1 .
Nota 26. Uma vez que eAt é solução de um problema de valor inicial, segue da uni-
cidade de soluções deste tipo de problemas que a matriz eAt é única. Além disso,
como eAt é uma matriz solução fundamental de x′ = Ax, é satisfeita a igualdade
d At
(e ) = AeAt (ver Exercı́cio 4.5).
dt
Exercı́cio 4.8. a) Mostre que e(A+B)t = eAt eBt se e só se A e B comutam.
b) Use o resultado anterior para mostrar que a matriz inversa de eAt é e−At .
Sugestão: Para a alı́nea a) mostre os resultados:
• Se AB = BA, então X(t) = BeAt e Y (t) = eAt B são matrizes solução

fundamental do mesmo p.v.i.. Use a unicidade de soluções de problemas de
valor inicial para mostrar que X(t) = Y (t).
• Mostre que eAt eBt e et(A+B) resolve o mesmo problema de valor inicial.
• Finalmente, mostre que se X(t) = Y (t), o que necessariamente implica X ′ (t) =

Y ′ (t), se tem AB = BA.
N

0 −1
Exemplo 4.17. Calculemos eAt para A = .
1 0
No Exemplo 4.4 (pág. 154) calculámos os valores próprios e os espaços próprios
desta matriz. Os valores próprios de A são λ = ±i e E(−i) = Span{(1, i)}. Logo,
pelo item (2) da Proposição 4.13, são soluções (reais) linearmente independentes do
sistema x′ = Ax, os vectores

1 1
Re e−it e Im e−it ,
i i

ou, equivalentemente,

1 0 cos t 1 0 − sen t
cos(−t) −sen(−t) = , sen(−t) +cos(−t) = .
0 1 sen t 0 1 cos t
Nas igualdades anteriores aplicámos cos(−t) = cos t e sen(−t) = − sen t.

Uma matriz solução fundamental para o sistema x′ = Ax é uma matriz cujas
colunas são soluções linearmente independentes do sistema. Neste caso, uma matriz
solução fundamental X(t) é, por exemplo,

cos t − sen t
X(t) = .
sen t cos t
Como X(0) é a matriz identidade, temos eAt = X(t)X(0)−1 = X(t). Verifique ainda
que se tivéssemos considerado para X(t) a matriz que se obtém trocando as colunas
da matriz acima a expressão X(t)X(0)−1 produziria o mesmo resultado (eAt é única).

Exercı́cio 4.9. Considere o sistema de equações diferenciáveis x′ = Ax, onde A é

uma matriz diagonalizável, isto é, A = P DP −1 com D diagonal.
a) Mostre que o sistema dado é equivalente ao sistema y′ = Dy, onde y =

P −1 x.
b) Use a alı́nea anterior, para mostrar a igualdade eAt = P eDt P −1 .
Equações de ordem n e redução de ordem

Para finalizar esta secção vamos verificar que podemos obter a solução geral de equações
diferenciais ordinárias lineares homogéneas, de coeficientes constantes e de ordem su-
perior à primeira, resolvendo um sistema da forma x′ = Ax.
Uma equação diferencial ordinária, linear, homogénea, de coeficientes constantes,
e de ordem n, é uma equação diferencial da forma
y (n) + an−1 y (n−1) + · · · + a1 y ′ + a0 y = 0, (4.24)
onde (os coeficientes) ai ∈ R para i = 1, . . . , n, a função y : R → R é real de variável

real, e y (n) designa a derivada de ordem n de y.
Introduzindo novas variáveis x1 = y, x2 = y ′ , . . . , xn = y (n−1) , a equação (4.24)
é equivalente a um sistema da forma x′ = Ax. Nomeadamente
 ′
x1 = y 
 x1 = x2
x2 = y ′ 
 x′2 = x3
.. =⇒ .. (4.25)
. 

 .
 ′
xn = y (n−1) xn = −a0 x1 − a1 x2 − · · · − an−1 xn .

A matriz A do sistema obtido é conhecida por matriz companheira da equação (4.24)

e tem a forma
 
0 1 0 ······ 0 0
 0 0 1 ······ 0 0 
 
 0 0 0 ······ 0 0 
 
A= . .. .. .. .. ..  .
 .. . . . . . 
 
 0 0 0 ··· 0 1 
−a0 −a1 −a2 ··· −an−2 −an−1 .
Exercı́cio 4.10. Mostre que o polinómio caracterı́stico da matriz companheira da equação

(4.24) é p(λ) = (−1)n [λn + an−1 λ(n−1) + · · · + a1 λ + a0 ].
Sugestão: Calcule det(A − λI)T usando o método de eliminação de Gauss. N
Atendendo ao último exercı́cio, o polinómio caracterı́stico da matriz companheira
de uma equação de ordem n pode ser obtido directamente a partir da equação (4.24).
Após reduzir a equação (4.24) a um sistema de EDOs homogéneo de primeira or-
dem, x′ = Ax, a solução geral da equação (4.24) obtém-se da solução geral do sistema
(4.25) considerando apenas a primeira componente da solução x do sistema, visto que
fizemos y = x1 .
Exemplo 4.18. Determinemos a solução geral da equação diferencial de terceira or-
dem, y ′′′ − 6y ′′ + 11y ′ − 6y = 0.
Fazendo y = x1 , y ′ = x2 e y ′′ = x3 , a equação diferencial reduz-se ao sistema
 ′   
x1 0 1 0 x1
x′2  = 0 0 1 x2  .
′
x3 6 −11 6 x3
Pelo Exercı́cio 4.10, a equação caracterı́stica da matriz companheira é λ3 −6λ2 +11λ−

6 = 0. É fácil verificar que esta equação tem raı́zes λ = 3, λ = 2 e λ = 1. Como os
valores próprios são distintos, a matriz companheira é diagonalizável.
Uma base de vectores próprios é, por exemplo, {(1, 3, 9), (1, 2, 4), (1, 1, 1)}. Esta
base é constituı́da por vectores próprios associados respectivamente a 3, 2 e 1. A
solução geral do sistema é assim
       
x1 (t) 1 1 1
x2 (t) = c1 e3t 3 + c2 e2t 2 + c3 et 1 .
x3 (t) 9 4 1
Uma vez que fizemos y = x1 , a solução geral da equação diferencial de terceira ordem
é
y(t) = x1 (t) = c1 e3t + c2 e2t + c3 et ,
onde c1 , c2 e c3 são constantes arbitrárias.

AL Cap4

Enviado por

Direitos autorais:

Formatos disponíveis

AL Cap4

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

AL Cap4

Enviado por

Direitos autorais:

Formatos disponíveis

Capı́tulo 4

Valores e vectores próprios

Valores e vectores próprios desempenham um papel central em diversas áreas da ma-

4.1 Valores e vectores próprios de matrizes

Definição 4.1. Um escalar λ diz-se um valor próprio de uma matriz quadrada A se

A equação (4.3) e a solução geral do sistema (A − λI)x = 0, recebem designações

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

Note-se que o espaço próprio E(λ) é a solução geral do sistema (A − λI)x = 0,

É importante observar que resulta imediatamente da igualdade Ax = λx que, se

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

A equação caracterı́stica de uma matriz A de ordem n é uma equação polinomial

Definição 4.3. Seja λ um escalar, A uma matriz n × n, e I a matriz identidade

A seguir sumarizamos algumas equivalências anteriormente referidas.

Proposição 4.2. Se A é uma matriz quadrada e λ um escalar, são equivalentes as

O Teorema Fundamental da Álgebra1 afirma que um polinómio (numa variável),

p(λ) = det(A − λI) = b0 + b1 λ + · · · + bn−1 λn−1 + (−1)n λn , (4.4)

tem n raı́zes λ1 , . . . , λn , podendo pois ser factorizado como um produto de n factores

p(λ) = det(A − λI) = (λ1 − λ)(λ2 − λ) · · · (λn − λ). (4.5)

Note-se que na factorização (4.5) pode haver factores repetidos.

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

Definição 4.4. Seja λ um valor próprio da matriz A.

Na proposição seguinte apresentamos um resultado de utilidade prática, em parti-

Proposição 4.3. Seja A = [aij ]i,j=1,...,n e λ1 , λ2 , . . . , λn os valores próprios de A.

Antes de passarmos à demonstração desta proposição, notemos que no caso particular

Demonstração. O termo independente do polinómio caracterı́stico de A, p(λ) = det(A−

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

• um valor próprio igual a 3 de multiplicidade algébrica dois.

• um valor próprio simples que é 2.

onde a raiz repetida do polinómio caracterı́stico é considerada de acordo com a sua

É consequência imediata da proposição anterior o resultado que a seguir se enuncia.

Definição 4.6. O conjugado de uma matriz C é a matriz C cujas entradas são os

Refira-se que o conjugado de um número real coincide consigo próprio, e portanto

Proposição 4.4. Se λ ∈ C é um valor próprio de uma matriz real A, então λ também

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

onde aplicámos a igualdade A = A uma vez que, por hipótese, A é real.

4.1.1 Valores próprios e comportamento de f (x) = Ax

f (x) = Ax = λx, para todo x ∈ E(λ).

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

A igualdade anterior diz-nos que, se x ∈ E(λ) então o vector f (x) é um múltiplo

Quando qualquer vector de um subconjunto S do domı́nio de uma função g é

Se A é uma matriz real de ordem n, os subespaços próprios correspondentes a

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

definida por f (x) = Ax. Quando os valores próprios de A são complexos, os

Geometricamente, f actua no vector x rodando-o em torno da origem de um

a composição de f consigo própria k vezes (isto é, a transformação obtida por

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

|λ| < 1 |λ| = 1 |λ| > 1

Figura 4.4: O valor próprio λ de A é complexo e f (x) = Ax = DRx.

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

Como veremos na secção seguinte, o comportamento geral de uma função f :

Figura 4.5: Aplicações sucessivas de f (x) = Ax para a matriz A do Exemplo 4.6.

Editado por: Esmeralda Sousa Dias, versão de 22 de Fevereiro 2011.

4.2 Diagonalização de matrizes

Definição 4.7. Duas matrizes quadradas A e B dizem-se semelhantes se existe uma

Definição 4.8. Uma matriz quadrada A diz-se diagonalizável se é semelhante a uma

Nas igualdades anteriores aplicámos os seguintes factos: o determinante do produto é

Corolário 4.2. Matrizes semelhantes têm o mesmo traço e o mesmo determinante.

Se A é uma matriz diagonalizável, isto é, A = P DP −1 com D diagonal, pela