Notas de Aula

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 75

Métodos

Computacionais
da Fı́sica B

Agenor Hentz & Leonardo Brunnet


Universidade Federal do Rio Grande do Sul - UFRGS
Instituto de Fı́sica
Porto Alegre - RS
2
Lista de Figuras

1.1 Região de estabilidade para o método de Euler explı́cito. . . . 17


1.2 Região de estabilidade para os métodos RK2 e RK4. . . . . . 28

2.1 Mapa logı́stico, com λ = 0,4. . . . . . . . . . . . . . . . . . . 40


2.2 Mapa logı́stico em função do tempo discreto t para valores
iniciais x0 = 0, 1; 0, 5 e 0, 9 e λ = 0,1 e 0,2. . . . . . . . . . . 41
2.3 Mapa logı́stico em função do tempo discreto t para valores
iniciais x0 = 0, 1; 0, 5 e 0, 9 e λ = 0,3 e 0,6. . . . . . . . . . . 42
2.4 Mapa logı́stico em função do tempo discreto t para valores
iniciais x0 = 0, 25 e λ = 0,8 e 0,88. . . . . . . . . . . . . . . . 44
2.5 Mapa logı́stico em função do tempo discreto t para λ = 0, 8.
Também estão ilustradas as curvas y = x e y = f (f (x)). Po-
demos notar a presença de um ponto-fixo de primeira-ordem
instável (que ocorre quando f (x) = x = 0, 6875, na inter-
secção entre as 3 curvas) e dois pontos fixos de segunda or-
dem (que ocorrem em f (f (x)) = x = 0, 513045 e 0, 799455,
que ocorrem na interseção de f (f (x)) e y = x). . . . . . . . . 45
2.6 Valores assimptóticos de x para diferentes valores de λ. O
gráfico apresenta os últimos 400 pontos calculados por λ, de-
pois de calcular 700 pontos. Os valores de λ variam de 0,72
até 1, em uma malha de 400 valores. . . . . . . . . . . . . . . 46
2.7 Mapa do tipo teia para o valor inicial x0 = 0, 5 λ = 0,2. . . . 47
2.8 Mapa de recorrência para o valor inicial x0 = 0, 5 λ = 0,895.
Neste caso  = 10−5 . . . . . . . . . . . . . . . . . . . . . . . . 48

3
4 LISTA DE FIGURAS

2.9 Coeficiente de Lyapunov como função de λ. Coeficiente calcu-


lado para x0 = 0.5, para séries até n=700 desprezandando-se
os primeiros 300 valores de xn . O coeficiente λ foi calculado
para 400 valores diferentes, igualmente espaçados entre λ =
0,72 e λ = 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

3.1 Sequência de números aleatórios entre 1 e 9, mostrando a


região da cauda, a região cı́clica. O perı́odo desta sequência
é L + C = 7. . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.2 Exemplo de caminhos seguidos por 5 diferentes caminhantes
aleatórios, inicialmente na origem e com igual probabilidade
de darem um salto com l = 1 para frente ou para trás. Foram
contabilizados os primeiros 100 passos para cada caminhante 67
Sumário

1 Equações Diferenciais Ordinárias 7


1.0.1 Condições para Existência de Solução . . . . . . . . . 7
1.0.2 Estabilidade da Solução . . . . . . . . . . . . . . . . . 9
1.0.3 Solução Numérica . . . . . . . . . . . . . . . . . . . . 11
1.1 Método de Euler . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.1 Método de Euler Explı́cito . . . . . . . . . . . . . . . . 12
1.1.2 Método de Euler Implı́cito . . . . . . . . . . . . . . . . 12
1.1.3 Análise da Estabilidade do Método de Euler . . . . . . 14
1.2 Método de Euler-Cromer . . . . . . . . . . . . . . . . . . . . . 17
1.3 Método de Verlet . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.1 Algoritmo velocity-Verlet . . . . . . . . . . . . . . . . 20
1.4 Método de Runge-Kutta . . . . . . . . . . . . . . . . . . . . . 20
1.4.1 Método Runge-Kutta de 2a ordem . . . . . . . . . . . 21
1.4.2 Método de Runge-Kutta 4a ordem . . . . . . . . . . . 24
1.4.3 Controle de Erro nos Métodos RK . . . . . . . . . . . 26
1.4.4 Região de Estabilidade do Problema-Modelo . . . . . 27
1.5 Incrementos Adaptativos . . . . . . . . . . . . . . . . . . . . . 28
1.5.1 Método RK45 - Cash-Karp . . . . . . . . . . . . . . . 30
1.6 Métodos Multi-passos . . . . . . . . . . . . . . . . . . . . . . 31
1.6.1 Método de Adams-Bashforth . . . . . . . . . . . . . . 32
1.6.2 Método de Adams-Moulton . . . . . . . . . . . . . . . 33
1.6.3 Previsão-Correção em Métodos Multi-Passos . . . . . 34
1.6.4 Passo Variável em Métodos Muti-Passos . . . . . . . . 34
1.7 Erro Numérico Global . . . . . . . . . . . . . . . . . . . . . . 35
1.8 Atividades Sugeridas . . . . . . . . . . . . . . . . . . . . . . . 36

5
6 SUMÁRIO

2 Mapas 39
2.1 Mapa Logı́stico . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2 Estabilidade para λ < 0, 25 . . . . . . . . . . . . . . . . . . . 41
2.3 Estabilidade para 0, 25 < λ < 0, 75 . . . . . . . . . . . . . . . 41
2.4 λ > 0,75 e o Limite Cı́clico . . . . . . . . . . . . . . . . . . . 43
2.5 λ > 0, 89 e o Limite Caótico . . . . . . . . . . . . . . . . . . . 44
2.6 Mapas de Teia e Mapas de Primeiro Retorno . . . . . . . . . 45
2.7 Coeficiente de Lyapunov . . . . . . . . . . . . . . . . . . . . . 47
2.8 Mapa de Hénon . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.9 Atividades Sugeridas . . . . . . . . . . . . . . . . . . . . . . . 50

3 Números Aleatórios e Método de Monte Carlo 53


3.1 Sequências de Números Aleatórios . . . . . . . . . . . . . . . 53
3.1.1 Caracterı́sticas de Geradores de Números Aleatórios . 54
3.1.2 Geradores Linear de Números Aleatórios Congruentes 55
3.1.3 Método de Schrage . . . . . . . . . . . . . . . . . . . . 56
3.2 Histogramas e a Densidade de Probabilidade . . . . . . . . . 57
3.2.1 Histogramas . . . . . . . . . . . . . . . . . . . . . . . . 57
3.2.2 Densidade de Probabilidade . . . . . . . . . . . . . . . 58
3.2.3 Relação entre histogramas e FDPs . . . . . . . . . . . 59
3.2.4 Números Aleatórios Segundo uma Distribuição . . . . 61
3.3 Resolução de Integrais por Monte Carlo . . . . . . . . . . . . 63
3.3.1 Método 1: Amostragem Uniforme . . . . . . . . . . . 64
3.3.2 Método 2: Amostragem Seletiva . . . . . . . . . . . . 64
3.4 Caminhante Aleatório . . . . . . . . . . . . . . . . . . . . . . 65
3.4.1 Modelo Discreto Unidimensional . . . . . . . . . . . . 66
3.4.2 Modelo Generalizado . . . . . . . . . . . . . . . . . . . 67
3.4.3 Caminhante Aleatório e o Teorema do Limite Central 68
3.4.4 Distribuições Sem Momento Definido . . . . . . . . . . 68

A Desigualdades 73
A.1 Desigualdades com valores absolutos . . . . . . . . . . . . . . 74
CAPÍTULO 1

Equações Diferenciais Ordinárias

Equação diferencial é a equação que apresenta a relação de uma função e


suas derivadas. Equação diferencial ordinária é aquela em que a derivada é
tomada em relação a uma única variável. A equação abaixo é um exemplo
de uma equação diferencial ordinária (ODE):
dx2 dx
+ q(t) = r(x),
dt2 dt
onde t é a variável independente e x(t) é a variável dependente. Resolver uma
ODE numericamente pode ser difı́cil dependendo da natureza das condições
de contorno do problema. No caso mais simples, tais condições de contorno
nada mais são do que condições algébricas para os valores iniciais de x(t0 )
e sua derivada dx dt (t0 ) na equação acima. Este documento trata tão somente
das condições de contorno ditas problemas de valores iniciais, na qual o valor
de x0 ≡ x(t = 0) é conhecido para um dado valor da variável independente
t0 , e deseja-se encontrar o valor de x(tf ) para um ponto final tf .
De maneira geral, podemos reescrever uma equação diferencial ordinária
de primeira ordem de forma a isolar a derivada, i.e:
dx
= f (t; x), (1.1)
dt
onde a função f (t, x) pode ser facilmente computada.

1.0.1 Condições para Existência de Solução


Consideremos o caso de equações diferenciais de primeira ordem, que podem
ser descritas pela seguinte equação:
dx
= f (t, x),
dt

7
8 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

para a função x dependente da variável t. Para que encontremos a solução


da equação acima, precisamos de uma condição extra, chamada de condição
inbgcial:
x(t0 ) = x0 ,
de forma que apenas uma única solução dentre as infinitas possı́veis seja
selecionada. Mesmo que f (t, x) seja contı́nua, não há nenhuma garantia de
que x(t) tenha solução única.
Definição 1.0.1. Diz-se que uma função f (t, x) satisfaz a condição de Lips-
chitz para a variável x em um conjunto D ⊂ R2 se existe uma constante
L > 0 tal que:
|f (t, x1 ) − f (t, x2)| ≤ L |x1 − x2 |, (1.2)
para qualquer conjunto (t, x1 ), (t, x2 ) ∈ D.
A constante L é chamada de constante de Lipschitz para f .
Definição 1.0.2. Um conjunto D é dito convexo se para qualquer (t1 , x1 ) e
(t2 , x2 ) pertencente a D e λ no intervalo [0, 1], o ponto ((1 − λ)t1 + λt2 , (1 −
λ)x1 + λx2 ) também pertence a D.
Dito de outra forma, o conjunto é convexo se a reta que liga dois quais-
quer pontos em D está completamente contida em D.
A partir destas definições iniciais, podemos obter informações sobre a
existência de uma solução para a equação diferencial, e se esta é única. Para
isto, lançamos mão dos dois teoremas seguintes.
Teorema 1.0.1. Suponha que f (t, x) é definida em um conjunto convexo
D ⊂ R2 . Se existe uma constante L > 0 para a qual

∂f
(t, x) ≤ L, para todo (t, x) ∈ D,
∂x

então f satisfaz a condição de Lipschitz em D para a variável x com a


constante de Lipschitz L.
Teorema 1.0.2. Suponha o conjunto D = {(t, x) |a ≤ t ≤ b, −∞ < x < ∞}
e que f (t, x) seja contı́nuo em D. Se f satisfaz a condição de Lipschitz em
D para a variável x então o problema de condição inicial
x0 (t) = f (t, x), a ≤ t ≤ b, x(a) = α,
tem uma solução única x(t) para a ≤ t ≤ b.
Teorema 1.0.3. Suponha D = {(t, x) |a ≤ t ≤ b, −∞ < x < ∞}. Se f
é contı́nua e satisfaz a condição de Lipschitz para a variável x no conjunto
D, então o problema de valor inicial
dx
= f (t, x), a ≤ t ≤ b, x(a) = α,
dt
possui uma solução única no intervalo a ≤ t ≤ b
9

1.0.2 Estabilidade da Solução

Daı́ segue o seguinte teorema:

Teorema 1.0.4. O problema de valor inicial

dx
= f (t, x), a ≤ t ≤ b, x(a) = α,
dt
é dito bem posto (”well-posed”) se:

• existe uma solução única, x(t) para o problema e

• existem uma constante 0 > 0 tal que para qualquer , com 0 >  > 0,
para qualquer função δ(t) contı́nua com |δ(t)| < , para qualquer t no
intervalo [a, b], e com |δ0 | < , o problema de valor inicial

dz
= f (t, z) + δ(t), a ≤ t ≤ b, z(a) = α + δ0 ,
dt
tem uma solução única z(t) que satisfaz

|z(t) − x(t)| <  para todos tem [a, b]. (1.3)

Finalmente:

Teorema 1.0.5. Suponha D = {(t, x) |a ≤ t ≤ b, −∞ < x < ∞}. Se f


é contı́nua e satisfaz a condição de Lipschitz para a variável x no conjunto
D, então o problema de valor inicial

dx
= f (t, x), a ≤ t ≤ b, x(a) = α,
dt
é bem posto.

O teorema acima mostra que pequenas mudanças nos dados iniciais con-
duzem a pequenas alterações nas respostas. Entretanto, pode ser que o pro-
blema seja bem posto, mas mal condicionado com respeito à computação
numérica. Para melhor entender quando isto ocorre podemos calcular partir
das seguintes equações:
Z x(t) Z t
dx
= f (t, x) → dx = x(t) − x(a) = f (t0 , x)dt0 ,
dt x(a) a

que resulta em:


Z t
x(t) = α + f (t0 , x)dt0 .
a
10 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

De maneira análoga temos:


Z t
z(t) = α + δ0 + [f (t0 , x) + δ(t0 )]dt0 .
a

A diferença entre as funções perturbada e não perturbada é dada por:


Z t
z(t) − x(t) = δ0 + [f (t0 , z) + δ(t0 ) − f (t0 , x)] dt0 .
a

Podemos aplicar a operação de módulo em ambos os lados, resultando na


inequação1 :
Z t
0 0 0 0

|z(t) − x(t)| ≤ |δ0 | + [f (t , z) + δ(t ) − f (t , x)] dt ,

a

que pode ser re-escrita como:


Z t
A(t) ≤ |δ0 | + L A(t0 )dt0 , (1.4)
t0

onde A(t) ≡ |z(t) − x(t)|. Na equação acima foi utilizada a definição


(1.2).
Podemos multiplicar ambos os lados por exp(−L t), resultando em:
Z t
−Lt −Lt −Lt
A(t) e ≤ |δ0 | e + Le A(t0 )dt0 .
t0

que pode ser re-escrita como:


d −Lt t
 Z 
e A(t )dt ≤ |δ0 | e−Lt ,
0 0
dt t0

que, quando integrada, resulta em:


Z t
−Lt |δ0 | −Lt0
A(t0 )dt0 ≤ − e−Lt ,

e e
t0 L
que resulta em: Z t  
L A(t0 )dt0 ≤ |δ0 | eL(t−t0 ) − 1 , (1.5)
t0
Substituindo (1.4) em (1.5) temos:

A(t) ≤ |δ0 | eL(t−t0 ) , t0 ≤ t ≤ tM .

Voltando ao nosso problema, podemos utilizar o teorema (1.3) para mostrar


que:
 ≤ |δ0 | eL(t−t0 ) . (1.6)
1
Vale lembrar que |a + b| ≤ |a| + |b|.
1.1. MÉTODO DE EULER 11

Deste resultado temos que a equação diferencial somente será bem posta se

∂f
≡ L ≤ 0,
∂x
já que somente neste caso |z(t) − x(t)| permanecerá finito à medida que
t → ∞.

1.0.3 Solução Numérica

As tentativas de resolução das ODEs podem ser resumidas em re-escrever


os diferenciais dx e dt em termos de passos finitos:

dx → ∆x = xn+1 − xn (1.7)
dt → ∆t = tn+1 − tn ,

onde o ı́ndice i indica o n-ésimo passo discreto a partir das condições iniciais
do problema. Matematicamente:

dx ∆x
= f (t; x) ∼ = f (t; x).
dt ∆t
Podemos usar as definições (1.7) na equação acima, obtendo:

xn+1 = xn + ∆t f (t; x).

Percebe-se desde já um pequeno inconveniente na equação acima: não fica


claro em que valores de t e x a função f (t; x) deve ser calculada (tn ou tn+1 ?
xn ou xn+1 ?) Obviamente, no limite em que o passo ∆t é pequeno, além
de termos uma boa aproximação para as equações diferenciais, esta questão
se torna menos e menos relevante. Entretanto, como veremos mais adiante,
é necessário que se tome cuidado quanto ao limite inferior deste passo, que
não deve ser muito pequeno a fim de se evitar erros numéricos.
No caso de equações ordinárias de ordem N , sendo N =2 ou superior,
estas podem ser reescritas em N equações diferenciais de primeira ordem
acopladas, com i = 2, . . . , N , tendo a forma:

dxi
= fi (t; x1 ; . . . ; xN ), i = 1, . . . , N, (1.8)
dt
onde as funções fi no lado direito são conhecidas.

1.1 Método de Euler


12 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

O método de Euler é o método mais simples de resolução de ODEs.


Podemos deduzir a equação a ser utilizada através de uma expansão de
Taylor para x(tn + ∆t = tn+1 ):

dx
x(tn + ∆t) = x(t)|tn + ∆t + O(∆t2 ), (1.9)
dt tn

onde O(∆t2 ) representa o termo quadrático em ∆t e de ordem maiores.


Caso esta última parcela seja removida da equação, ocorrerá um desvio do
valor de x(tn + ∆t) em relação ao valor numérico preciso: quanto menor
for o valor de ∆t, menor será o desvio ou erro numérico produzido por esta
remoção.

1.1.1 Método de Euler Explı́cito

O método explı́cito é derivado diretamente da expressão (1.9):

xn+1 = xn + f (tn ; xn ) h + O(h2 ), (1.10)

onde:

h ≡ ∆t = tn+1 − tn ,
xn+1 = x(tn+1 ) = x(tn + h) e
xn = x(tn ).

A última parcela no lado direito indica que o erro de truncamento local do


método de Euler é proporcional à h2 . Este método é chamado explı́cito,
porque os valores de xn+1 , calculados no tempo tn+1 , são obtidos a partir
de dados conhecidos no passo de tempo anterior tn . Podemos notar que
f (t; x) é, na verdade a declividade da reta tangente à x(t) no ponto avaliado.
Assim, no método de Euler, a suposição implı́cita é de que a função x(t) varia
linearmente entre quaisquer dois pontos consecutivos avaliados. A equação
acima pode ser re-escrita como:
dx xn+1 − xn
=
dt h
No limite h → 0, temos a definição da derivada.

1.1.2 Método de Euler Implı́cito

Um método alternativo consiste em começarmos com a seguinte expansão


de Taylor:
dx
x(tn − ∆t) = x(t)|tn−1 − ∆t + O(∆t2 ),
dt tn
1.1. MÉTODO DE EULER 13

que resulta, depois de negligenciarmos os termos quadráticos e superiores e


rearranjarmos a equação, em:
xn = xn−1 + f (tn , xn ) h,
que pode ser re-escrita, sem perda de generalidade, em:
xn+1 = xn + f (tn+1 , xn+1 ) h. (1.11)
Este é o método chamado implı́cito, porque os valores de xn+1 são obtidos
a partir da resolução de uma equação implı́cita, i.e, de uma equação que
pode depender de xn+1 , que é um valor desconhecido no tempo tn . Esta
equação pode ser calculada analiticamente ou, em casos mais complicados,
numericamente através de um algoritmo de Newton-Rapson, por exemplo.

Exemplo

Imagine que temos a seguinte equação diferencial x0 = x, e temos como


condição inicial x(t = 0) = 1. Imagine que queremos calcular o valor de
x(t = 4) numericamente. Utilizando o procedimento descrito acima teremos
como equação de evolução dos valores de xn+1 :
xn+1 = xn + f (tn ; xn ) × h = xn + xn × h.
Vamos considerar neste exemplo, inicialmente, um passo h igual a 1. Assim,
na primeira etapa, temos:
x1 = x0 + x0 × h = 1 + 1 × 1 = 2.
Seguindo os próximos pontos:
x2 = x1 + f (t1 ; x1 ) h = y1 + y1 × h = 2 + 2 × 1 = 4.
x3 = x2 + f (t2 ; x2 ) h = y2 + y2 × h = 4 + 4 × 1 = 8.
x4 = x3 + f (t3 ; x3 ) h = y3 + y3 × h = 8 + 8 × 1 = 16.
A solução analı́tica é x(t) = et , logo, x(t = 4) = e4 ≈ 54, 598. Podemos
ver que a solução encontrada numericamente não é precisa. Este procedi-
mento pode ser melhorado até certo ponto se escolhermos valores menores
para h. Por exemplo, para h = 0, 5:
x1 = x0 + f (t0 ; x0 ) h = 1 + 1 × 0, 5 = 1, 5
x2 = x1 + f (t1 ; x1 ) h = 1, 5 + 1, 5 × 0, 5 = 2, 25
x3 = x2 + f (t2 ; x2 ) h = 2, 25 + 2, 25 × 0, 5 = 3, 375
x4 = x3 + f (t3 ; x3 ) h = 3, 375 + 3, 375 × 0, 5 = 5, 0625
x5 = x4 + f (t4 ; x4 ) h = 5, 0625 + 5, 0625 × 0, 5 = 7, 59375
x6 = x5 + f (t5 ; x5 ) h = 7, 59375 + 7, 59375 × 0, 5 = 11, 390625
x7 = x6 + f (t6 ; x6 ) h = 11, 390625 + 11, 390625 × 0, 5 = 17, 0859375
x8 = x7 + f (t7 ; x7 ) h = 17, 0859375 + 17, 0859375 × 0, 5 = 25.62890625.
14 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

Agora podemos aplicar o método implı́cito. No presente caso temos a


seguinte equação:
xn
xn+1 = xn + f (tn+1 ; xn+1 ) h = xn + xn+1 h =
1−h
Escolhendo um valor de ∆x = 0, 5, temos a seguinte sequência:
x0 1
x1 = = =2
1−h 1 − 0, 5
x1 2
x2 = = =4
1−h 1 − 0, 5
x2 4
x3 = = =8
1−h 1 − 0, 5
x3 8
x4 = = = 16
1−h 1 − 0, 5
x4 16
x5 = = = 32
1−h 1 − 0, 5
x5 32
x6 = = = 64
1−h 1 − 0, 5
x6 64
x7 = = = 128
1−h 1 − 0, 5
x7 128
x8 = = = 256.
1−h 1 − 0, 5

1.1.3 Análise da Estabilidade do Método de Euler

Suponha que um problema de valor inicial bem estruturado é dado:


dx
= f (t, x), a ≤ t ≤ b, x(a) = α.
dt
Podemos construir uma rede de pontos igualmente distribuı́dos no intervalo
[a, b]:
ti = a + i h, para cada i = 0, 1, 2, ..., N.
O passo temporal é h é dado por:
(b − a)
h= = ti+1 − ti .
N
Podemos usar series de Taylor para x(t):
(ti+1 − ti )2 00
x(ti+1 ) = x(ti ) + (ti+1 − ti )x0 (ti ) + x (ξi ),
2
para ξi ∈ (ti , ti+1 ). Já que h ≡ ti+1 − ti e x0 (ti ) = f (ti , x(ti )):
h2 00
x(ti+1 ) = x(ti ) + h f (ti , x(ti )) + x (ξi ).
2
1.1. MÉTODO DE EULER 15

Caso se despreze a última parcela da equação acima, teremos wi ≈ x(ti ):



w0 =α
(1.12)
wi+1 = wi + hf (ti . wi ), i = 0, 1, ..., N − 1.

O fato deste ser um problema bem posto implica:

f (ti , wi ) = x0 (ti ) = f (ti , x(ti )).

Erro de Truncamento

Podemos calcular facilmente o erro de truncamento (τn ) para o método


de Euler, sendo este a diferença entre valor analı́tico da função e o valor
obtido utilizando-se este método τn = x(tn+1 ) − wn+1 :

h2 00
 
τn = x(tn ) + h f (tn , x(tn )) + x (ξn ) − [wn + h f (tn , wn )],
2

que resulta em:

h2 00
|x(tn+1 ) − wn+1 | ≤ |x(tn ) − wn | + h|f (tn , x(tn )) − f (tn , wn )| + |x (ξn )|.
2
Se f satisfazer a condição de Lipschitz (eq. 1.2), e se utilizarmos a equação
(1.6), podemos escrever a equação acima como:

h2 M
|x(tn+1 ) − wn+1 | ≤ (1 + hL) |x(tn ) − wn | + , (1.13)
2
onde M é uma constante tal que |x00 (t)| ≤ M . Pode-se mostrar que a
equação acima pode ser re-escrita como:

hM  (ti+1 −t0 ) L 
|x(tn+1 ) − wn+1 | ≤ e −1 ,
2L
para cada i = 0, 1, ..., N − 1.

Erro de Arredondamento e Truncamento

Da equação (1.13) infere-se que quanto menor o valor de h, melhor será


a aproximação do método. Entretanto, negligencia-se neste caso o erro de
arredondamento que inevitavelmente acaba influenciando qualquer resultado
obtido a partir do uso de computadores: quanto menor o valor de h, mais
cálculos são necessários e maior será, portanto, os erros de arredondamentos
que ocorrem em cada um dos passos.
16 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

Suponhamos que uma equação diferencial de primeira ordem possa ser


resolvida de duas formas: sem erros de arredondamento (conforme eqs. 1.12)
e com erro de arredondamento:

u0 = α + δ0
(1.14)
ui+1 = ui + hf (ti . ui ) + δi+1 , i = 0, 1, ..., N − 1,

onde δi denota o erro de arredondamento associado com ui . Podemos fazer


uma análise semelhante com aquela feita com o erro de truncamento e en-
contrar uma expressão para descrever o erro de arredondamento realizado
pela aproximação de dı́gitos finitos no cálculo de x(t). Neste caso:
 
1 hM δ h (ti+1 −t0 ) L i
|x(tn+1 ) − un+1 | ≤ − e − 1 + |δ0 | eL(ti −t0 ) ,
L 2 h

para cada i = 0, 1, ..., N − 1.


Pode-se ver rapidamente que:
hM δ
lim + →∞
h→0 2 h
Existe, portanto, um valor ótimo para h, que pode ser encontrado facilmente:
 
d hM δ M δ
+ = − 2 = 0,
dh 2 h 2 h
e, portanto:

hmelhor = .
M

Região de Estabilidade do Problema-Modelo

Uma forma alternativa de se entender a região de estabilidade de um


método numérico de resolução de equações diferenciais ordinárias consiste
em se resolver o problema modelo de equação diferencial com valor inicial:

x(t = 0) = x0
(1.15)
x0 = λx,

onde λ é uma constante ∈ C. A solução analı́tica do modelo é:

x(t) = x0 eλt .

Note que a solução assimptótica de x(t) só não diverge se |λ| ≤ 1.


Podemos agora resolver o problema-modelo no caso do método de Euler
explı́cito. Neste caso:

w1 = w0 + h φ(t0 , w0 , h) = w0 + h (λ w0 ) = (1 + hλ) w0 ,
1.2. MÉTODO DE EULER-CROMER 17

cuja solução depois de n passos é:


wn = (1 + hλ)n w0 .
Obviamente este valor não divergirá se:
p
|1 + hλ| = |1 + h<(λ) + ih=(λ)| = [1 + h<(λ)]2 + [h=(λ)]2 ≤ 1.
Note pela figura (1.1) que somente parte do plano imaginário é estável para
o método de Euler: somente a parte achurada, com raio λh. Para qual-
quer região fora desta área, a solução numérica diverge enquanto a solução
analı́tica decai. Isto é um forte indicativo de que o método é condicional-
mente estável (estável somente para alguns valores de h). Se λ for real, a
região de estabilidade é tal que:
2
0≤h≤ .
|λ|
Se
|1 + λh| > 1,
então (1 + λh) é negativo, com magnitude maior do que 1, e como:
wn = (1 + hλ)n w0 ,
as sucessivas soluções serão oscilatórias com mudança de sinal a cada passo.

Im(λh)

-2,0 -1,0 Re(λh)

Figura 1.1: Região de estabilidade para o método de Euler explı́cito.

1.2 Método de Euler-Cromer

O método de Euler-Cromer é uma modificação do método de Euler usado


para a solução das equações de movimento que surgem em mecânica clássica
ao se resolver aplicar a segunda lei de Newton:
d2 x
F = ma = m .
dt2
18 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

O método de iteração é modificado em relação ao método de Euler Explı́cito.


As equações diferenciais podem ser expressas como:

dx
=v
dt
dv
= a(t; x; v)
dt
O método pode ser descrito como:

vn+1 = vn + a(tn ; xn ; vn ) h
xn+1 = xn + vn+1 h,

onde h é o passo temporal e tn = t0 +n h é o tempo depois de n passos. Note


que a grande diferença entre o método de Euler-Cromer e o método de Euler
tradicional tem a ver com o fato de que no primeiro a velocidade atualizada
no tempo vn+1 é utilizada para o cálculo da posição xn+1 , ao contrário da
velocidade vn , que seria utilizada no método de Euler tradicional. Esta
mudança é sutil, mas permite que a energia total do sistema no cálculo
permaneça praticamente constante, ao contrário do que ocorre no método
de Euler, quando a energia geralmente aumenta gradativamente à medida
que os passos temporais vão ocorrendo.

1.3 Método de Verlet

O método de Verlet é bastante utilizado para a integração da equação


de movimento de partı́culas interagentes, no qual são conhecidas todas as
forças de interação internas. Uma derivação do método clássico de Verlet
consiste em utilizar as equações de movimento:

dx
vn =
dt tn

dv
an = .
dt tn

Começamos expandindo a posição posterior:

1 dx2 1 dx3

dx 2
h3 + O ∆t4

xn+1 = xn + h+ 2
h + 3
(1.16)
dt tn
2 dt tn 3! dt tn

e anterior ao tempo tn de uma partı́cula:

1 dx2 1 dx3

dx 2
h3 + O ∆t4

xn−1 = xn − h+ 2
h − 3
(1.17)
dt tn
2 dt tn 3! dt tn

1.3. MÉTODO DE VERLET 19

Podemos agora somar as equações (1.16) e (1.17), obtendo:


dx2

xn+1 + xn−1 = 2xn + 2 h2 + O ∆h4

(1.18)
dt tn

e subtraindo as mesmas equações temos:



dx
h + O h3 .

xn+1 − xn−1 = 2 (1.19)
dt tn

Assim, esquecendo os termos de mais alta ordem, podemos obter as seguintes


expressões, tanto a partir de (1.18):

xn+1 = 2xn − xn−1 + a(tn ; vn ) h2 (1.20)

e a partir de (1.19):
xn+1 − xn−1
vn = . (1.21)
2h
Para se utilizar a equação (1.20), é necessário que se conheça inicial-
mente a posição da partı́cula em dois intervalos de tempo sucessivos. Este,
geralmente, não é o caso, já que o mais usual é termos como condição inicial
somente a posição da partı́cula (e a velocidade) no instante inicial. Entre-
tanto, a posição da partı́cula no tempo t1 pode ser estimada a partir da
expansão em séries de Taylor:
1
x1 = x0 + v0 ∆t + a0 ∆t2 + O ∆t3 .

2
Em geral este erro inicial não é considerado um problema grande pois depois
de uma sucessão de passos de tempo ele torna-se pequeno frente ao erro total.
Embora a equação (1.20) seja suficiente para se calcular as trajetórias
das partı́culas, em muitas situações é necessário que se conheça também
as velocidades das partı́culas para que possamos, por exemplo, calcular a
energia cinética total a fim de se verificar se há conservação de energia no
sistema. Entretanto, a equação (1.21) para a velocidade da partı́cula, que
encontra-se no trabalho original de Verlet, possui dois problemas principais:
ela precisa ser inicializada por alguma outra equação e, ademais, ela produz
valores incorretos de velocidade que conduzem, quando utilizadas para cal-
cular a energia cinética das partı́culas, ao descumprimento do teorema da
conservarão de energia total.
Um problema grande que há com o cálculo da velocidade através da
equação (1.21) está no fato de que no mesmo instante de tempo tn , a posição
e a velocidade calculadas não referem-se ao mesmo instante de tempo, ou
seja, calcula-se a posição xn+1 e a velocidade vn . Uma maneira alternativa
de se calcular a velocidade no instante de tempo seguinte é utilizarmos a
expressão:
xn+1 − xn
vn+1 = + O (∆t)
∆t
20 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

1.3.1 Algoritmo velocity-Verlet


Conforme mencionado anteriormente, o algoritmo de Verlet é bastante uti-
lizado quando se quer calcular as trajetórias de um sistema de partı́culas,
sem se preocupar com a velocidade das mesmas. Entretanto, um algoritmo
derivado deste, chamado de velocity-Verlet é mais utilizado, pois calcula no
mesmo instante a velocidade e a posição das partı́culas. Entretanto, cabe
aqui uma ressalva: este método é útil somente quando a força que age sobre
as partı́culas não depende explı́citamente da velocidade. Em resumo, este
é um método hı́brido, que utiliza um meio-passo para a velocidade em h/2,
antes do cálculo da velocidade definitiva em h. Os passos de implementação
são os seguintes cálculos:

1. velocidade no meio do intervalo: v 1 = vn + 12 an h;


n+ 2

2. posição no fim do intervalo: xn+1 = xi + v 1 h;


n+ 2

3. aceleração no fim do intervalo: an+1 = a(xn+1 );

4. velocidade final: vn+1 = v 1 + 21 an+1 h.


n+ 2

Novamente, note que o método assume que a aceleração não depende ex-
plicitamente da velocidade. Alternativamente, um dos passos intermediários
pode ser eliminado, resultando em:

1. posição no fim do intervalo: xn+1 = xi + vi h + 12 an h2 ;

2. aceleração no fim do intervalo: an+1 = a(xn+1 );

3. velocidade final: vn+1 = vn + 21 (an + an+1 ) h.

Tanto este método quanto o método de Verlet tradicional tem erro local
O(h4 ) na posição e O(h2 ) na velocidade. Em sistemas conservativos, onde
a energia total permanece constante, a solução numérica pelo método de
Verlet oscila próximo ao valor real da energia.

1.4 Método de Runge-Kutta

Um outro método para a resolução de EDO foi descrito pelo matemáticos


alemães Runge e Kutta. Este método consiste em utilizarmos mais termos
da expansão de xn+1 em séries de Taylor do que os dois primeiros termos
da série. Como exemplo, vamos considerar o método descrito como Runge-
Kutta de segunda ordem.
1.4. MÉTODO DE RUNGE-KUTTA 21

1.4.1 Método Runge-Kutta de 2a ordem

No caso deste método, utiliza-se somente os três primeiros termos da


expansão, assim:

1 d2 x

dy
h2 + O h3 .

xn+1 = xn + h+ 2
dt (tn ,xn )
2! dt (tn ,xn )

Utilizando as mesmas abreviações anteriores, podemos reescrever a equação


acima como:
1
xn+1 = xn + f (tn , xn )h + f 0 (tn , xn )h2 , (1.22)
2
onde dx/dt = f (t; x) e h ≡ tn+1 − tn . Podemos ver desde já que o método
RK2 possui erro local O(h3 ). Em princı́pio poderı́amos calcular analitica-
mente o valor de f 0 (tn , xn ) mas isto tornaria o método menos genérico. O
que Runge e Kutta fizeram foi redefinir a equação acima como:

xn+1 = xn + (a1 k1 + a2 k2 ) h, (1.23)

onde
k1 ≡ f (tn ; xn ),

e
k2 ≡ f (tn + p1 h; xn + q11 k1 h).

Se retornarmos a equação (1.23) na equação (1.22), teremos o seguinte sis-


tema de equações:

a1 + a2 = 1
a2 p 1 = 1
a2 q11 = 1

Como temos 3 equações para resolvermos 4 variáveis, podemos ter diferentes


respostas dependendo da escolha arbitrária que podemos fazer sobre uma
variável em particular. Classicamente, temos 3 métodos utilizados corriquei-
ramente para o método de Runge-Kutta 2a ordem: métodos de Heun, do
ponto central e Ralston.

Método de Heun
22 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

Neste caso a escolha arbitrária é feita definindo-se a2 = 1/2. Temos


como consequência:

1
a2 =
2
1
a1 + a2 = 1 → a1 =
2
1
a2 p1 = → p1 = 1
2
1
a2 q11 = → q11 = 1.
2

Logo:
 
1 1
xn+1 = xn + k1 + k2 h (1.24)
2 2
k1 = f (tn ; xn ) (1.25)
k2 = f (tn + h; xn + k1 h). (1.26)

Vemos que neste caso o método de Runge-Kutta seria equivalente ao método


de Euler, onde o valor da tangente da função x escolhido entre os pontos tn
e tn+1 é a média do valor da tangente nos pontos tn e tn+1 .

Método do Ponto Central

Neste caso a escolha arbitrária é feita definindo-se a2 = 1. Temos como


consequência:

a2 = 1
a1 + a2 = 1 → a1 = 0
1 1
a2 p1 = → p1 =
2 2
1 1
a2 q11 = → q11 = .
2 2

Logo:

xn+1 = xn + k2 h (1.27)
k1 = f (tn ; xn ) (1.28)
 
h k1 h
k2 = f tn + ; xn + . (1.29)
2 2
1.4. MÉTODO DE RUNGE-KUTTA 23

Vemos que neste caso o método de Runge-Kutta seria equivalente ao método


de Euler, onde o valor da tangente da função x escolhido entre os pontos tn
e tn+1 é uma estimativa valor da tangente no ponto equidistante entre tn e
tn+1 .

Método de Ralston

Neste caso a escolha arbitrária é feita definindo-se a2 = 2/3. Temos


como consequência:

2
a2 =
3
1
a1 + a2 = 1 → a1 =
3
1 3
a2 p 1 = → p1 =
2 4
1 3
a2 q11 = → q11 = .
2 4

Logo:

1 2
xn+1 = xn + ( k1 + k2 ) h
3 3
k1 = f (tn ; xn )
 
3 3
k2 = f tn + h; xn + k1 h .
4 4

Método RK2 - ponto médio - em Mecânica


Na prática, quando resolvemos a equação do movimento para um corpo,
o método RK2 consiste em se calcular a posição e velocidade em um ponto
intermediário, antes de se calcular o passo h total. No ponto intermediário
temos:

h
tn+ 1 = tn +
2 2
h
xn+ 1 = xn + vn
2 2
h
vn+ 1 = vn + an
2 2
an+ 1 = a(tn+ 1 ; xn+ 1 ; vn+ 1 ),
2 2 2 2
24 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

e no ponto final temos:

tn+1 = tn + h
xn+1 = xn + v 1 h
2

vn+1 = vn + an+ 1 h
2

an+1 = a(tn+1 ; xn+1 ; vn+1 ).

1.4.2 Método de Runge-Kutta 4a ordem

Este método, chamado de RK4, utiliza as 5 primeiras parcelas da série


de Taylor da expansão de x(t + h). Assim, o método RK4 possui erro local
O(h5 ). Daı́, como no caso de Runge-Kutta 2a ordem, podemos definir estas
parcelas como sendo iguais a uma expressão que não contém as derivadas de
alta ordem: diferentes métodos terão diferentes equações. Vamos descrever
abaixo alguns destes métodos.

Método de Runge

Runge propôs a seguinte expressão:

1
xn+1 = xn + [k1 + 2 k2 + 2 k3 + k4] h, (1.30)
6

onde

k1 = f (tn ; xn )
1 1
k2 = f (tn + h; xn + k1 h)
2 2
1 1
k3 = f (tn + h; xn + k2 h)
2 2
k4 = f (tn + h; xn + k3 h)

Método de Kutta

Kutta sugeriu uma expressão alternativa:

1
xn+1 = xn + [k1 + 3 k2 + 3 k3 + k4 ] h, (1.31)
8
1.4. MÉTODO DE RUNGE-KUTTA 25

onde
k1 = f (tn ; xn )
1 1
k2 = f (tn + h; yn + k1 h)
3 3
2 1
k3 = f (tn + h; yn − k1 h + k2 h)
3 3
k4 = f (tn + h; yn + k1 h − k2 h + k3 h)

Método de RK4 - Runge - em Mecânica

Na prática, quando resolvemos a equação do movimento para um corpo,


o método RK4 consiste em se calcular a posição e velocidade em 3 pontos
intermediários, além do ponto descrito no método RK2, antes de se calcular
o passo h total. Como no caso do RK2, temos inicialmente:

1 xn = xn
1 vn = vn
1 an = a(tn ; 1 xn ; 1 vn ).
No primeiro passo intermediário temos:
h
2 tn = tn+ 1 = tn +
2 2
h h
2 xn = xn+ 1 =1 xn + 1 vn = xn + vn
2 2 2
h h
2 vn = vn+ 1 =1 vn + 1 an = vn + an
2 2 2
2 an = an+ 1 = a(tn ; 1 xn ; 1 vn ) = a(tn+ 1 ; xn+ 1 ; vn+ 1 ).
2 2 2 2

No segundo ponto intermediário temos:

3 tn =2 tn = tn+ 1
2
h h
3 xn = xn + 2 vn = xn + vn+ 1
2 2 2
h h
3 vn = vn + 2 an = vn + an+ 1
2 2 2
3 an = a(2 tn ; 2 xn ; 2 vn ) = a(tn+ 1 ; xn+ 1 ; vn+ 1 ).
2 2 2

No último ponto temos:

4 tn = tn + h
4 xn = xn + 3 vn h
4 vn = vn + 3 an h
4 an = a(tn+1 ; 4 xn ; 4 vn ).
26 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

Finalmente temos, no passo completo:

tn+1 = tn + h
1
xn+1 = xn + [1 vn + 2 2 vn + 2 3 vn +4 vn ] h
6
1
vn+1 = vn + [1 an + 2 2 an + 2 3 an +4 an ] h.
6

1.4.3 Controle de Erro nos Métodos RK

Suponhamos que um problema de valor inicial seja resolvido através de


um método de Runge-Kutta, através de:

w0 =α
(1.32)
wi+1 = wi + hφ(ti . wi , h), i = 0, 1, ..., N − 1,

com erro de truncamento τi+1 = O(hm ). Este mesmo problema pode ser
resolvido utilizando-se um outro método de Runge-Kutta com erro de trun-
˜ i+1 = O(hp ), com p > m, através de:
camento tau

w̃0 =α
(1.33)
w̃i+1 = w̃i + hφ̃(ti . w̃i , h), i = 0, 1, ..., N − 1,

Assumimos que o valor atual da função é tal que wi ∼ x(ti ) ∼ w̃i . Assim, o
erro de truncamento para o primeiro sistema pode ser calculado como:
x(ti+1 ) − x(ti )
τi = − φ(ti , y(ti ), h)
h
x(ti+1 ) − wi
− φ(ti , wi , h)
h
x(ti+1 ) − [wi + h φ(ti , wi , h)
h
1
[x(ti+1 ) − wi+1 ].
h
E, de maneira similar:
1
τ̃i = [x(ti+1 ) − w̃i+1 ].
h
Consequentemente:
1
τi+1 = [x(ti+1 ) − wi+1 ]
h
1
[x(ti+1 ) − w̃i+1 + w̃i+1 − wi+1 ]
h
1
τ̃i+1 + [w̃i+1 − wi+1 ].
h
1.4. MÉTODO DE RUNGE-KUTTA 27

Como τi+1 é O(hm ) e τ̃i+1 é O(hp ) com p > m, o termo significativo de τi+1
deve vir da parcela [w̃i+1 − wi+1 ]/h. Assim, temos, aproximadamente:

1
τi+1 ∼ [w̃i+1 − wi+1 ].
h
Para o ajuste do valor do passo h, podemos assumir que existe um valor K,
independente de h, para o qual é valida a seguinte aproximação:

τi+1 ∼ K hm .

Podemos então calcular o novo passo qh através de:

1
τi+1 ∼ K(qh)m = q m Khm ∼ q m [w̃i+1 − wi+1 ].
h
Se escolhermos arbitrariamente um valor máximo para o erro de truncamente
ε, teremos:
qm
| [w̃i+1 − wi+1 ]| ≤ ε,
h
e, portanto:
 1/m
εh
q≤ .
|w̃i+1 − wi+1 |

1.4.4 Região de Estabilidade do Problema-Modelo

Podemos aplicar o método de RK para o problema modelo. Vamos


analisar primeiramente o que ocorre para o caso de segunda-ordem (método
do ponto-médio). O valor de w1 é dado por:

k1 = λw0
λ2 h
 
h
k2 = λ w0 + (λw0 ) = w0 (λ + )
2 2
λ2 h2
 
w1 = w0 + h k2 = w0 1 + λh +
2

De maneira iterativa, pode-se mostrar que depois de n passos:


n
λ 2 h2

wn = w0 1 + λh + .
2

Novamente, este resultado não divergirá se:


2 2

1 + λh + λ h ≤ 1.

2
28 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

Já para o método de RK4, a resolução do problema-modelo é:

k1 = λw0
λ2 h
 
h
k2 = λ w0 + (λw0 ) = w0 (λ + )
2 2
λ2 h λh λ2 h2
    
h
k3 = λ w0 + w0 (λ + ) = w0 λ + +
2 2 2 4
2 2
  
λh λ h
k4 = λ w0 + hw0 λ + + .
2 4

Temos como resultado:


h
w1 = w0 + [k1 + 2k2 + 2k3 + k4 ]
 6
λ2 h2 λ3 h3 λ4 h4

= w0 1 + λh + + + .
2 6 24

Figura 1.2: Região de estabilidade para os métodos RK2 e RK4.

1.5 Incrementos Adaptativos

Às vezes é interessante, durante a resolução de uma EDO, que o incre-


mento de tempo h possa ser variável, uma vez que existem regiões especı́ficas
que são mais sensı́veis ao valor de h e outras onde o valor desta variável po-
deria ser incrementado sem perda expressiva de precisão.
1.5. INCREMENTOS ADAPTATIVOS 29

Podemos começar a dedução de um método para a estimativa de hnovo


através da razão entre o erro obtido no passo i+1, realizado com passo hnovo
e o erro obtido no passo i, realizado com h. Esta razão pode ser expressa
como:
εi+1 ki+1 hmi+1
= ,
εi ki hm
i
onde ki+1 e ki são duas constantes de proporcionalidade que podem, em
princı́pio, ser calculadas. Entretanto, podemos, em um primeiro momento,
definir a razão destas duas constantes como sendo a unidade, de forma que
teremos:
hi+1 m
 
εi+1
∼ ,
εi hi
e, rearranjando:
 1/m
εi+1
hi+1 = hi .
εi
Podemos admitir um erro máximo no cálculo da nova posição i + 1 igual a
ε, de forma que temos como resultado:
 1/m
ε
hnovo = hi+1 = h . (1.34)
εc
Para definirmos um passo variável, necessitamos de dois valores extras:
o erro máximo admissı́vel por passo ε e o erro corrente εc . O máximo erro
admissı́vel é um dos dados que devem ser fornecidos pelo usuário sendo,
portanto, um dado inicial do problema. O erro corrente não é conhecido, a
priori, uma vez que se fosse conhecido isto implicaria que o valor exato é
conhecido e não haveria necessidade de se calcular o valor numérico. Existem
inúmeras formas de se estimar o erro corrente εc ; algumas delas são listadas
abaixo.
A forma mais simples de estimativa consiste em se utilizar um único
método e, a cada n-ésimo passo de integração, se resolver o problema utili-
zando os seguintes passos temporais: hn e hn /2 (este último deve ser aplicado
duas vezes consecutivas, para se chegar no mesmo tempo tn+1 ). A diferença
no valor de xn+1 encontradas por cada um dos passos temporais será uma
estimativa do erro corrente.
Entretanto, uma forma variada de se estimar este erro é utilizarmos dois
métodos diferentes com o mesmo passo h, digamos um método 4a ordem e
outro 5a ordem, e calculamos o valor da função no ponto xn+1 pelos dois
métodos. De forma análoga ao procedimento anterior, a diferença entre os
valores da função ao final do passo (ou seja, em xn+1 no tempo tn+1 ) é uma
estimativa para o erro corrente do método com erro na menor potência (no
presente exemplo, o método de 4a ordem) na próxima integração.
Podemos utilizar diversos mecanismos para evitar que o valor de h mude
de forma abrupta de um passo para o próximo. O mais simples deles é supor
30 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

um valor máximo e um valor mı́nimo para h; após o cálculo de hnovo verifica-


se se este está fora dos limites estabelecidos e caso afirmativo, utiliza-se os
valores limites ao invés do valor calculado.
Um método alternativo consiste em se definir duas variáveis auxiliares
S1 e S2 . Assim, para valores de S1 < 1 (por exemplo, S1 = 0.9), redefinimos
hnovo como:
 1/m
ε
hnovo = hS1 . (1.35)
εc
O valor máximo de hnovo é S2 h, onde S2 > 1 (por exemplo, S2 = 2).

1.5.1 Método RK45 - Cash-Karp

Um fato interessante sobre os métodos de Runge-Kutta é que a partir


de ordens M maiores do que 4, o valor da função ao final do intervalo
tem que ser obtido através de um número maior de pontos do que M ; este
sendo outro motivo pelo qual o método de quarta ordem é o mais utilizado.
Entretanto Fehlberg descobriu um método de quinta ordem, que necessita
do cálculo de 6 posições da função dentro do intervalo h, mas que uma
combinação diferente destes mesmos 6 pontos resulta em um método de
quarta ordem. Com isto, abriu-se a possibilidade de realizarmos a avaliação
da função depois do intervalo h através de dois métodos diferentes, mas
utilizando os mesmos pontos para ambos. A forma geral do método de
Runge-Kutta quinta ordem é:

k1 = h f (xn ; tn ) (1.36)
k2 = h f (xn + b21 k1 ; tn + a2 h) (1.37)
k3 = h f (xn + b31 k1 + b32 k2 ; tn + a3 h) (1.38)
... (1.39)
k6 = h f (xn + b61 k1 + b62 k2 + ... + b65 k5 ; tn + a6 h) (1.40)
xn+1 = xn + c1 k1 + c2 k2 + c3 k3 + c4 k4 + c5 k5 + c6 k6 , (1.41)

e a equação de quarta-ordem associada é:

x?n+1 = xn + c?1 k1 + c?2 k2 + c?3 k3 + c?4 k4 + c?5 k5 + c?6 k6 .

Assim a estimativa do erro corrente é:


6
X
εc = |xn+1 − x?n+1 | = (ci − c?i ) ki .
i=1

Os valores utilizados para as constantes acima foram identificados por Cash


e Karp, e são identificados na tabela (1.1).
1.6. MÉTODOS MULTI-PASSOS 31

i ai bij ci c?i
37 2825
1 378 27648
1 1
2 5 5 0 0
3 3 9 250 18575
3 10 40 40 621 48384
3 3 9 6 125 13525
4 5 10 − 10 5 594 55296
5 1 − 11
54
5
2
70
− 27 35
27 0 277
14336
7 1631 175 575 44275 253 512 1
6 8 55296 512 13824 110592 4096 1771 4
j= 1 2 3 4 5

Tabela 1.1: Tabela contendo as constantes utilizadas no método de Runge-


Kutta 45, construı́do por Cash e Karp.

Uma maneira bastante utilizada do método de Cash-Karp consiste no


seguinte algoritmo. Em determinado passo, calcula-se a estimativa para o
próximo valor de hn+1 através da equação (1.35):
0,2
ε
hnovo = h .
εc

Daı́ temos duas possı́veis ações:

• caso o valor de εc seja maior do que ε, a equação acima nos diz quanto
temos que reduzir o valor de h ao repetir o passo atual. Isto implica
em descartar o passo atual!

• Caso o valor de εc seja menor do que ε, o passo atual é mantido e a


equação acima nos diz quanto o valor de h pode ser aumentado com
segurança para o próximo passo.

No caso de termos várias equações diferenciais acopladas, o valor de hnovo


escolhido deverá ser o menor deles.

1.6 Métodos Multi-passos

Nos métodos de resolução numérica vistos até agora, quase sempre pre-
cisávamos somente do valor da função x em uma única posição anterior
xi (ti ). Entretanto, podemos utilizar métodos que lançam mão dos valores
de função encontrados em outros passos também. Desde as possı́veis aborda-
gens, aquela mais utilizada consiste no chamado método multi-passo linear.
Em geral, métodos multi-passos podem obter resultados melhores, para os
mesmos números de passos, do que métodos que utilizam somente um único
passo, uma vez que a informação da função em posição dos passos anteriores
32 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

é utilizada para o cálculo da função em posições posteriores. Em particu-


lar, no método linear multi-passo o cálculo da função na posição anterior
é expresso como uma combinação linear dos valores da função nos passos
anteriores. Em geral, temos:
Xm Xm
xn+1 = αj xn+1−j − h βj fn+1−j , (1.42)
j=0 j=0

onde αj e βj são constantes, xn é a função no n-ésimo passo temporal e


fn = f (tn , xn ). Temos que m é a ordem do polinômio utilizado para o
cálculo da função em n + 1. Examinaremos agora o método multi-passo
linear mais utilizado para a solução de EDOs.

1.6.1 Método de Adams-Bashforth

A ideia por trás do método de Adams-Bashforth consiste em se resolver a


equação principal da EDO (1.1) através da integração da mesma, resultando
em: Z tn+1
x(tn+1 ) = x(tn ) + f (t0 , x(t0 ))dt0 . (1.43)
tn
Se pudermos integrar a equação acima analiticamente, não precisaremos
nos preocupar com nenhum método numérico. Entretanto, para a maioria
dos casos poderı́amos aproximar a equação f (t, x) por um polinômio φ(t)
e, como qualquer polinômio pode ser integrado analiticamente, poderemos
encontrar uma solução aproximada para a ODE:
Z tn+1
x(tn+1 ) ≈ x(tn ) + φ(t0 )dt0 .
tn
Para o caso em que φ(t) = f (tn ), temos:
x(tn+1 ) ≈ x(tn ) + hfn .
Em termos da equação (1.42), temos as seguintes constantes: α1 = 1, β1 = 1
e βj , αj = 0 para j = 0.
Podemos agora considerar o método de Adams-Bashforth para dois pas-
sos. Neste caso, a condição que temos é que φ(tn−i ) = f (tn−i ) = fn−i para
i = 0, 1. A função linear que produz este resultado está expressa abaixo:
f (tn ) − f (tn−1 )
f (t, x) ≈ φ(t) = f (tn ) + (tn − t).
tn − tn−1
Voltado à equação (1.43) temos:
t
f (tn ) − f (tn−1 ) (2tn t − t2 ) n+1

x(tn+1 ) ≈ x(tn ) + f (tn ) t + (1.44)
tn − tn−1 2 tn
 
3 1
x(tn+1 ) ≈ x(tn ) + h f (tn ) − f (tn−1 ) (1.45)
2 2
1.6. MÉTODOS MULTI-PASSOS 33

Assim, temos:
 
3 1
xn+1 = xn + h fn − fn−1 ,
2 2

que também pode ser expressa em termos da equação (1.42) se α1 = 1,


α2 = 0, β1 = 3/2, β2 = −1/2 e βj , αj = 0 para j = 0.
Continuando desta maneira, podemos construir o método de Adams-
Bashforth para m passos se interpolarmos f através de m pontos pre-
viamente obtidos: t = tn−0 , tn−1 , tn−2 , ..., tn−m+1 . Este processo é feito
utilizando-se um polinômio de grau < m − 1, de maneira que φ(tn−i ) =
f (tn−i ) para i = 0, 1, ..., m − 1 e integrando o mesmo.
Para que possamos começar a utilizar a expressão acima, temos que
ter m pontos iniciais. Caso estes pontos não sejam fornecidos, podemos
utilizar um método de passo único (como Runge-Kutta de mesma ordem,
por exemplo) para produzir estes pontos iniciais.
Para os próximos valores de m temos:

h
m=3 xn+1 =xn + [23fn − 16fn−1 + 5fn−2 ]
12
h
m=4 xn+1 =xn + [55fn − 59fn−1 + 37fn−2 − 9fn−3 ]
24
h
m=5 xn+1 =xn + [1901fn − 2774fn−1 + 2616fn−2 +
720
−1274fn−3 + 251fn−4 ]
h
m=6 xn+1 =xn + [4277fn − 7923fn−1 +
1440
+9982fn−2 − 7298fn−3 + 2877fn−4 − 475fn−5 ]

É importante ressaltar que o erro local do método de Adams-Bashforth


de m multi-passos é da ordem de O(hm+1 ).

1.6.2 Método de Adams-Moulton

O método de Adams-Moulton é similar ao método de Adams-Bashforth


no que se refere aos valores de α0 = −1 e αi = 0, para i = 1, ..., k − 1.
Os valores de β são escolhidos, como anteriormente, para obtermos o maior
grau possı́vel para a expressão de φ(t). Entretanto, aqui temos um método
implı́cito, que é obtido quando levamos em consideração a função f no ponto
sendo examinado (na prática, quando j = −1). Temos abaixo as equações
34 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

para a equação resultando para até os primeiros 5 passos:

m=1 xn+1 =xn + hfn+1


h
m=2 xn+1 =xn + (fn+1 + fn )
2
h
m=3 xn+1 =xn + [23fn − 16fn−1 + 5fn−2 ]
12
h
m=4 xn+1 =xn + [55fn − 59fn−1 + 37fn−2 − 9fn−3 ]
24
h
m=5 xn+1 =xn + [1901fn − 2774fn−1 + 2616fn−2 +
720
−1274fn−3 + 251fn−4 ]
h
m=6 xn+1 =xn + [4277fn − 7923fn−1 +
1440
+9982fn−2 − 7298fn−3 + 2877fn−4 − 475fn−5 ]

O erro local do método de Adams-Moltom de m multi-passos é da ordem


de O(hm+2 ).

1.6.3 Previsão-Correção em Métodos Multi-Passos

Uma forma bastante utilizada de resolução de ODEs consiste em se uti-


lizar um método explı́cito de resolução numérica (por exemplo, o método de
Adams-Bashforth - AB) para se obter uma previsão para o valor de xpi+1 , e
usar este valor em um método implı́cito (por exemplo, o método de Adams-
Moulton - AM) para se obter o valor de xi+1 corrigido. Em geral se utilizam
o método de AB de grau m + 1 em conjunto com o método de AM de grau
m, para que os erros sejam da mesma ordem.

1.6.4 Passo Variável em Métodos Muti-Passos

O esquema da previsão-correção (seção anterior) claramente conduz à


ideia de que a diferença entre o valor predito e o valor corrigido possam ser
usados de alguma forma como uma estimativa do erro corrente, podendo-se
vislumbrar um esquema onde o valor de h possa ser recalculado à medida
que é feita a integração do problema. Em particular, podemos definir o erro
corrente como sendo: p
yi+1 − yi+1


c =
p
,
yi+1

e o novo h seria calculado como descrito na equação (1.34). Vale ressaltar


que utilizar um passo variável em um método multi-passo é custoso compu-
tacionalmente, porque os valores de f devem ser igualmente espaçados, o que
1.7. ERRO NUMÉRICO GLOBAL 35

faz com que todos os valores de fn anteriores tenham que ser recalculados
por outro método, por exemplo RK4.

1.7 Erro Numérico Global

Existem inúmeras possı́veis fontes de erro na resolução numérica de


equações diferenciais ordinárias. Algumas delas têm a ver com a imple-
mentação incorreta do método, ou com possı́veis erros de programação por
parte do usuário. Outra fonte de erro é o já conhecido problema de trun-
camento, que ocorre quando algumas das variáveis utilizadas no método ou
sua variação é menor do que a precisão do tipo de variável utilizado.
Excetuando-se os itens descritos acima, existem ainda os erros locais
e globais. Erros locais são aqueles resultantes do truncamento da série de
Taylor utilizada no cálculo das funções das EDO no tempo/posição seguinte,
em função do tempo/posição atuais, em cada passo da integração da EDO.
Erro global seria o resultado da acumulação dos erros locais, durante a
integração da EDO por uma sequência finita de pequenos deslocamentos de
tempo/posição.
Por exemplo, consideremos um método que possui erro local da ordem
m
O( ). Assim, após uma sequência de n passos esperarı́amos ter um erro
global Errglobal da ordem de:

∆ttotal
Errglobal ∝ n O(hm ) = O(hm ) ∝ O(hm−1 ).
h
Assim sendo, espera-se que o erro global varie com hm+1 quando o erro
local variar com hm .
36 CAPÍTULO 1. EQUAÇÕES DIFERENCIAIS ORDINÁRIAS

1.8 Atividades Sugeridas

1. O decaimento radioativo pode ser modelado pela seguinte expressão:


dN/dt = −λt, onde N é o número de átomos de determinada espécie
radioativa e λ é o chamado coeficiente de decaimento radioativo.

(a) Faça um programa que integre a equação do decaimento radio-


ativo usando o método de Euler explı́cito. Sugestão: Use N0 =
1000, λ = 0.1, ∆t = 5 e integre até um tempo final tf =50. Porque
essa escolha de ∆t?
(b) Com os mesmos parâmetros e usando agora o método de Euler
implı́cito, integre novamente a equação do decaimento radioativo.
(c) Grafique os resultados dos métodos anteriores e compare com a
solução exata N = N0 e−λt . O que você conclui? Como você
interpreta essas diferenças? O que ocorreria se diminuı́ssemos o
intervalo de tempo ∆t? Com base nesses resultados você poderia
propor um método com resultados mais próximos ao analı́tico
com o mesmo passo de tempo?
Referências Bibliográficas

[1] PRESS, WILLIAM H.; TEUKOLSKY, SAUL A.; VETTERLING,


WILLIAM T.; FLANNERY, BRIAM P. Numerical Recipes: The Art of
Scientific Computing. 3a Ed. Nova Iorque:Cambridge University Press,
2007.

[2] SCHERER, CLÁUDIO. Métodos Computacionais da Fı́sica. 2a Ed.,


São Paulo:Livraria da Fı́sica, 2010.

[3] GOULD, H.; TOBOCHNIK, J. An Introduction to Computer Simula-


tion Methods, Addison Wesley, 1997.

[4] ISAACSON, EUGENE.; KELLER, HERBERT BISHOP. Analysis of


Numerical Methods, Nova Iorque:Wiley, 1994.

[5] BURDEN, RICHARD L.; FAIRES, J. DOUGLAS. Numerical Analysis,


9a Ed., Brooks/Cole, 2010.

[6] CREIGHTON, JOLIEN. Lecture Notes for Physics 801: Numeri-


cal Methods, Disponı́vel em: http://www.lsc-group.phys.uwm.edu/
~jolien/Physics-801/Phys-801.pdf. Acesso em 26 de agosto de
2015.

[7] CASH, J. R.; KARP, A. H. ACM Transactions on Mathematical Soft-


ware, vol. 16, pp. 201-222, 1990.

37
38 REFERÊNCIAS BIBLIOGRÁFICAS
CAPÍTULO 2

Mapas

Mapa é um termo utilizado em matemática que pode designar, entre outras


coisas, uma função ou famı́lia de funções cujas propriedades são importantes
para determinado assunto. Entre as mais diversas aplicações de mapas,
aquela mais estudada é sem dúvida o chamado mapa logı́stico.

2.1 Mapa Logı́stico

O mapa logı́stico é uma relação de recorrência muito utilizada para mos-


trar como um comportamento caótico pode surgir mesmo da dinâmica de
equações não-lineares relativamente simples. O mapa foi bastante populari-
zado depois da publicação de um artigo do biólogo Robert May na revista
Nature. Neste artigo, Robert May descreve modelos matemáticos simples
para modelar a dinâmica populacional através de uma escala discreta no
tempo. Matematicamente, o mapa logı́stico pode ser descrito como:

xn+1 = 4λxn (1 − xn ). (2.1)

Esta equação não-linear tenta descrever dois efeitos populacionais:

• reprodução, onde a população aumenta a uma taxa proporcional à


população atual, para tamanhos populacionais pequenos;

• decréscimo ou mortalidade da população para tamanhos populacionais


maiores, onde a taxa de mortalidade depende do tamanho atual.

Entretanto, para que a equação (2.1) tenha significado real, os valores


de x não podem ser negativos. Para tanto, o domı́nio da equação que pode

39
40 CAPÍTULO 2. MAPAS

ser utilizado para os estudos populacionais tem que estar restrito à região
[0,1].
A equação (2.1) têm as caracterı́sticas mencinadas nos items acima, uma
vez que o crescimento populacional é proporcional ao tamanho atual da
população (xn+1 ∝ xn ), ao mesmo tempo em que há um decrécimo da
população para valores populacionais altos (xn+1 ∝ (1 − xn )).
O comportamento geral da equação (2.1) pode ser visto na figura (2.1).

0.4
λ = 0.4

0.35

0.3

0.25
xn+1

0.2

0.15

0.1

0.05

0
0 0.2 0.4 0.6 0.8 1
xn

Figura 2.1: Mapa logı́stico, com λ = 0,4.

Algumas caracterı́sticas da equação (2.1) podem ser obtidas facilmente.


Por exemplo, o ponto de máximo da curva f (x) é dado por:

f 0 (x) = 4λ(1 − 2xn ) = 0 → xn = 0, 5,

ou seja, o valor máximo da curva ocorre no meio do intervalo, independen-


temente do valor de λ. O valor máximo da curva f (x) é dado, portanto,
por:
f (x = 0.5) = 4λ 0.5 (1 − 0.5) = λ.
O valor mı́nimo de λ pode ser obtido para xn−1 = 0:

f (x) = 0 = 4λxn (1 − xn ) → λ = 0,

para qualquer xn diferente de zero. O valor máximo de λ pode ser obtido


de maneira análoga, quando xn+1 = 1:

f (x) = 1 = 4λxn (1 − xn ) → λ = 1.

Em geral, se está interessado em qual é o valor assimptótico para o qual


x converge, após um intervalo de tempo grande.
2.2. ESTABILIDADE PARA λ < 0, 25 41

2.2 Estabilidade para λ < 0, 25

Pode-se mostrar facilmente que x = 0 é uma solução assimptótica da


equação do mapa logı́stico para qualquer valor inicial x0 , quando λ é menor
do que 0,25. Isto ocorre porque a equação do mapa logı́stico pode ser re-
arranjada como:
xn+1 = xn [4λ] [(1 − xn )] , (2.2)
e as duas quantidades entre colchetes têm valores no intervalor [0,1], o que
faz com que o valor de xn+1 diminua assimptóticamente de qualquer valor
inicial até zero. A figura (2.2) ilustra este fato ao mostrar o valor de xn para
valores incrementais de tempo, tendo diferentes valores iniciais e diferentes
valores de λ
0.9
x0 = 0.1; λ = 0.1
x0 = 0.5; λ = 0.1
x0 = 0.9; λ = 0.1
0.8 x0 = 0.1; λ = 0.2
x0 = 0.5; λ = 0.2
x0 = 0.9; λ = 0.2
0.7

0.6

0.5
xn

0.4

0.3

0.2

0.1

0
0 2 4 6 8 10
tempo

Figura 2.2: Mapa logı́stico em função do tempo discreto t para valores


iniciais x0 = 0, 1; 0, 5 e 0, 9 e λ = 0,1 e 0,2.

Portanto, x = 0 é um ponto-fixo da equação do mapa-logı́stico. Podemos


testar a estabilidade deste ponto-fixo: para que ele seja estável temos que
|f 0 (x = 0)| < 1, ou seja:

|f 0 (x = 0)| = |4λ[1 − 2(0)]| < 1,

ou seja, λ < 0, 25 para que tenhamos a estabilidade.

2.3 Estabilidade para 0, 25 < λ < 0, 75


42 CAPÍTULO 2. MAPAS

Para os casos em que λ é maior do que 0,25 mas menor do que 0,75,
a solução assimptótica de xn+1 varia sucessivamente para valores cada vez
maiores de x. Isto pode ser visto na figura (2.3), onde temos a representação
dos valores de xn+1 para alguns valores de x0 e λ, dentro do limite descrito
acima.
0.6

0.55

0.5

0.45

0.4
x0 = 0.1; λ = 0.3
x0 = 0.25; λ = 0.3
x0 = 0.5; λ = 0.3
xn

0.35 x0 = 0.1; λ = 0.6


x0 = 0.25; λ = 0.6
x0 = 0.5; λ = 0.6
0.3

0.25

0.2

0.15

0.1
0 2 4 6 8 10
tempo

Figura 2.3: Mapa logı́stico em função do tempo discreto t para valores


iniciais x0 = 0, 1; 0, 5 e 0, 9 e λ = 0,3 e 0,6.

Podemos testar a estabilidade destes pontos fixos através do sistema:



x = x 4λ (1 − x)
(2.3)
1 > |4λ(1 − 2x)|

Podemos isolar λ na primeira equação (λ = 1/[4(1 − x)]), e substituir na


segunda, resultando em:
(1 − 2x)
(1 − x) < 1. (2.4)

Daı́ temos dois casos: quando o termo à esquerda é positivo ou negativo.


No primeiro caso é fácil de se mostrar que só teremos solução quando:
 
1
x = 0; λ = .
4

Este é justamente o caso limite superior de x = 0. Quando o termo à


esquerda da equação (2.4) for negativo, teremos:

(1 − 2x)
< −1,
(1 − x)
2.4. λ > 0,75 E O LIMITE CÍCLICO 43

que resulta, depois de um pouco de álgebra, em:


 
2 3
x< ; λ< .
3 4

Em resumo, com λ entre 0,25 e 0,75, teremos que xn+1 tende assimptóticamente
a valores cada vez maiores de x, entre 0 e 2/3. Estes valores de x são pontos-
fixos estáveis. Os valores dos pontos fixos podem ser facilmente encontra-
dos de forma gráfica, pois eles se encontram na intersecção entre as curvas
xn+1 = xn 4λ(1 − xn ) e xn+1 = xn (já que quando xn+1 = x os próximos
valores de x serão sempre iguais). Por exemplo, a figura (2.3) mostra os
gráficos correspondentes para λ = 0, 6. Podemos ver graficamente que o va-
lor assimptótico está ao redor de 0,58. O valor numérico pode ser facilmente
encontrado por:

1 = 4(0, 6)(1 − x) → x = 7/12 ∼ 0, 58333...

2.4 λ > 0,75 e o Limite Cı́clico

Para valores de λ maiores do que 0,75, vemos que não ocorre um ponto-
fixo estável, conforme mostrado na seção anterior. Entretanto, podemos
procurar por pontos fixos de ordem maior, em outras palavras, podemos
procurar por valores de x que se repetem de forma cı́clica mas não con-
secutiva. Por exemplo, pontos-fixos de segunda ordem são pontos em que
xn+2 = xn . O valor de xn+2 ≡ f (f (x)) é dado por:

f (f (x)) = [xn 4 λ(1 − xn )] 4λ {1 − [xn 4λ (1 − xn )]} = 16(1−xn )xn λ2 (1−4(1−x)xλ).

Os pontos fixos de segunda ordem que são encontrados ao se resolver a


equação acima são visitados ciclicamente no limite assimptótico. Matema-
ticamente, para calcularmos os pontos fixos de segunda ordem temos que
resolver o seguinte sistema de equações:

x = f (f (x))
(2.5)
1 > |f 0 (f (x))|

Pode-se mostrar que a única solução do sistema acima que tem relevância
para √
o caso especı́fico do estudo do mapa logı́stico mostra que 0, 75 < λ <
(1 + 6)/4 = 0, 86237.
A figura (2.4) mostra o plot de xn+1 para x0 = 0, 25 e λ = 0, 8, mostrando
a repetição cı́clica dos valores assimptóticos de xn para grandes valores de
t.
A figura (2.5) ilustra a obtenção gráfica dos dois valores assimptóticos de
x para o caso em que λ = 0, 8. Note que há um terceiro ponto-fixo (entre os
44 CAPÍTULO 2. MAPAS

0.9

0.8

0.7

0.6
xn

0.5

0.4

0.3

x0 = 0.25; λ = 0.8
x0 = 0.25; λ = 0.88
0.2
0 2 4 6 8 10
tempo

Figura 2.4: Mapa logı́stico em função do tempo discreto t para valores


iniciais x0 = 0, 25 e λ = 0,8 e 0,88.

dois valoes extremos) que corresponde ao caso em que temos ponto-fixo de


primeira ordem f (x) = x. Os valores assimptóticos de x neste caso, obtidos
matematicamente, são 0,513045 e 0,799455.
Podemos continuar procurando por ciclos maiores. Por exemplo, um
ponto-fixo de 4 ciclos surge quando f (f (f (f (x)))) = x. Pode-se mostrar
que este ponto-fixo se torna instável para λ > 0, 886023. Já o ponto-fixo de
8 ciclos se torna instável para λ > 0, 891102.
De maneira geral, podemos notar que à medida que λ aumenta à partir
de 0,75:
• o número de ciclos visitados pelo mapa logı́stico aumenta gradativa-
mente;
• o transiente necessário para que se estabeleça o ciclo também aumenta
paulatinamente;
• a bifurcação do número de ciclos ocorre cada vez para variações me-
nores de λ.

2.5 λ > 0, 89 e o Limite Caótico

Conforme visto na seção anterior, espera-se que à medida que λ se apro-


xima de 1, tanto o número de ciclos quanto o transiente até o ponto-fixo
aumentem cada vez mais. Este comportamento pode ser observado na fi-
gura (2.6).
2.6. MAPAS DE TEIA E MAPAS DE PRIMEIRO RETORNO 45

0.8

0.6
yn+1

0.4

0.2

f(xn) = 4 λ xn (1 - xn)
x
f(f(xn))
0
0 0.2 0.4 0.6 0.8 1
xn

Figura 2.5: Mapa logı́stico em função do tempo discreto t para λ = 0, 8.


Também estão ilustradas as curvas y = x e y = f (f (x)). Podemos notar a
presença de um ponto-fixo de primeira-ordem instável (que ocorre quando
f (x) = x = 0, 6875, na intersecção entre as 3 curvas) e dois pontos fixos de
segunda ordem (que ocorrem em f (f (x)) = x = 0, 513045 e 0, 799455, que
ocorrem na interseção de f (f (x)) e y = x).

Note o aumento da complexidade do comportamento à medida que λ >


0, 89. É bastante visı́vel o momento em que o tamanho dos ciclos dobra à
medida que λ aumenta, até atingirmos um transiente caótico.
Em particuar, os valores de λ em que o perı́odo dobra formam uma série
cujos primeiros números são:

1 3 1+ 6
λ0 = ; λ1 = ; λ2 = ; λ4 = 0, 8860; ...
4 4 4
Valores sucessivos de (λk − λk−1 ) formam uma progressão geométrica de
forma que podemos definir:

λk − λk−1
δF = lim = 4, 6692... (2.6)
k→∞ λk+1 − λk

onde δ é conhecida como constante de Feigenbaum. Esta constante é conside-


rada “univesal” e aparece em diversas séries, não somente no mapa logı́stico.

2.6 Mapas de Teia e Mapas de Primeiro Retorno


46 CAPÍTULO 2. MAPAS

0.9

0.8

0.7

0.6
xn+1

0.5

0.4

0.3

0.2

0.1

0
0.7 0.75 0.8 0.85 0.9 0.95 1
λ

Figura 2.6: Valores assimptóticos de x para diferentes valores de λ. O


gráfico apresenta os últimos 400 pontos calculados por λ, depois de calcular
700 pontos. Os valores de λ variam de 0,72 até 1, em uma malha de 400
valores.

Uma maneira de se visualizar a dinâmica dos valores de x é através dos


chamados mapas de teia. Neste caso, plotamos o gráfico da função logistica
(2.1) e da função y = x. Os gráficos do tipo teia são construı́dos unindo-se
os seguintes pontos (x, y):

x0 0
x0 x1
x1 x1
x1 x2
x2 x2
x2 x3
...,

conforme pode ser visto na figura (2.7).


Outro tipo de visualização dos resultados do mapa logı́stico é utilizar os
mapas de recorrência. Estes são construı́dos através de uma matriz Mij ,
onde os elementos desta matriz são definidos como:

1, se |xi − xj | < 
Mij = ,
0, em caso contrario
onde  é um número arbitrário pequeno o suficiente. Temos um exemplo do
mapa de recorrência na figura (2.8).
2.7. COEFICIENTE DE LYAPUNOV 47

0.6
f(x) = 4 λ x (1 - x)
y=x
teia de aranha

0.5

0.4
xn+1

0.3

0.2

0.1

0
0 0.1 0.2 0.3 0.4 0.5 0.6
xn

Figura 2.7: Mapa do tipo teia para o valor inicial x0 = 0, 5 λ = 0,2.

2.7 Coeficiente de Lyapunov

A assinatura de um sistema caótico é a sensibilidade quanto às condições


iniciais. Se duas trajetórias iniciam muito próximas entre si, e a distância
delas aumenta com o tempo, se diz que o sistema é caótico. A taxa com que
as distâncias entre duas trajetórias aumenta com o tempo é caracterizada
por uma quantidade chamada expoente de Lyapunov.
Consideremos duas trajetórias que iniciam, correspondentemente, nas
posições x0 e x0 + δ. As duas trajetórias se relacionam através dos valores
de x seguintes: x0 , x1 , x2 , ..., xn e, correspondentemente, x0 + δ, x1 + δ1 , x2 +
δ2 , ..., xn + δn . Assumindo que δn é pequeno, podemos expandir f (x) ao
redor de xn , obtendo:

f (xn + δn ) = f (xn ) + f 0 (xn )δn → xn+1 + δn+1 = xn+1 + f 0 (xn )δn ,

que resulta em:


δn+1 = f 0 (xn )δn .

Podemos utilizar esta forma recursiva para obtermos a razão entre a


distância entre as duas trajetórias após n passos (δn ) e a distância inicial
(δ0 ):
n−1
δn Y 0
= f (xi ) .
δ0
i=0

Assumindo que a quantidade acima varie exponencialmente para valores


48 CAPÍTULO 2. MAPAS

1000
(f(xn) - f(xm)) < 10-5

900

800

700

600
m

500

400

300

200

100

0
0 100 200 300 400 500 600 700 800 900 1000
n

Figura 2.8: Mapa de recorrência para o valor inicial x0 = 0, 5 λ = 0,895.


Neste caso  = 10−5 .

grandes de n, temos:
δn
= e λL n ,
δ0
onde λL é o chamado expoente de Lyapunov, definido como:
n
1 X 0
λL ≡ lim ln f (xi ) . (2.7)
n→∞ n
i=1

Se λL > 0, então as trajetórias vizinhas se distanciam umas das outras


para grandes valores de n e temos o comportamento caótico. Entretanto,
se as trajetórias convergem para um valor fixo ou um limite cı́clico, elas se
aproximam, o que resulta em λL < 0.
Podemos visualizar o coefiente de Lyapunov calculado para alguns valo-
res de λ na figura (2.7). Fica claro pela figura que o comportamento caótico
surge ao redor de 0,9. Pode-se notar que em alguns pontos durante a fase
que ainda não se tornou caótica, a curva do coeficiente se aproxima de zero,
como por exemplo ao redor de 0,75: estes são os pontos de bifurcação do
mapa logı́stico, onde o sistema está na iminência de se tornar caótico, cujo
efeito é removido pela bifurcação. Outro comportamento que pode ser no-
tado pela figura é o fato de haver, memo durante a fase caótica, “ilhas” de
estabilidade, em que o coeficiente de Lyapunov chega a ficar negativo.

2.8 Mapa de Hénon


2.8. MAPA DE HÉNON 49

0.5

0
coeficiente de Lyupanov λL

-0.5

-1

-1.5

-2

-2.5

-3
0.7 0.75 0.8 0.85 0.9 0.95 1
λ

Figura 2.9: Coeficiente de Lyapunov como função de λ. Coeficiente calcu-


lado para x0 = 0.5, para séries até n=700 desprezandando-se os primeiros
300 valores de xn . O coeficiente λ foi calculado para 400 valores diferentes,
igualmente espaçados entre λ = 0,72 e λ = 1.

O mapa não-linear bidimensional mais estudado é sem dúvida alguma


o mapa de Hénon. Ele foi proposto pelo astrônomo francês Michel Hénon
como um protótipo para o estudo de caos em sistemas dinâmicos. Ele é
definido como:
xn+1 = a − x2n + yn (2.8)
yn+1 = b xn , (2.9)
onde a e b são dois parâmetros.
A análise de pontos fixos (x? ; y ? ) é feita utilizando-se a definição de
ponto-fixo:
x? = a − (x? )2 + y ? (2.10)
? ?
y = bx . (2.11)
Este sistema de equações pode ser facilmente rearranjado resultando em
uma equação de segundo grau: (x? )2 + x? (1 − b) − a = 0. A solução desta
equação para x? é:
p
? (b − 1) ± (1 − b)2 + 4 a
x = .
2
Para que tenhamos soluções reais, temos que:
(1 − b)2
a≥− .
4
50 CAPÍTULO 2. MAPAS

2.9 Atividades Sugeridas

1. Calcule os primeiros 20 valores de xn para os seguintes valores de


λ: 0,1; 0,2; 0,3; 0,6 e x0 : 0,1; 0,25 e 0,5 e encontre os valores as-
simptóticos. Grafique as séries em pequenos conjuntos comparando
aquelas que têm o mesmo valor de λ e x0 Compare estes valores com
aqueles esperados pela teoria.

2. Produza os gráficos de xn em função de t, de teia e de recorrência para


λ: 0,89; 0,8925 e 0,895, com x0 = 0,5 e tmax = 1000. Tente encontrar
visualmente as evidências: a) que indiquem o fim da fase de transiente
e b) a fase caótica.

3. Calcule séries com os primeiros 700 valores de xn para 400 diferentes


valores igualmente espaçados de λ começando em 0,72 até 1,0. Ig-
nore os primeiros 300 valores de cada série (supondo que após estes
300 valores a fase transciente já tenha acabado), colocando os outros
400 valores em um arquivo único contendo as seguintes colunas: λ
e xn . Plote e analise o gráfico resultante, identificando visualmente
as bifurcações e a transição entre as fases assimptóticas e caótica. O
gráfico resultante será semelhante ao apresentado na figura (2.6).

4. Utilize o algoritmo da atividade anterior para calcular o valor do ex-


poente de Lyapunov (equação 2.7) em função de λ e da constante de
Feigenbaum (equação 2.6) para o mapa logı́stico.

5. Utilize o mapa de Hénon para plotar o gráfico de x versus y para os


seguines parâmetros (a; b): (0,2; 0,9991), (0,2; -0,999); (1,4; 0,3).

6. Utilize o gnuplot para fazer um filme do mapa de Hénon onde o in-


tervalo de a = {−1 : 1} é varrido em 103 partes com b = −0.999.
Para cada conjunto de parâmetros gere 104 pares x,y desprezando os
1000 primeiros. Para descobrir como gerar o filme de dentro de seu
programa, digite ”help plot special-filenames”no gnuplot e procure por
”plot ’-’ ”.
Referências Bibliográficas

[1] YOUNG, PETER. The Logistic Map. Disponı́vel em: http://


physics.ucsc.edu/~peter/242/logistic.pdf. Acesso em: 26 de
maio de 2015.

[2] CLARK JR, ALFRED. Tent Map. Disponı́vel em: http://www.me.


rochester.edu/courses/ME406/webexamp5/tent.pdf. Acesso em: 26
de maio de 2015.

[3] AL-SHAMERI, WADIA F. H; MAHIUB, MOHAMMED A. Some


Dynamical Properties of the Family of Tent Maps. Disponı́vel
em: http://www.m-hikari.com/ijma/ijma-2013/ijma-29-32-
2013/alshameriIJMA29-32-2013.pdf. Acesso em: 26 de maio de
2015.

[4] STEMLER, THOMAS. Dynamic Systems and Chaos. Disponı́vel


em: http://staffhome.ecm.uwa.edu.au/~00062643/2011/3A7/
Slides8.pdf. Acesso em: 26 de maio de 2015.

51
52 REFERÊNCIAS BIBLIOGRÁFICAS
CAPÍTULO 3

Números Aleatórios e Método de Monte Carlo

Como vimos anteriormente, mesmo sistemas dinâmicos completamente


determinı́sticos podem apresentar comportamento caótico, onde dois sis-
temas diferentes cujo estado inicial sejam muito parecidos, exibem com-
portamento cada vez mais descorrelacionado, de forma que após um certo
intervalo de tempo os dois sistemas apresentam comportamentos completa-
mente diferentes. Em situações reais na natureza, o número de diferentes
variáveis que influenciam o comportamento dinâmico de sistemas, mesmo os
mais simples, é imenso. Caso a influência externa que age sobre um sistema
dinâmico seja importante o suficiente a ponto de modificar o comporta-
mento do sistema e, além disso, caso esta influência externa tenha carácter
estocástico, o resultado do comportamento do sistema dinâmico pode chegar
a ser completamente aleatório. Um exemplo simples é o ato de jogar uma
moeda e verificar se a face que fica voltada para cima é cara ou coroa. Po-
derı́amos, a princı́pio, imaginar que caso se conhecessem todas as forças que
agem sobre a moeda no momento do lançamento, seria possı́vel se conhecer
o resultado de determinada jogada. Entretanto, o atrito com o ar, as forças
que agem sobre a moeda no momento que a mesma toca o solo, as variações
mı́nimas na força do dedo que dá o empurrão na moeda, enfim todos estes
efeitos combinamos fazem com que a probabilidade de que tenhamos cara
ou coroa seja, respectivamente, de 50% e 50% ou algo muito próximo disto
dependendo das caracterı́sticas fı́sicas da moeda.

3.1 Sequências de Números Aleatórios

53
54CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO

Uma sequência de números x1 , x2 , ... é dita aleatória ou randômica quando


duas propriedades básicas são observadas: uniformidade e independência.
A uniformidade indica que os números da sequência são obtidos através
de uma função de probabilidade uniforme f (x):

1, xmin ≤ x ≤ xmax
f (x) =
0, outro valor,

entre os valores limites da série xmin e xmax ; como exemplo tı́pico podemos
considerar números aleatórios reais gerados entre 0 e 1.
A propriedade de independência ocorre quando a sequência de números
é completamente aleatória, ou seja, um dado valor xi pode ser escolhido
com igual probabilidade dentro do intervalo xmin e xmax independente dos
valores anteriores da série xi−1 , xi−2 , ...

3.1.1 Caracterı́sticas de Geradores de Números Aleatórios

O método mais simples de gerar uma sequência de números aleatórios


é através do chamado gerador congruente. Neste tipo de algoritmo, deter-
minado número aleatório é gerado através de uma função cujos argumentos
são os últimos números aleatórios gerados anteriormente:

xi+1 = f (xi , xi−1 , ...). (3.1)

Por este motivo, costuma-se dizer que os números aleatórios gerados a par-
tir de um gerador congruente são, na verdade, pseudo-aleatórios. Alguém
que saiba o algoritmo utilizado na geração dos números aleatórios poderá,
conhecendo também a série de números gerados anteriormente, conhecer
também os próximos valores da série. Entretanto, esta é uma caracterı́stica
benéfica em determinados contextos, por exemplo na simulação computaci-
onal que utiliza números aleatórios na atribuição de variáveis especı́ficas e
onde deseja-se repetir a simulação e verificar o resultado de pequenas modi-
ficações quando a mesma série de números é utilizada nas duas versões. Caso
as duas séries utilizadas fossem diferentes seria praticamente impossı́vel de
se verificar se os resultados observados na simulação são causados pelas mu-
danças feitas no algoritmo ou pelo fato de se utilizar outra série de números
aleatórios.
Uma caracterı́stica facilmente verificável é que, uma vez que o i-ésimo
número da sequência depende exclusivamente do números gerados anterior-
mente - e muitas vezes depende somente do (i − 1)-ésimo número gerado
-, teremos a partir de determinado ponto a repetição de, pelo menos, parte
da série gerada. Dito de outra maneira, embora possamos gerar uma série
infinita de números aleatórios segundo a equação (3.2), a série terá repetição
cı́clica de comprimento C. A distância L = i − 0, entre os números xi e x0 ,
3.1. SEQUÊNCIAS DE NÚMEROS ALEATÓRIOS 55

compreende o que se chama de cauda, que é a região transiente da série que


ocorre antes que ocorra o primeiro número que caracteriza o inı́cio dos ciclos
periódicos. Assim, chama-se de perı́odo de uma série aleatória a distância
L + C.

cauda L=3
z }| {
{X} = 3, 5, 2, 1, 9, 8, 7, 1, 9, 8, 7, 1, ...
| {z }
região cíclica C=4

Figura 3.1: Sequência de números aleatórios entre 1 e 9, mostrando a região


da cauda, a região cı́clica. O perı́odo desta sequência é L + C = 7.

Existem caracterı́sticas desejáveis aos geradores utilizados em computação:

1. o gerador deve ser simples o suficiente para que seu algoritmo possa
ser facilmente implementado e não tome muito tempo computacional
para que possa ser executado, uma vez que, dependendo da aplicação,
milhões ou mais números aleatórios deverão ser gerados;

2. o perı́odo do gerador deve ser grande o suficiente para que dentro


de determinada aplicação nunca se atinja o fim do perı́odo. Caso
isto ocorra, costuma-se considerar que o gerador perde sua utilidade
para esta dada aplicação. Isto ocorre pois os números gerados serão
repetitivos, fazendo com que ocorram padrões na simulação, podendo
influenciar resultados e gerando falsos resultados;

3. os valores sucessivos da sequência devem ser independentes e dis-


tribuı́dos de maneira uniforme.

3.1.2 Geradores Linear de Números Aleatórios Congruentes

No caso mais simples, a função (3.1) depende somente do último número


aleatório gerado (xi ). O exemplo mais utilizado deste tipo de função é:

xi+1 = (a xi + b) mod m, (3.2)

onde a, b e m são números naturais e (w mod z) é a operação que retorna


o resto da divisão entre os números w e z.
Pode-se verificar facilmente que os números da sequência gerada são
inteiros e dados pela equação (3.2), distribuı́dos no intervalo [0; m-1]. Para
que os números aleatórios gerados estejam no intervalo [0; 1], basta que os
números gerados sejam divididos por m.
56CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO

Verifica-se que do ponto de vista de eficiência computacional de um ge-


rador de números aleatórios do tipo congruente linear devemos observar as
seguintes recomendações:

• o módulo de m deve ser grande, uma vez que quanto maior m, maior
será o possı́vel perı́odo do gerador;

• para que a computação de (mod m) seja eficiente, m deve ser uma


potência de 2, ou seja, m = 2k , onde k é um número natural;

• se b for diferente de zero, o máximo perı́odo possı́vel será obtido se, e


somente se:

– todo número inteiro que é fator de m, também é fator de a − 1;


– a-1 é múltiplo de 4, se m é múltiplo de 4;

Todas estas exigências são obtidas no caso em que a = 2k , a = 4 c + 1 e


b = d, onde k e c são números inteiros positivos e d é um número ı́mpar.
Há um problema grave relacionado com qualquer gerador de números
aleatórios congruentes lineares, uma vez que há uma forte tendência de cor-
relação entre dois valores sorteados consecutivamente. Esta correlação pode
ser observada se fizermos um gráfico onde graficamos no eixo das ordena-
das o i-ésimo número aleatório sorteado e no eixo das absissas colocarmos
o (i + 1)-ésimo número aleatório sorteado. Este tipo de gráfico produz um
padrão de linhas paralelas que depende dos valores de a, b e m escolhidos:
quanto mais compacta for a malha de linhas melhor é o gerador de números
obtido.
Outro problema que imediatamente fica evidente é o fato de que, depen-
dendo da combinação de valores de a e xi , a multiplicação destes números
na equação (3.2) poderá ser maior do que valor máximo do tipo de variável
utilizada, o que seguramente pode causar problemas na distribuição dos
números aleatórios utilizadas. Este problema é evitado na implementação
do algoritmo de Schrage, descrito abaixo.

3.1.3 Método de Schrage

O método de Schrage consiste em substituir a expressão (3.2), com b =


0, por:
(
a(xi mod q) − r int( xqi ), se ≥ 0
(axi ) mod m = xi (3.3)
a(xi mod q) − r int( q ) + m, senão,

usando para isto o fato de que m pode ser fatorado da seguinte maneira:

m = a q + r,
3.2. HISTOGRAMAS E A DENSIDADE DE PROBABILIDADE 57

onde r = m mod a e q = int(m/a). O método clássico de Schrage utiliza


as constantes a = 16807, m = 2147483647, q = 127773 e r = 2836. Este
gerador possui perı́odo de 231 − 2 ∼ 2.1 × 109 . Há, entretanto, um problema
com este gerador no fato de que uma vez que um valor pequeno é previamente
sorteado, o próximo número aleatório terá valor menor do que a média.

3.2 Histogramas e a Densidade de Probabilidade

Nesta seção veremos a relação entre histogramas e a definição de densi-


dade de probabilidade.

3.2.1 Histogramas

Considere que estamos medindo uma propriedade qualquer X de um con-


junto de objetos como, por exemplo, a velocidade dos carros que atravessam
determinado cruzamento. Suponha que N seja o número total de medidas
realizadas. Uma forma de organizar este conjunto de dados é através da
criação de um histograma h. Para tal fim, definimos inicialmente os ex-
tremos do histograma, ou seja, o valor mı́nimo Xmin e máximo Xmax da
propriedade medida (por exemplo, dois valores que sejam, respectivamente,
menor e maior do que as velocidades mı́nimas e máximas medidas). Em
seguida, definimos a quantidade M de intervalos que constituirão o histo-
grama. Agora basta distribuir os N valores medidos da variável X nos M
intervalos do histograma. Em outras palavras, para o i-ésimo intervalo do
histograma, h(i), basta contar quantos valores do conjunto de medidas estão
entre Xi e Xi+1 , onde:
Xi = Xmin + i ∆x,
e
Xi+1 = Xmin + (i + 1) ∆x,
com ∆x igual a:
xmax − xmin
∆x = .
M
A probabilidade P (Xi ) de que uma das N medidas em particular, esco-
lhida ao acaso, esteja no i-ésimo intervalo h(i) é dada por:
h(i)
P (Xi ) = (3.4)
N
O valor médio < X > das variáveis medidas pode ser facilmente encon-
trado:
N
1 X
< X >= Xj ,
N
j=1
58CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO

onde a soma é realizada sobre todas as N partı́culas. Entretanto, a mesma


média poderia ser igualmente realizada sobre todos os M intervalos do his-
tograma h:
M
1 X
< X >= h(i) Xi . (3.5)
N
i=1

uma vez que pode ser facilmente visto que:


N
X M
X
Xj = h(i) Xi .
j=1 i=1

Mesmo correndo o risco de sermos repetitivos, vale a pena lembrar que o


somatório no lado esquerdo da equação acima é realizado sobre todas as N
medidas, enquanto que o somatório no lado direito é realizado sobre todos
os M intervalos do histograma.
A equação (3.5) pode ser re-escrita, usando-se a definição (3.4), como:
M M
X h(i) X
< X >= Xi = P (Xi ) Xi . (3.6)
N
i=1 i=1

De maneira análoga, podemos verificar facilmente que:


N M
1 X 2 X
< X2 > = Xj = P (Xi ) Xi2 . (3.7)
N
j=1 i=1

De maneira geral temos, para um dado valor k:


M
X
< X k >= P (Xi ) Xik . (3.8)
i=1

Neste caso, diz-se que < X k > representa o k-ésimo momento da distri-
buição para os valores de X.

3.2.2 Densidade de Probabilidade

Considere uma função f (x) com a seguinte caracterı́stica:


Z xf
f (x) dx = 1 (3.9)
x0

e sob a condição de que

f (x) ≥ 0, para x0 ≤ x ≤ xf ,
3.2. HISTOGRAMAS E A DENSIDADE DE PROBABILIDADE 59

onde x0 e xf são os pontos iniciais e finais da integração. A partir desta


definição, tem-se que a probabilidade P (x) de f ser encontrada dentro do
intervalo infinitesimal [x; x + dx] é dada por:

P (x) = f (x) dx,

para x0 ≤ x ≤ xf . Como consequência, a probabilidade P ([a; b]) de f estar


entre dois valores quaisquer a e b é dada por:
Z b
P ([a; b]) = f (x) dx (3.10)
a

para x0 ≤ (a, b) ≤ xf e a ≤ b. Uma função f com as caracterı́sticas


acima recebe o nome de função densidade de probabilidade (FDP).
Considere agora uma dada função unidimensional bem comportada g(x),
com
g(x) ≥ 0, para x0 ≤ x ≤ xf .
Esta função pode ser transformada em uma função densidade de probabili-
dade f dp(x) entre os dois limites x0 e xf , através da equação:

g(x)
f dp(x) = , (3.11)
N
onde a normalização N é dada por:
Z xf
N = f (x0 )dx0 . (3.12)
x0

Das definições (3.11) e (3.12), fica claro que a função f dp(x) obedece à
definição (3.9), sendo consequentemente uma função densidade de probabi-
lidade também.
Adicionalmente, definimos a função densidade cumulativa (FDC) f dc(x)
como sendo: Z x
f dc(x) ≡ f dp(x0 ) dx0 . (3.13)
x0

Fica claro pela definição acima que para x0 ≤ x ≤ xf temos que 0 ≤ f dc(x) ≤ 1.

3.2.3 Relação entre histogramas e FDPs

Histogramas e funções densidade de probabilidade são definições que


estão intimamente ligadas. Imagine que estamos criando um histograma h
a partir de um número N de medidas de determinada propriedade de um
grupo numeroso de objetos. Este conjunto de medidas é especificado por
X = {X1 , X2 , ..., XN }. Considere que esta propriedade medida não é ne-
cessariamente a mesma para todos os corpos, mas segue uma distribuição f
60CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO

que pode ser, a princı́pio, desconhecida do indivı́duo que as realiza. Assim,


o conjunto {X} é uma coleção de números aleatórios que seguem a distri-
buição f . Podemos construir um histograma h, com M partições, a partir
deste conjunto de medidas. A partir da equação (3.4) podemos ver que a
probabilidade P (Xi ) de medirmos o valor Xi para este conjunto de N medi-
das é dado por h(Xi )/N . Desde já fica claro que a função P (Xi ) obedece às
condições necessárias para ser classificada como uma FDP e, em particular,
obedece à equação (3.11). Podemos imaginar o caso limite em que o número
de medidas é infinitamente grande, de maneira que P (Xi ) ficará cada vez
mais semelhante à f . Podemos tomar um segundo caso limite, em conjunto
com o primeiro, é considerarmos o número M de divisões do histograma
h infinitamente grande. Neste caso, com estas duas condições, podemos,
finalmente, considerar que:
h(i)
P (Xi ) = lim = f (Xi ) dx.
M,N →∞ N
Assim, temos que a média < x > é dada por:
Z xmax
< x >= x f (x) dx
xmin

e, portanto, < xk >, com k sendo um valor inteiro é:


Z xmax
< xk >= xk f (x) dx.
xmin

Exemplo
Imaginemos que exista em uma sala um número grande de pessoas. A
tabela (3.1) apresenta o número de pessoas que possuem determinada idade:
Podemos calcular a idade média (< idade >) das pessoas através da sala
através das seguintes relações:
7
15 + 15 + 16 + ... + 21 1 X
< idade >= = ni × (idade)i , (3.14)
30 N
i=1

onde N é a normalização, que neste caso é o número total de pessoas (30),


e ni é o número de pessoas com idade dada pelo ı́ndice i e (idade)i é a idade
dada pelo ı́ndice i.
A equação acima pode ser re-escrita como:
7 7
X ni X
< idade >= × (idade)i = Pr(idade)i × (idade)i , (3.15)
N
i=1 i=1

onde Pr(idade)i é a probabilidade de determinada pessoa ter a idade (idade)i


no recinto acima. A resposta é 18,1 anos.
3.2. HISTOGRAMAS E A DENSIDADE DE PROBABILIDADE 61

ı́ndice número de pessoas idade Pr(idade)


1 2 15 2/30
2 3 16 3/30
3 5 17 5/30
4 8 18 8/30
5 6 19 6/30
6 4 20 4/30
7 2 21 2/30

Tabela 3.1: Tabela contendo o número de pessoas que contém determinada


idade em um dado recinto hipotético. A última coluna refere-se à probabi-
lidade uma pessoa qualquer escolhida ao acaso neste recinto de ter a idade
especificada na segunda coluna. Esta probabilidade é obtida através da
equação 3.11.

De forma análoga, caso quiséssemos calcular a idade quadrática média


< idade2 > poderı́amos usar:
7
152 + 152 + 162 + ... + 212 1 X
< idade >= = ni × (idade)2i , (3.16)
30 N
i=1

que pode ser re-escrito como sendo:


7 7
2
X ni 2
X
< idade >= × (idade)i = Pr(idade)i × (idade)2i . (3.17)
N
i=1 i=1

O resultado é o valor de 330,1.


Podemos encontrar a dispersão dos valores da idade σ, também conhe-
cido como desvio padrão, através da equação:
p
σ = < x2 > − < x >2 (3.18)

Para o presente caso:


p p
σ = < idade2 > − < idade >2 = 330, 1 − 18, 12 ∼ 1, 578.

3.2.4 Números Aleatórios Segundo uma Distribuição

Podemos notar facilmente que a função cumulativa f dc(x) de f dp(x)


entre x0 e um valor qualquer de x no intervalo [x0 ; xf ] é dada por:
Z x
1
f dc(x) = f dp(x0 )dx0 , (3.19)
N x0
62CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO

sendo f dc(x) um número real no intervalo [0; 1]. Isto nos habilita, a princı́pio,
a realizarmos a operação inversa, ou seja, a partir de um número real
R = f dc(x) no intervalo [0; 1] podemos determinar através da inversão da
equação (3.19) o valor correspondente de x. O lado prático desta inversão
é que os valores de x obtidos desta forma seguem a mesma distribuição de
f (x).

Exemplo: Distribuição Uniforme Generalizada


Imaginemos que um caminhante aleatório siga uma distribuição uni-
forme entre [−10 : 10]. Podemos, à partir de um gerador uniforme que gera
números R independentes e aleatórios entre [0 : 1], gerar os números x desta
distribuição se:
x = (R − 0, 5) 20, 0.

Exemplo: Distribuição Gaussiana


É bastante conhecido o fato de que podemos gerar números aleatórios
segundo uma distribuição Gaussiana através do seguinte esquema, chamado
de transformação de Box-Muller[5]. Se U0 e U1 são dois números aleatórios
independentes gerados segundo uma distribuição uniforme no intervalo [0 :
1], podemos gerar dois números aleatórios Z0 e Z1 independentes gerados
segundo uma distribuição Gaussiana segundo as expressões:
p
Z0 = −2 ln U1 cos(2πU2 ),
e p
Z1 = −2 ln U1 sin(2πU2 ).

Exemplo: Distribuição Senoidal


Caso seja necessária a geração de números aleatórios segundo uma dis-
tribuição senoidal
f (x) = sin(x),
no intervalo [0,π] podemos utilizar o método descrito na seção anterior. Para
isto calculamos primeiramente a normalização N :
Z π
N = sin(x)dx = − cos(x)|π0 = 1 + 1 = 2,
0

Assim a função cumulativa é dada por:


1 x
Z
f dc(x) = sin(x0 )dx0 = − cos(x) + cos(0) = R.
2 0
Portanto, o número aleatório x gerado segundo a função distribuição sin(x)
encontrado a partir do número aleátório R gerado através de uma distri-
buição uniforme é dado por:
x = cos [1 − 2R]−1 .
3.3. RESOLUÇÃO DE INTEGRAIS POR MONTE CARLO 63

Exemplo: Distribuição Triangular


Imagine que temos a seguinte função:

2x, 0≤x≤5
f (x) =
10 − 2(x − 5), 5 ≤ x ≤ 10.

Podemos calcular facilmente a normalização N = 2×(5∗10/2) = 50. Temos


para a primeira parte de f (x):

1 1 02 x
Z x  
1 0 0 1
f dc(x) = R = 2x dx = 2x = x2 ,
50 0 50 2 0 50
que resulta em: √
x= 50R 0 ≤ R ≤ 0, 5.
A segunda parte pode ser escrita como:
Z 5 Z x 
1 0 0 0 0
f dc(x) = R = 2x dx + 10 − 2(x − 5) dx ,
50 0 5

que é igual a:
1  x
25 + 20x0 − x02 5

f dc(x) = R =
50
que resulta em:

x2 − 20x + (50R − 25 + 100 − 25) = 0,

cuja solução é: p


20 ± 400 − 200(R + 1)
x=
2
Assim as equações que definem como os valores de x podem ser sorteados
é calculada como sendo:
 √
50R, p 0 ≤ R ≤ 0, 5
x= 1
2 20 − 200(1 − R)], 0.5 ≤ x ≤ 1.

3.3 Resolução de Integrais por Monte Carlo

O método de Monte Carlo para a resolução numérica de integrais consiste


em se realizar a seguinte substituição:
Z xf
f (x0 )dx0 ≡ I = (xf − x0 )E[f (X)], (3.20)
x0

onde E[f (x)] é o valor esperado da função f (x) no intervalo de integração


[x0 , xf ]. A determinação do valor esperado da função pode ser realizada de
acordo com diferentes estratégias, descritas a seguir.
64CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO

3.3.1 Método 1: Amostragem Uniforme

Este método é bastante intuitivo. Considere uma função f (x) conhecida


na qual se deseja calcular sua integral dentro do intervalo [x0 ; xf ]. Con-
sidere agora que definimos dois valores de y: ymin e ymax menor e maior,
respectivamente, do que os valor mı́nimo e máximo de f (x) dentro do inter-
valo [x0 ; xf ]. Desta maneira os valores de x0 ,; xf , ymin e ymax formam uma
região retangular na qual f (x) está contida. Considere agora que são gerados
aleatoriamente N pontos dentro desta região retangular, cada ponto tendo
coordenadas {xi ; yi }. Para cada ponto gerado, verificamos se o mesmo se
encontra na região entre f (x) e o eixo das coordenadas de tal forma que dos
N pontos gerados, um total de S se encontram nesta região. Se os pontos
gerados foram sorteados de maneira que se possa considerar aleatória, é de
se esperar que a integral de f (x) na região analisada seja proporcional à S,
na mesma medida em que a área da região retangular seja proporcional à
N. Matematicamente:
Z xf
S
f (x0 )dx0 = lim [(xf − x0 )(ymax − ymin )] ,
x0 N →∞ N

onde a quantidade entre colchetes é a área da região retangular.

3.3.2 Método 2: Amostragem Seletiva

Considerando ainda a integral I (eq. 3.20), o valor esperado de f (x)


pode ser inferido a partir do valor médio µ̃N calculado como:
N
1 X
E[f (x)] ∼ µ̃N = f (Xi ), (3.21)
N
i=1

onde Xi são números aleatórios sorteados dentro do intervalo [x0 , xf ]. Calcula-


se a integral por Monte Carlo através da expressão:
I = (xf − x0 ) µ̃N .
O problema com o método acima é ser limitado a intervalos de integração
finitos e ser ineficiente ao varrer com números aleatórios regiões onde o
integrando é pequeno e pouco contribui para o valor final da integral. Uma
forma de otimizarmos o tempo de cálculo de I é sortearmos valores de f (x)
que estejam próximos ao valor médio da função no intervalo de integração.
Para tanto utiliza-se uma distribuição p(x) que, guardadas as proporções,
mimetize o integrando.
Podemos transformar a integral I de uma função f (x) da seguinte ma-
neira: Z xf Z xf  
f (x)
I= f (x)dx = p(x)dx.
x0 x0 p(x)
3.4. CAMINHANTE ALEATÓRIO 65

Imaginemos uma versão discretizada simples dessa integral e tomemos


o intervalo de integração [xi , xf ] dividido em M partes de mesmo tamanho
x −x
∆x = fM i ,
M
X f (xi )
I∼ p(xi )∆x ; i = 1, M
p(xi )
i=1

O termo p(x)∆x representa a probabilidade de que um número aleatório


seja sorteado no intervalo [x, x + ∆(x)] ou, em se tratando de um gerador
de números aleatórios, o número de vezes h(xi ) que um número aleatório xi
é sorteado após N tentativas, ou seja,

p(xi )∆x = h(xi )/N .


PM
A ideia central do método consiste em se trocar a soma ordenada 1
por uma soma sobre N valores aleatórios de X com distribuição p(X),
N
1 X f (Xi )
I∼
N p(Xi )
i=1

como o gerador vai naturalmente produzir h(xi ) números aleatórios no in-


tervalo [xi , xi +∆x], ao se trocar a soma sobre M pela soma sobre N , restará
apenas o fator 1/N . Se p(X) for escolhida simples o suficiente, é fácil uti-
lizarmos algum método simples de amostragem, por exemplo o método da
transformada inversa, a fim de sortearmos X. Esta tarefa pode ser im-
possı́vel se p(X) não for integrável.
Em resumo, uma boa candidata para função p(x) deve ter as seguintes
caracterı́sticas:
• deve ter maior densidade ao redor da região onde onde o integrando
de I é maior;

• p(x) > 0 para qualquer ponto do domı́nio a ser integrado;

• deve ser suficientemente simples para que uma distribuição aleatória


possa ser facilmente calculada a partir dela.
Até este momento consideramos somente integrais unidimensionais, mas
este método pode ser facilmente estendido para casos multi-dimensionais.

3.4 Caminhante Aleatório

O caminhante aleatório é um sistema onde um objeto pontual realiza pas-


sos aleatórios sucessivos que podem ter comprimento ∆x fixo ou variável,
em passos de tempo ∆t que são, em geral, discretos. Este tipo de sistema
visa simular tanto fenômenos fı́sicos quanto outros observados em sistemas
66CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO

que possuem caracterı́sticas estocásticas. Entre os fenômenos fı́sicos que po-


dem ser simulados pelo caminhante aleatório, podemos citar o movimento
de determinada molécula em um meio gasoso ou lı́quido. Neste caso, se
soubéssemos a posição e velocidade de todas as moléculas que estão no meio
em questão, além da forma precisa do potencial de interação das mesmas
entre si, poderı́amos caso tivéssemos o tempo e a capacidade computaci-
onal para tanto, calcular a trajetória de uma determinada molécula neste
meio. Neste caso, o movimento desta molécula é caracterizado por momen-
tos em que esta viaja com velocidade e direções constantes, quando está
relativamente longe das demais moléculas a ponto de não sofrer influência
do potencial das mesmas; estes momentos são intercalados com colisões com
as demais moléculas onde tanto a velocidade quanto a direção provavel-
mente mudam devido à esta interação. Do ponto de vista de um observador
externo, o comportamento desta molécula é de um caminhante que anda
em linha reta por determinada distância, mudando abrutamente de direção
repetidas vezes, de forma periódica mas aleatória. Outras áreas onde o es-
tudo do caminhante aleatório pode ser aplicado são economia (flutuação
dos preços de ações e de commodities), ecologia (movimento de cardumes de
peixes e de aves quando em grupo) e fı́sica (movimento browniano), entre
outros.

3.4.1 Modelo Discreto Unidimensional

Na presente publicação, estudaremos o caminhante aleatório mais sim-


ples: o caminhante aleatório unidimensional, com passo fixo ∆t = ±l, que
tem igual probabilidade, de 50% ou 0.5, de dar um passo para a direção po-
sitiva do eixo x (o passo será, neste caso +l, e a nova posição xn+1 = xn + l,
onde xn é a posição do caminhante no tempo tn ) quanto de dar um passo
na direção negativa do eixo x (o passo será, neste caso −l, e a nova posição
será xn+1 = xn − l).
Em geral, o caminhante aleatório inicia seu movimento na origem do
eixo x, ou seja, x0 = 0. Assim, no primeiro passo (t1 = ∆t), segundo as
regras acima, o caminhante pode pular tanto para a posição x1 = +l (caso o
passo aleatório tenha sido dado no sentido positivo de x) quanto na posição
x1 = −l (caso o passo aleatório tenha sido dado no sentido oposto). No
passo seguinte as possı́veis configurações do caminhante aleatório aumentam:
caso ele tenha caminhado no sentido positivo de x no primeiro passo, ele
pode dar mais um passo no sentido positivo ficando em x2 = 2l ou dar
um passo no sentido oposto, ficando em x2 = 0; outras possibilidades são
relacionadas com a situação onde o primeiro passo do caminhante tenha
sido no sentido negativo de x, já que neste caso ele pode ficar tanto em
x2 = −2l caso o segundo passo também seja no mesmo sentido, ou ficar em
x2 = 0 caso o segundo passo seja no sentido oposto. Fica claro que depois
3.4. CAMINHANTE ALEATÓRIO 67

de dois passos os únicos lugares poderão estar ocupados são as posições


x2 = −2l, 0, 0, +2l. A posição x2 = 0 está repetida na lista anterior porque
dois caminhos diferentes resultam nesta mesma posição final: o caminhante
dar um passo adiante e outro para trás ou o caminhante dar um passo
inicial para trás e depois um passo para frente. Isto resulta no fato de que
a probabilidade do caminhante retornar à posição original depois de dois
passos é duas vezes maior do que ele dar dois passos adiante, por exemplo.
Todos os passo seguintes seguem a mesma lógica.

20
A
B
C
D
15 E

10

5
xn

-5

-10

-15
0 10 20 30 40 50 60 70 80 90 100
tempo

Figura 3.2: Exemplo de caminhos seguidos por 5 diferentes caminhantes


aleatórios, inicialmente na origem e com igual probabilidade de darem um
salto com l = 1 para frente ou para trás. Foram contabilizados os primeiros
100 passos para cada caminhante

Outro ponto de vista do caminhante aleatório é através do uso do con-


ceito de ensemble, cuja definição é um conjunto virtual formado por, ideal-
mente, um número infinitamente grande de indivı́duos inicialmente idênticos
que visitam todos os possı́veis estados que este sistema pode assumir através
de sua dinâmica intrı́nseca.

3.4.2 Modelo Generalizado

Suponha agora que o caminhante aleatório tenha passo contı́nuo, se-


gundo uma distribuição contı́nua f (x), ou seja, cada passo do caminhante
aleatório é escolhido de acordo com f (x), e o tamanho do passo é determi-
nado segundo a expressão (3.19).
Podemos fazer a análise, assim como no caso discreto, da posição média e
desvio padrão calculado para um ensemble de caminhantes. Vamos estudar
68CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO

o caso em que o passo é determinado segundo uma distribuição gaussiana


na seção abaixo.

3.4.3 Caminhante Aleatório e o Teorema do Limite Central

Suponha um ensemble de N caminhantes aleatórios cuja dinâmica in-


dividual seja dada por uma série de passos aleatórios independentes que
seguem uma distribuição f (x) com média µ e variância σ 2 . O teorema do
limite central diz que para valores grandes de N :
t
X
E[X(t0 )] ∼ N µ,
t0 =0

onde:
X1 (t) + X2 (t) + ... + XN (t)
E[X(t)] = ,
N
e onde Xi (t) é o caminho total percorrido por um caminhante aleatório no
instante t. Além disso, o teorema também diz que os valores de Xi formarão
uma distribuição normal (Gaussiana) ao redor de N µ, com variância dada
por ∼ N σ 2 .

3.4.4 Distribuições Sem Momento Definido

Considere o exemplo de um caminhante aleatório que dá passos segundo


uma distribuição de Cauchy:
1
f (x) = . (3.22)
π(1 + x2 )

Podemos ver facilmente, conforme explicado na seção 3.2.4 que para


gerar números aleatórios X que seguem esta distribuição, à partir de um
gerador de valores R com distribuição uniforme, podemos usar a seguinte
expressão:   
1
X = tan π R + .
2
Os gráficos resultantes mostram que apesar da média temporal da posição
dos caminhantes permanecer próxima de zero, a largura da distribuição di-
fere do que seria esperado para o caso de difusão normal. Isto pode ser
explicado porque a distribuição (3.22) não possui segundo momento defi-
nido.
3.4. CAMINHANTE ALEATÓRIO 69

Atividades Sugeridas

1. Utilize o gerador aleatório congruente linear para calcular os primeiros


200 números pseudo-aleatórios gerados para os seguintes valores: a)
(x0 = 27; a = 17; b = 43; m = 100) b) (x0 = 1, 2, , 3, 4; a = 13;
b = 0; m = 26 ). Para as sequências geradas verifique qual o perı́odo
da mesma.
2. Faça um programa que simule a difusão de M caminhantes aleatórios
em um espaço unidimensional. a) Faça histogramas da distribuição
espacial de 105 caminhantes após 10000 passos quando esses se des-
locarem respectivamente de 1, 2 e 3 unidades de distância a cada
passo de tempo. b) Faça gráficos no gnuplot da distribuição espacial
dos caminhantes. c) Ajuste o logaritmo dos histogramas encontrados
a parábolas do tipo: f (x) = b(x2 ) + log(a). d) Determine o desvio
quadrático médio por passo em cada caso. e) Relacione o valor do
parâmetro b ajustado com a distância percorrida por passo e com o
tempo.
3. Use o método da transformada inversa para encontrar um gerador
de números aleatórios cuja distribuição, p(x), seja dada por p(x) =
A2
x2 +b2
, x{−∞, ∞}. Encontre a relação entre b e A que normaliza a dis-
tribuição. Determine os dois primeiros cumulantes dessa distribuição.
4. Faça um programa que simule a difusão em uma dimensão de M cami-
nhantes de passos contı́nuos. A probabilidade de um passo de tamanho
1 −|x|/λ
x é dada por p(x) = 2λ e , x{−∞, ∞}. Faça um histograma de dis-
tribuição de caminhantes, use λ = 2.
5. Refaça o problema 4 usando o gerador encontrado no problema 3. Use
b = 5.
R∞
6. Use o método de Monte Carlo para calcular −∞ p(x)dx onde p(x) é
definido na questão 3. Use b = 5 e a distribuição de números aleatórios
é uma exponencial como definida na questão 4.
7. Mostre que o k-ésimo momento de uma distribuição uniforme definida
em um intervalo L é dada por < xk >= Lk /(k +1). Faça um programa
que calcule numericamente o resultado obtido no ı́tem anterior.
R3
8. Calcule 0 x3/2 exp(−x) dx através do método de Monte Carlo utili-
zando a função p(x) = A exp(−x) como função de amostragem.
9. Utilize a função p(x)
R π= A exp(−a x) como função de amostragem para
calcular a integral 0 (x2 + cos2 (x))−1 dx. Determine o valor de a que
minimiza a variância da integral.
70CAPÍTULO 3. NÚMEROS ALEATÓRIOS E MÉTODO DE MONTE CARLO
Referências Bibliográficas

[1] FACULDADE DE MATEMÁTICA - PUCRS. Uma Introdução


aos Métodos de Geração de Números e Variáveis Aleatórias para
Aplicações em Simuladores. Disponı́vel em: http://www.pucrs.br/
famat/viali/especializa/mia_ima_fafis/material/ead/outros/
Geracao_de_numeros_e_variaveis_aleatorias.pdf. Acesso em: 25
de maio de 2015.

[2] VIEIRA, CARLOS E. C.; RIBEIRO, CELSO C. de CASTRO


e SOUZA, REINALDO. Geradores de Números Aleatórios. Dis-
ponı́vel em: http://www.dbd.puc-rio.br/depto_informatica/04_
22_vieira.pdf. Acesso em: 25 de maio de 2015.

[3] SOUZA, CRISTÁN. Números Aleatórios. Disponı́vel em: http:


//www.univasf.edu.br/~criston.souza/simulacao/arquivos/6-
Numeros_aleatorios.pdf. Acesso em: 25 de maio de 2015.

[4] PANG, TAO. An Introduction to Computational Physics, Cambridge


University Press, New York, 1997.

[5] WIKIPEDIA. Box-Muller Transform. Disponı́vel em: https:


//en.wikipedia.org/wiki/Box\%E2\%80\%93Muller_transform.
Acesso em: 24 de junho de 2015.

71
72 REFERÊNCIAS BIBLIOGRÁFICAS
APÊNDICE A

Desigualdades

Resolver desigualdades é muito parecido com resolver equações. A idéia


é sempre isolar a variável (x neste capı́tulo) de um lado da desigualade. Para
que isto seja feito, uma ou mais operações matemáticas devem ser realiza-
das simultaneamente nos dois lados da desigualdade. A grande diferença é
que o significado da desigualdade pode mudar frente a algumas operações
especı́ficas. As operações que podem ser realizadas sem mudança no sinal
são:

• adição ou subtração nos dois lados;

• multiplicação ou divisão por um número positivo nos dois lados;

• simplificação em um dos lados.

Vejamos um exemplo:

3x < 3 + 7 (3 + 7 = 10)
3x < 10 (÷3)
x < 10/3

Entretanto, existem operações que invertem o sinal da desigualdade.


Elas são:

• multiplicação ou divisão por um número negativo nos dois lados;

• trocar as equações de lado em relação ao sinal de desigualdade;

• quando pegamos o recı́proco da desigualdade (a > b → 1/a < 1/b).

73
74 APÊNDICE A. DESIGUALDADES

Vejamos outro exemplo:


−8 ≥ −2y (÷(−2))
4≤y (troca de lado)
y ≥ 4.
Quando temos duas desigualdades aplicadas ao mesmo tempo, temos
duas estratégias. Se o caso for simples, com a variável aparecendo em
somente uma das partes, por exemplo, podemos aplicar as operações ne-
cessárias em todas as partes da desigualdade a fim de isolarmos a variável.
Em casos mais complicados, teremos que separar as desigualdades em pa-
res, resolvendo cada uma destes pares por vez. Vejamos um caso simples
primeiro:

−2 < (6 − 2x)/3 < 4 (×3)


−6 < 6 − 2x < 12 (−6)
−12 < −2x < 6 (÷(−2))
6 > x > −3 (troca de lado)
−3 < x < 6.

A.1 Desigualdades com valores absolutos

Quando temos valores absolutos envolvidos em desigualdades, temos que


tomar alguns cuidados extras no processo de solução. Analisemos primeira-
mente o caso em que:
|x| > a,
com a > 0. As soluções da equação acima são:
x > a ou x < −a.
Se a < 0, qualquer valor de x é solução da desigualdade, já que para
qualquer valor de x, o valor absoluto deste número será positivo e, portanto,
maior do que a.
Se a desigualdade for:
|x| < a,
com a > 0. As soluções da equação acima são:
x < a e x > −a.
Se a < 0, nenhum valor de x é solução da desigualdade, já que para qualquer
valor de x, o valor absoluto deste número será positivo e, portanto, maior
do que a.
Vejamos alguns exemplos:
A.1. DESIGUALDADES COM VALORES ABSOLUTOS 75

1. |x − 20| > 5:

• caso 1: x − 20 > 5 → x > 25;


• caso 2: x − 20 < −5 → x < 15;
• resposta: x < 15 ou x > 25.

2. |x − 3| ≤ 4:

• caso 1: x − 3 ≤ 4 → x ≤ 7;
• caso 2: x − 3 ≥ −4 → x ≥ −1;
• resposta: x ≤ 7 e x ≥ −1 que é −1 ≤ x ≤ 7.

3. |3 + x| − 4 < 0:

• isolamos o módulo primeiro: |3 + x| < 4;


• caso 1: 3 + x < 4 → x < 7;
• caso 2: x − 3 < −4 → x < −1;
• resposta: x < 7 e x < −1 que é −1 < x < 7.

Você também pode gostar