Programación Dinámica PDF
Programación Dinámica PDF
Programación Dinámica PDF
“PROGRAMACIÓN DINÁMICA”
ARIADNA LIZET
2EM16
PROFESOR:
Introducción:
que más que un método en si constituye una filosofía de tratamiento para todo tipo de
del valor óptimo o función valor. El método de Pontryagin, por otro lado, pone el
énfasis en encontrar las trayectorias de las variables de control que conducen a este
valor óptimo.
3
Generalidades
del control óptimo, existe una suerte de especialización. En aquellos problemas en los cuales
de control óptimo; mientras que aquellos en los cuales se consideran el tiempo discreto y
variables estocásticas (es decir, variables que tienen un comportamiento aleatorio), se emplea
Mientras que en el control óptimo es posible obtener una solución analítica de una
ocurre lo mismo. Por lo general, a partir de las condiciones de primer orden del problema de
optimización intertemporal que enfrentan los agentes. Solamente bajo formas funcionales
soluciones analíticas simples para el problema. En caso contrario, las trayectorias de las
(yt) como del tiempo (t). En el caso del control óptimo, las variables de control son de
exclusivamente del tiempo. A la estrategia que determina el valor del control óptimo para un
solución al problema.
optimalidad; sin embargo, la ecuación diferencial que se debe resolver para obtener la
función valor involucra sus derivadas parciales, esta es la razón principal por la que el
sumamente útil. La idea es resolver para el último periodo, después para los dos
número dado N de etapas o períodos, cuya situación inicial viene dada por el vector n-
continuo, dicha evolución depende del valor que se dé a ciertas variables, llamadas
control u. Sean:
x : {0, ..., T + 1} → ℝ
u : {0, ..., T} → ℝ
Dos funciones. Denotemos por x(t) = xt y u(t) = ut y, como antes, decimos que x
x0 y xT +1 dados.
“Una política óptima tiene la propiedad de que, cualquiera que sea la acción inicial, las
posibles elecciones restantes constituyen una política óptima con respecto al subproblema que
Aquí el máximo es con respecto al control ut sujeto a xt+1 = gt (xt, ut) y xt dado. Con
dos periodos. Este enfoque permite resolver el problema comenzando por el último periodo y
carezca de soluciones interiores; sin embargo, si éstas existen, se tiene el siguiente resultado.
control debe satisfacer la siguiente propiedad: en cualquier período “t” del tiempo,
también debe ser óptimo. A partir de este principio se desarrolla toda la teoría de
programación dinámica.
resuelve el problema. Ahora, consideremos que la secuencia ut*, Ut+1*, ut+2 *,..., ut* no
cumple con la condición. Definamos la secuencia ut\ Ut+1*, ut+2 *,..., ut como la
mayor valor del funcional objetivo V que el conjunto de variables de control u0*, u1*,
U2*,..., u t*,..., u-r*. Este resultado contradice la hipótesis inicial, la cual establece que
función de política (ut= h (yt)). El teorema de la envolvente establece que cuando la función
La ecuación de Euler
adelantarla un período:
obtenemos:
sea tal que la función de retorno tome el valor máximo posible, considerando los
estado que logren maximizar el funcional objetivo. No obstante, dicho problema puede
Las condiciones de Kuhn-Tucker establecen que las variables que optimizan la función
La ecuación de Euler
condición en el marco de la teoría económica. Con este propósito se emplea una condición de
obtiene
condiciones de primer orden del problema. Para interpretar de una manera más sencilla
debe ser tal que garantice que la función de retorno en el mismo período sea la mayor
el período “t+1”. Dichas derivadas constituyen una aplicación de la regla de la cadena, ya que
indican cómo cambia la función de retorno ante una variación de la variable de estado en el
período “t + 1”, multiplicado por la variación de esta variable ante un cambio en la variable
Ejemplos:
Una compañía minera desea maximizar el valor presente de sus ganancias netas
extraído está dado por p. Denotemos por yt la producción (extracción) y xt las reservas
2𝑦𝑡2
𝑐𝑇 =
𝑥𝑇
2𝑦𝑡2
max ∑𝑇𝑡=0(𝑝𝑦𝑡 − )
𝑥𝑇
por:
2𝑦𝑡2
Vt(xt) =𝑚𝑎𝑥 {(𝑝𝑦𝑡 − ) + 𝑣𝑡+1 (𝑥𝑡+1 ) }
𝑥𝑇
p – (4yt/xt ) − V´t+1 = 0
2𝑦𝑡2
V´t = + V´t+1
𝑥𝑇
xt+1 = xt − yt
Sujeto a xT +1 = xT − yT .
13
4𝑦2 𝑦2 𝑝
𝑝= → =
𝑥2 𝑥2 4
𝑦
Sustituyendo 𝑥2 para t = 2, se tiene
2
𝑝2
𝑉2´ =
8
4𝑦1 𝑝2 𝑦1 8𝑝 − 𝑝2
𝑝− − =0 → =
𝑥1 8 𝑥1 32
𝑦
Sustituyendo 𝑥1 para t = 1, queda
1
2
8𝑝 − 𝑝2 𝑝2
𝑉2´ = 2( ) +
32 8
2
4𝑦0 8𝑝 − 𝑝2 𝑝2
𝑝− − [2 ( ) + ]=0
𝑥0 32 8
Sustituyendo para t = 0
2
8𝑝 − 𝑝2 𝑝2
𝑥1 = 600 − 150 [𝑝 − 2 ( ) − ]
32 8
𝑦 8𝑝−𝑝2
Dado que𝑥1 = se obtiene
1 32
2
8𝑝 − 𝑝2 8𝑝 − 𝑝2 𝑝2
𝑦1 = [ ] {600 − 150 [𝑝 − 2 ( ) − ]}
32 32 8
14
𝑦 𝑝
Y dado que 𝑥2 = 4 entonces
2
2
𝑝 8𝑝 − 𝑝2 𝑝2 8𝑝 − 𝑝2
𝑦2 = {600 − 150 [𝑝 − 2 ( ) − ]} [1 − ]
4 32 8 32
Ejemplo 2:
fines: consumo (Ct) o inversión en capital para el período siguiente (kt+1). Dicho
movimiento:
siguiente modo
15
Asumiendo funciones genéricas para el nivel de utilidad f (Ct) (f’(Ct) > 0 f” (Ct) < 0) y
la producción Ф(kt) (Ф’(kt) >0 Ф” (kt) < 0), podemos plantear la ecuación de Euler para
ecuación de Euler establece que la tasa marginal de sustitución entre consumo presente y
consumo futuro debe ser igual a la productividad marginal del capital. Si la tasa marginal de
valora más el consumo presente que la inversión en capital; por lo tanto, la decisión óptima
forma, en el equilibrio, las secuencias óptimas de consumo y capital deben cumplir con una
Conclusión:
Ciertamente este es un tema complicado de entender, más aun dado a que los
finalmente representan lo mismo es difícil lograr una completa compresión del tema.
Bibliografía
Bonifaz F., J. L., & Lama C., R. (2013). OPTIMIZACIÓN DINÁMICA Y TEORÍA ECONÓMICA. Lima: Centro
de Investigacion de la Universidad del pacifico.
Lomelí, H., & Rumbos, B. (2001). Métodos Dinámicos en Economía. México D.F.: JIT PRESS.
Monsalve, S. (2008). Matematicas Basicas para Economistas III: Optimización y Dinamica. Bogotá:
Universidad Nacional de Colombia.