Teoria de Juegos GUIA
Teoria de Juegos GUIA
Teoria de Juegos GUIA
¿Qué es un Juego?
Un juego es una representación formal de una situación en la cual al menos dos individuos interactúan
en un marco de interdependencia estratégica. Esto significa que el resultado de cada individuo depende
no solamente de sus propias acciones, sino de la de los demás. De hecho, las acciones que resulten
mejores para él pueden depender de lo que espera que los demás hagan.
ii. Las reglas. ¿Quién mueve cuándo? ¿Qué saben cuándo juegan? ¿Qué pueden hacer?
iii. Los resultados. Para cada conjunto posible de acciones de los jugadores, ¿cuál es el resultado del
juego?
iv. Los pagos. ¿Cuáles son las preferencias de los jugadores acerca de los posibles resultados?
Ejemplo: el michi.
Jugadores. 2 jugadores: X y O.
Reglas: Los jugadores se enfrentan a un tablero de nueve casilleros. Los jugadores se alternan para
poner su respectiva marca en un casillero vacío. Se define qué jugador empieza. Ambos jugadores
conocen todas las elecciones hechas previamente.
Resultados: El primer jugador en conseguir tres de sus marcas en una fila (horizontal, vertical o diagonal)
gana. Si eso no ocurre hasta que todos los casilleros están marcados el juego queda empatado.
Pagos: Es usual que en teoría de juegos la función de utilidad del jugador se denomine “Función de
Pagos”, de modo que la utilidad alcanzada es su “Pago”. Por ejemplo, el pago puede ser la cantidad de
dinero que el jugador gane o pierda.
A todo esto, ¿qué es estrategia? Es un plan de acción elegido por un jugador que contendrá una
especificación completa de todos los actos o “movimientos” que se tomarán en cada oportunidad en
que la acción deba ser decidida. Una estrategia es un conjunto completo de planes de acción que
especifica lo que ha de hacer un jugador en cualquier contingencia futura que se presente en el
desarrollo del juego. Cuando cada jugador ha elegido su estrategia, la interacción de todas ellas dadas
las reglas del juego determinará el resultado y los pagos para los jugadores.
Este juego es uno de suma cero: lo que gane uno lo pierde el otro. No le conviene a ningún jugador
tratar de coludirse con el otro: la no cooperación es voluntaria. Pero puede haber casos en los que la no
cooperación es involuntaria.
Consideremos el Dilema del Prisionero: Dos individuos son arrestados acusados de un delito y están
detenidos en celdas separadas. El fiscal trata de que cada prisionero confiese. A cada uno por separado
se le dice que él es el único que confiesa, a él solo le darán 1 año de cárcel, mientras que al otro se le
darán 10. Sin embargo, si él es el único que no confiesa la pena de 10 años de cárcel se la darán a él. Si
ambos confiesan, los dos tendrán una condena de 5 años. Si ninguno confiesa, dados sus antecedentes
cada uno tendría una sanción de 2 años. Cada prisionero desea minimizar el tiempo que pase en la
cárcel. ¿Cuál será el resultado de este juego?
Prisionero 2
No Confiesa Confiesa
Prisionero No Confiesa -2, -2 -10, -1
1 Confiesa -1, -10 -5, -5
En cada celda se presenta para la estrategia indicada primero el pago del Jugador 1 y luego el pago del
Jugador 2.
Veamos qué haría el Prisionero 1 si el Prisionero 2 elige no confesar. Si 1 no confiesa, le dan 2 años de
cárcel; si confiesa, solo 1. Le conviene confesar.
Vemos que dado lo que haya hecho el Prisionero 2, al Prisionero 1 le conviene confesar. ¿Qué pasa con
el Prisionero 2? Si el Prisionero 1 elige no confesar, le dan 2 años de cárcel si no confiesa y 1 si confiesa,
por lo que le conviene confesar. Si el Prisionero 2 elige confesar, le dan 10 años de cárcel si no confiesa y
y 5 si confiesa, por lo que le conviene confesar. Sea cual sea la elección del Prisionero 1, al Prisionero 2
le conviene confesar.
Este juego entonces tiene solo un posible resultado: (Confesar, Confesar). Esto se debe a que “Confesar”
es la mejor estrategia para cada jugador, independientemente de lo que el otro jugador haga. Este tipo
de estrategia es conocido como Estrategia Estrictamente Dominante.
Una estrategia es estrictamente dominante para un jugador si es la única que maximiza sus pagos para
cualquier estrategia que sus rivales puedan jugar. Si un jugador tiene una estrategia estrictamente
dominante, es de esperar que la siga.
Lo llamativo del resultado (Confesar, Confesar) en el Dilema del Prisionero es que, a pesar de que es el
único que cabe esperar, no es el mejor resultado conjunto para los jugadores, pues estarían mejor si
ninguno confiesa. Este es el ejemplo típico de que el comportamiento racional que busca el propio
interés no lleva a necesariamente a un resultado socialmente óptimo.
Una forma de analizar este resultado es que al buscar maximizar su propio beneficio (obtener una
menor condena), cada prisionero tiene un impacto negativo en el otro; alejándose del resultado (No
Confesar, No Confesar) un jugador reduce su tiempo en la cárcel pero incrementa el del otro. Éste es un
claro ejemplo de externalidades.
Estrategia Dominada
Las estrategias dominantes rara vez existen. Una estrategia puede ser la mejor cuando los rivales han
elegido determinada estrategia, pero cuando eligen otra no. Aún así, la dominancia se puede usar para
eliminar algunas estrategias que nunca serían utilizadas. En ese sentido, debemos esperar que un
jugador no juegue las estrategias dominadas, que son aquellas para las cuales existe una estrategia
alternativa que le otorga un mayor pago, independientemente de lo que el otro jugador haga.
Ejemplo:
Jugador 2
Izquierda Derecha
Jugador Arriba 1, -1 -1, 1
1 Medio -1, 1 1, -1
Abajo -2, 5 -3, 2
Por otro lado, una estrategia es Débilmente Dominada si alguna otra resulta al menos tan buena dadas
todas las estrategias de todos los demás jugadores y estrictamente mejor que algunas.
Ejemplo:
Jugador 2
Izquierda Derecha
Jugador Arriba 5, 1 4, 0
1 Medio 6, 0 3, 1
Abajo 6, 4 4, 4
Si Jugador 2 elige Izquierda, Jugador 1 elige Medio o Abajo. Si Jugador 2 elige Derecha, Jugador 1 elige
Arriba o Abajo. Para el Jugador 1, las estrategias Medio y Arriba son débilmente dominadas por Abajo,
que le otorga resultados al menos iguales a los que obtendría con ellas.
A diferencia de una estrategia estrictamente dominada, una estrategia débilmente dominada no puede
ser descartada sobre la base de racionalidad.
Ejemplo: El hermano del fiscal. La historia ahora es que el Prisionero 1 es el hermano del fiscal. El fiscal
ahora le ofrece al Prisionero 1 dejarlo ir si ninguno de los prisioneros confiesa. ¿Qué pasa ahora?
Prisionero 2
No Confiesa Confiesa
Prisionero No Confiesa 0, -2 -10, -1
1 Confiesa -1, -10 -5, -5
Sin embargo, ¿ha cambiado algo para el Prisionero 2? Si el Prisionero 1 no confiesa, le conviene
confesar. Si el Prisionero 2 confiesa, le conviene confesar. Por lo tanto, independientemente de la
estrategia que siga el Prisionero 1 al Prisionero 2 le conviene confesar y siempre va a hacerlo. Esto
elimina del tablero la primera columna. Por lo tanto, el resultado de este juego seguirá siendo (Confesar,
Confesar).
La eliminación de estrategias estrictamente dominadas solo requiere que cada jugador sea racional.
Pero adicionalmente se supone que cada jugador sabe que los demás son racionales. En este caso el
Prisionero 1 deja de lado la estrategia No Confesar porque sabe que el Prisionero 2 nunca va a seguir la
estrategia No Confesar.
El Equilibrio de Nash
Jugador 2
Izquierda Medio Derecha
Jugador Arriba 5, 3 0, 4 3, 5
1 Medio 4, 0 5, 5 4, 0
Abajo 3, 5 0, 4 5, 3
El Equilibrio de Nash implica “no desviarse” o en otras palabras, es la solución a la que se llegaría
analizando el problema desde el punto de vista de cada jugador. En este ejemplo, es que los dos
jugadores elijan Medio, lo que implica entonces que la estrategia que seguirán es (Medio, Medio) con
pagos 5,5.
Jugadores: Dos.
Reglas: Cada jugador coloca al mismo tiempo una moneda de diez céntimos, eligiendo si el lado visible
es el 10 o el escudo.
Resultados: Si las dos monedas muestran el mismo lado, el jugador 1 le da la moneda al jugador 2; si no,
el jugador 2 se la entrega al jugador 1.
Jugador 2
10 Escudo
Jugador 10 -0.10, +0.10 +0.10, -0.10
1 Escudo +0.10, -0.10 -0.10, +0.10
Si el Jugador 2 elige “10”, el Jugador 1 elige “Escudo”. Si el Jugador 2 elige “Escudo”, el Jugador 1 elige
“10”.
Si el Jugador 1 elige “10”, el Jugador 2 elige “10”. Si el Jugador 1 elige “Escudo”, el Jugador 2 elige
“Escudo”.
En este caso, no hay Equilibrio de Nash (ni tampoco estrategias estrictamente dominantes o
dominadas).
Un juego se puede denotar en forma “normal”, que es la forma en que lo hemos presentado, o en forma
“extensiva”. Para denotarlo en forma extensiva se supone que el juego es finito.
Jugador 1
10 Escudo
Jugador 2 Jugador 2
10 Escudo 10 Escudo
Nodos Terminales
Juegos Dinámicos
Consideremos el siguiente juego. La firma E (Entrante) está considerando entrar a un mercado en que
hay un solo participante (firma I). Si lo hace (Entra), I puede responder de dos maneras: puede
acomodarse cediendo parte de sus ventas pero sin cambiar el precio o puede pelear con el entrante,
generando una guerra de precios que reduce significativamente el precio en el mercado. La forma
extensiva y normal de dicha situación se presentan a continuación.
Firma E
No Entra Entra
Firma I
( )( )
BE
BI
0
2 Pelea Acomodo
( ) ( )
-3
-1
2
1
Firma I
Pelea Se acomoda
si entra E si entra E
Firma No entra 0, 2 0, 2
E Entra -3, -1 2, 1
Si E entra, I se acomoda.
Si I pelea, E no entra.
Si I se acomoda, E entra.
Hay dos equilibrios de Nash: (No Entra, Pelea) y (Entra, Se Acomoda). Sin embargo, que la Firma I pelee
sin que haya entrado su competidor no tiene sentido. Éste es un problema con el equilibrio de Nash
cuando se trata de juegos secuenciales. En este caso, la firma entrante sabe los resultados del juego y
por lo tanto, veremos que lo que ocurre es (Entra, Se Acomoda).