Guia 05 Teoría de Juegos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

Investigación de Operaciones II

Teoría de juegos
1. MARCO GENERAL  Estrategia pura es cuando ambos jugadores coinciden en
la misma estrategia, es decir, el juego tiene una solución
1.1. Introducción estable.

Son situaciones de decisión en la que dos oponentes inteligentes 2. DESARROLLO CONCEPTUAL


con objetivos conflictivos (si suman 0) compiten hasta superar al
otro. En un combate, cada uno de los jugadores (oponentes) tiene 2.1. Formulación con 2 jugadores y suma 0
una cantidad de alternativas o estrategias (finita o infinita). De
acuerdo a cada estrategia, está la retribución que un jugador recibe Esta teoría tiene que ver con situaciones de decisión en la que dos
del otro. oponentes inteligentes con objetivos conflictivos (en caso de suma
cero) compiten intensamente para superar al otro.
1.1 Marco conceptual
En un conflicto, cada uno de los dos jugadores (oponentes) tiene
Valor de juego es el pago que un jugador tiene garantizado que una cantidad (finita o infinita) de alternativas o estrategias.
puede recibir de un juego si toma una decisión racional, Asociada con cada par de estrategias está la retribución que un
independientemente de las decisiones de los demás jugadores1. Se jugador recibe del otro. Tal situación se conoce como juego de
dice que se trata de un juego justo cuando el juego tiene valor 0. suma cero entre dos personas porque la ganancia de un jugador es
Punto de silla es un pago que es simultáneamente un mínimo de igual a la pérdida del otro. Esto significa que podemos representar
su renglón y un máximo de su columna. el juego en función de la retribución que recibe un jugador.
Designando los dos jugadores A y B con m y n estrategias, el juego
http://teoriadejuegosblog.blogspot.com.co/p/punto-de- se presenta usualmente en función de la matriz de retribuciones
silla.html que recibe el jugador A como
Estrategia es una regla predeterminada que especifica por
completo cómo se intenta responder a cada circunstancia posible ....
en cada etapa del juego.

 Estrategia dominante es aquella que es preferida por un


jugador por sobre las demás estrategias que tiene.

1Tomado de “valor de juego” (2011)


Tomado de http://teoriadejuegosblog.blogspot.com.co/p/valor-del-juego.html
Investigación de Operaciones II
Teoría de juegos
La representación indica que si A utiliza la estrategia i y B utiliza la jugador B puede seleccionar BT para recibir $1 de A. Si es así, A
estrategia j, la retribución para A es aij, y la retribución para B es puede cambiar a la estrategia AT para invertir el resultado al recibir
2aij. $1 de B. De acuerdo al cambio de estrategia, cuando es pura no es
aceptable, lo que se requieres es que ambos jugadores combinen
Criterio minimax y maximin al azar sus estrategias puras respectivas. El valor óptimo del juego
ocurrirá entre los valores maximin y minimin del juego
 En el criterio minimax, se deben identificar los valores
mayores de cada columna y seleccionar el menor pago. Valor maximin (menor) ≤ Valor del juego ≤ Valor minimax (mayor).

 En el criterio maximax, se deben identificar los valores 2.2. Formulación estrategias mixtas
menores de cada fila y luego seleccionar el mayor pago. Cuando un juego no tiene punto silla, se aconseja a cada jugador
asignar una distribución de probabilidad sobre su conjunto de
Ejemplo 1.1 Dos jugadores, A y B, juegan a tirar la moneda. Cada estrategias, y luego determinar cuál de ellas es la que se utilizara.
jugador, sin saberlo el otro, escoge cara (H) o cruz (T). Ambos Para expresar esto de manera matemática, sea:
jugadores revelan sus elecciones al mismo tiempo. Si coinciden xi = Probabilidad de que el jugador use la estrategia i (i = , , , m).
(HH o TT), el jugador A recibe $1 de B. De lo contrario, A le paga
$1a B. La siguiente matriz de retribuciones para el jugador A da los 𝑥𝑗 = Probabilidad de que el jugador use la estrategia j (j = , , , n).
valores de fila min y columna máx. correspondientes a las
estrategias de A y B, respectivamente. Donde m y n son los números respectivos de estrategias
disponibles. Como estos valores son probabilidades, tendrán que
BH BT Fila min ser no negativos y sumar 1.

AH 1 -1 -1
𝑃 𝑔𝑜 𝑒𝑠𝑝𝑒𝑟 𝑑𝑜 𝑝𝑜𝑟 𝑒𝑙 𝑗𝑢𝑔 𝑑𝑜𝑟 = ∑ ∑ 𝑃𝑖𝑗 𝑥𝑖 𝑦𝑗
AT -1 1 -1
𝑖= 𝑗=
Columna
Máx. 1 1

Los valores maximin y minimax de los juegos son -$1 y $1,


respectivamente, y el juego no tiene una estrategia pura porque los
dos valores no son iguales. Si el jugador A selecciona AH, el
Investigación de Operaciones II
Teoría de juegos
Donde 𝑃𝑖𝑗 representa el pago del jugador 1 si usa la estrategia pura restricciones válidas en programación lineal. Es por eso que
i y el pago del jugador 2 si usa la estrategia pura j. cualquier solución (x1, x2, x3,…, xm) que satisfaga el conjunto
completo de restricciones de programación lineal es la estrategia
En el caso de las estrategias mixtas, el criterio minimax sostiene mixta óptima deseada.
que un jugador debe elegir la estrategia mixta que minimice la
máxima pérdida que espera para sí mismo y el criterio maximin es Queda así entonces reducido el problema de encontrar una
maximizar el pago esperado mínimo para el jugador. solución mixta óptima a encontrar una solución factible para un
problema de programación lineal. Para esto, cabe resaltar que,
𝑣 = 𝑣 𝑙𝑜𝑟 𝑚𝑖 𝑖𝑚 𝑥 como se desconoce v y no se cuenta con una función objetivo, la
𝑣 = 𝑣 𝑙𝑜𝑟 𝑚 𝑥𝑖𝑚𝑖 forma de solucionarlo es sustituyendo la constante desconocida v
por la variable xm+1, y después maximizarla; así, xm+1 será igual a v
Lo ideal en los juegos con estrategias mixtas es que 𝑣 = 𝑣 para que en la solución óptima del problema de programación lineal. Se
la solución sea estable. concluye entonces que, el jugador 1 encontrará su estrategia mixta
óptima al emplear el método Simplex para resolver el problema de
programación lineal.
2.2.1. Solución con programación lineal
Para el jugador 2, este puede encontrar su estrategia óptima mixta
Cualquier juego de estrategias mixtas puede resolverse, de forma si reescribe la matriz de pagos como los pagos a sí mismo en lugar
más sencilla, si se transforma a un problema de programación de al jugador 1, y luego realizando lo mencionado anteriormente;
lineal. pero, en general, siempre se pueden encontrar las estrategias
mixtas de ambos jugadores con solo elegir uno de los modelos y
Primero, debe considerarse como se encuentra la estrategia mixta
usar el método simplex para obtener una solución óptima y una
del jugador 1, es decir, su pago esperado y cuándo la estrategia es
solución óptima dual.
óptima. Dicha desigualdad, debe cumplirse para cada una de las
estrategias puras del jugador 2; quiere decir que, al sustituirse los En dado caso que xm+1 y yn+1 no estés restringidas en signo en sus
valores de yj en la desigualdad, implicará a ese conjunto de n formulaciones de programación lineal, es decir, v < 0, debe hacerse
desigualdades, y, a su vez, ese conjunto de n desigualdades un ajuste. Una de las más utilizadas es agregar una constante fija
implicará la desigualdad original. grande a todos los elementos de la matriz de pagos, para que así el
nuevo valor del juego sea positivo.
Como la implicación va en ambas direcciones, se concluye que
imponer dicho conjunto de n desigualdades lineales, es igual a
requerir que la desigualdad original se cumpla para todas las
estrategias (y1, y2, y3,…, yn); pero estas n desigualdades son
Investigación de Operaciones II
Teoría de juegos Programa lineal del jugador B

Ejemplo 1.2.1: El valor del juego v, queda entre -2 y 2 𝑀 𝑥𝑖𝑚𝑖𝑧 𝑟 𝑍 = 𝑣

B1 B2 B3 Fila min 𝑣 + 3𝑦 + 𝑦 + 3𝑦3 ≥ 0

A1 3 -1 -3 -3 𝑣 + 𝑦 − 4𝑦 + 𝑦3 ≥ 0
A2 -2 4 -1 -2 𝑣 + 5𝑦 + 6𝑦 − 𝑦3 ≥ 0
A3 -5 -6 2 -6
𝑦 + 𝑦 + 𝑦3 =
Columna
máx. 3 4 2 𝑣 𝑖𝑟𝑟𝑒𝑠𝑡𝑟𝑖𝑐𝑡
La solución da y1 =0.32, y2= 0.08, y3= 0.60, y v= -0.91.
Programa lineal del jugador A
𝑀 𝑥𝑖𝑚𝑖𝑧 𝑟 𝑍 = 𝑣
3. EJERCICIOS
𝑣 − 3𝑥 + 𝑥 + 5𝑥3 ≤ 0
𝑣 + 𝑥 − 4𝑥 + 6𝑥3 ≤ 0 1. Dos compañías promueven dos productos competidores. En la
actualidad, cada producto controla 50% del mercado. Debido a
𝑣 + 3𝑥 + 𝑥 − 𝑥3 ≤ 0 mejoras recientes en los dos productos, cada compañía planea
𝑥 + 𝑥 + 𝑥3 ≤ 0 lanzar una campaña publicitaria. Si ninguna de las dos compañías
se anuncia, continuarán iguales las partes del mercado. Si alguna
𝑥 , 𝑥 , 𝑥3 ≥ 0 de las compañías lanza una campaña más agresiva, la otra
compañía con toda certeza perderá un porcentaje proporcional de
𝑣 𝑖𝑟𝑟𝑒𝑠𝑡𝑟𝑖𝑐𝑡
sus clientes. Una encuesta del mercado muestra que se puede
Solución óptima es x1 =0.39, x2 =0.31, x3= 0.29, y v =-0.91 llegar a 50% de los clientes potenciales por medio de la televisión,
a 30% por medio de periódicos, y a 20% por medio de la radio.
(a) Formule el problema como un juego de suma cero entre dos
personas, y determine el medio publicitario para cada compañía.
Investigación de Operaciones II
Teoría de juegos
c) d)
B1 B2 B3 B1 B2 B3 B4
(b) Determine un intervalo para el valor del juego. ¿Puede operar
cada compañía con una estrategia pura única? A1 3 6 1 A1 3 7 1 3
A2 5 2 3 A2 4 8 0 -6
2. En los juegos (a) y (b) dados a continuación, la retribución es A3 4 2 -5
para el jugador A. Cada juego tiene una solución de estrategia A3 6 -9 -2 4
pura. En cada caso, determine las estrategias que definan el punto
de silla y el valor del juego. 4. Considere el siguiente juego de suma cero entre dos personas:
B1 B2 B3 B4
a) b)
B1 B2 B3 B4 A1 B1 4 B2 -4 B3 -5 B4 6 B1 B2 B3
A1 8 6 2 8 A1A2 4 -3 -4-4 -5-9 6 -2 A1 5 50 50
A2 8 9 4 5 A2A3 -3 6 -4 7 -9-8 -2-9 A2 1 1 1
A3 7 5 3 5 A3A4 6 7 7 3 -8-9 -9 5 A3 10 1 10
b) A4 7 3 -9 5

(a) Compruebe que las estrategias para A y para B son óptimas, y


3. En los juegos (a) y (b) dados a continuación, la retribución es determine el valor del juego.
para el jugador A. Especifique el intervalo del valor del juego en
(b) Demuestre que el valor óptimo del juego es igual a:
cada caso.
3 3

∑ ∑ 𝑖𝑗𝑋𝑖𝑗𝑌𝑖𝑗
a) b) 𝑖= 𝐽=
B1 B2 B3 B4 B1 B2 B3 B4
A1 1 9 6 0 A1 -1 9 6 8 5. El sindicato y la administración de una compañía negocian el
A2 2 3 8 4 A2 -2 10 4 6 nuevo contrato colectivo. Por ahora las negociaciones están
A3 -5 -2 10 -3 congeladas, pues la empresa ha hecho una oferta “final” de un
A3 5 3 0 7
A4 7 4 -2 -5 aumento salarial de $1.10 por hora y el sindicato una demanda
A4 -2 8 4
“final” de un aumento de $1.60 por hora. Ambas partes han
acordado que un árbitro imparcial establezca el aumento en alguna
cantidad entre $1.10 por hora y $1.60 por hora (inclusive). El
arbitraje ha pedido a cada parte que le presente una propuesta
confidencial de un aumento salarial económicamente razonable y
Investigación de Operaciones II
Teoría de juegos
justo (redondeado a los diez centavos más cercanos). Por (c) Muestre que ninguno de los elementos de la matriz de pagos
experiencias anteriores, ambas partes saben que por lo general el que se obtuvo son punto silla. Explique por qué cualquier elección
árbitro acepta la propuesta del lado que cede más en su cifra final. �ja de una estrategia pura de cada jugador tiene que ser una
Si ningún lado cambia su cantidad final o si ambos ceden en la solución inestable, por lo que, en su lugar, deben usarse
misma cantidad, el arbitraje suele establecer una cifra a la mitad estrategias mixtas.
($1.35 en este caso). Ahora, cada parte necesita determinar qué 7. Robín viaja entre dos ciudades y puede utilizar dos rutas. La ruta
aumento proponer para obtener un beneficio máximo. Formule este A es una carretera rápida de cuatro carriles, y la ruta B es una larga
problema como un juego de dos personas y suma cero carretera sinuosa. Robín maneja “súper rápido”. La patrulla de
6. Considere el siguiente juego de mesa entre dos jugadores. Un caminos cuenta con una fuerza policial limitada. Si se asignara toda
árbitro tira una moneda al aire, anota si cae cara o cruz y la la fuerza a la ruta por la que maneja Robín, con toda certeza
muestra sólo al jugador uno. Este jugador puede: pasar y pagar 5 recibiría una multa de $100 por exceso de velocidad. Si la fuerza se
dólares al jugador dos, o apostar. reparte 50-50 entre las dos rutas, hay 50% de probabilidades de
que reciba una multa de $100 en la ruta A, y sólo 30% de que
Si el jugador uno pasa, el juego se termina, pero si apuesta, el reciba la misma multa en la ruta B. Desarrolle una estrategia tanto
juego sigue y el jugador dos puede: pasar y pagar 5 dólares al para Robín como para la patrulla de caminos.
jugador uno, o apostar.
8. En un paseo campestre, 2 equipos de dos personas juegan a las
Si el jugador dos apuesta, el árbitro le muestra la moneda; si es escondidas. Hay cuatro escondites (A, B, C y D) y los dos
cara, el jugador dos paga 10 dólares al jugador uno; si es cruz, el miembros del equipo que se esconden pueden hacerlo por
jugador dos recibe 10 dólares del jugador uno. separado en dos de los cuatro escondites. El otro equipo puede
(a) Proporcione las estrategias puras de cada jugador. (Sugerencia: entonces buscar en los otros dos escondites restantes. El equipo
que busca obtiene un punto si encuentra a los dos miembros del
El jugador 1 tendrá cuatro estrategias puras que especifican cómo equipo que se esconde; si no encuentra a los dos pierde un punto.
respondería a cada uno de los dos resultados que le muestra el De lo contrario, el resultado es un empate.
árbitro; el jugador 2 tendrá dos estrategias puras que especifican
cómo respondería si el jugador 1 apuesta.) *(a) Desarrolle el problema como un juego de suma cero entre dos
personas.
(b) Desarrolle la matriz de pagos de este juego con valores
esperados de los elementos, cuando sea necesario. Identifique y (b) Determine la estrategia óptima y el valor del juego
elimine las estrategias dominadas.
Investigación de Operaciones II
Teoría de juegos
9. La U de A y la U de D están ideando sus estrategias para el 10. El ejército del coronel Blotto está peleando por el control de dos
juego de básquetbol colegial varonil del campeonato de 1994. posiciones estratégicas. Blotto dispone de dos regimientos y el
Valorando las fuerzas de sus respectivas “bancas”, cada enemigo de tres. Una posición caerá ante el ejército con más
entrenador aparece con cuatro estrategias para rotar a los regimientos. De lo contrario, el resultado de la batalla es un
jugadores durante el encuentro. La habilidad de cada equipo de empate.
encestar canastas de 2 puntos, 3 puntos y tiros libres es la clave (a) Formule el problema como un juego de suma cero entre dos
para determinar el marcador final del juego. La siguiente tabla personas y resuélvalo mediante programación lineal.
resume los puntos netos que la U de A anotará por posesión como
una función de las diferentes estrategias disponibles para cada (b) ¿Cuál ejército ganará la batalla?
equipo:

11. En el juego Morra de dos dedos entre dos jugadores, cada


U de U de jugador muestra uno o dos dedos, y al mismo tiempo adivina
U de D1 D2 D3 U de D4 cuántos dedos mostrará el oponente. El jugador que adivina
U de A1 3 -2 1 2 correctamente gana una cantidad igual al número de dedos
mostrados. De lo contrario, el juego es un empate. Desarrolle el
U de A2 2 3 -3 0
problema como un juego de suma cero entre dos personas, y
U de A3 -1 2 -2 2 resuélvalo mediante programación lineal.
U de A4 -1 -2 4 1

12. Considere un juego de mesa entre dos personas. Cada una


(a) Resuelva el juego mediante programación lineal, y determine
comienza con tres fichas: una roja, una blanca y una azul. Cada
una estrategia para el juego de campeonato.
ficha se puede usar una sola vez. Para comenzar, cada jugador
(b) Basado en la información dada, ¿cuál de los dos equipos se elige una de sus fichas y la coloca sobre la mesa, tapada; después
perfila para ganar el campeonato? ambos la destapan y determinan el pago para el ganador. En
particular, si ambos tienen el mismo color, es un empate; de otra
(c) Suponga que todo el juego constará de 60 posesiones (30 para manera, la tabla que sigue indica el ganador y el pago que debe
cada equipo). Pronostique el número de puntos esperado con el recibir del otro jugador. En seguida, cada jugador elige una de sus
cual se ganará el campeonato. dos �chas restantes y se repite el proceso con un nuevo pago de
acuerdo con la tabla. Por último, cada jugador juega la ficha que le
queda y se determina el tercer pago, que es el final.

Ficha ganadora Pago ($)

Rojo gana a blanco 90


Blanco gana a azul 70
Azul gana a rojo 50
Fichas iguales 0

Formule este problema como un juego de suma cero entre dos


personas, e identifique la forma de las estrategias y pagos.

También podría gustarte