Teoría de Juegos Con Estrategias Puras y Mixtas
Teoría de Juegos Con Estrategias Puras y Mixtas
Teoría de Juegos Con Estrategias Puras y Mixtas
CONTENIDO
▪ Estrategias mixtas
Profesores MA475 1
UPC – Departamento de Ciencias – Matemática Computacional
Introducción
La teoría de juegos es una técnica utilizada para analizar
situaciones en las que para dos o más individuos (o instituciones)
el resultado de una acción de uno de ellos depende no solo de la
acción particular tomada por ese individuo sino también de las
acciones tomadas por el otro (u otros). En estas circunstancias,
los planes o estrategias de los individuos involucrados
dependerán de las expectativas sobre lo que los demás están
haciendo.
El objetivo es buscar una acción común para lograr un bienestar
común para todos; es decir, un punto de equilibrio
Ejemplos
a) Dos empresas con grandes cuotas de mercado en una industria en particular toman
decisiones con respecto al precio y la producción.
b) Líderes de dos países contemplando una guerra entre ellos.
c) La decisión de una empresa de ingresar a un nuevo mercado donde existe el riesgo de
que las empresas existentes o existentes intenten luchar contra la entrada.
d) Los formuladores de políticas económicas en un país que contemplan imponer un
arancel a las importaciones.
e) Líderes de dos facciones opuestas en una guerra civil que intentan negociar un tratado
de paz.
f) Un jugador de tenis que decide dónde colocar un servicio.
g) Gerentes involucrados en la venta y compra de jugadores en el mercado de
transferencias en el fútbol de asociación.
h) Un criminal que decide si confiesa o no un crimen que ha cometido con un cómplice
que también está siendo interrogado por la policía.
i) La decisión de un capitán del equipo de declarar en cricket.
j) Miembros de la familia discutiendo sobre la división del trabajo dentro del hogar.
Modelación de un juego
Hay dos formas o tipos básicos de modelos formales empleados en la teoría de juegos no
cooperativo. La primera y más simple es la forma estrategia o un juego de forma normal y la
segunda es el juego de forma extensa. En general, los juegos intervienen tres elementos:
a) Una lista de participantes o jugadores.
b) Una lista de estrategias para cada jugador.
c) Para cada conjunto de estrategias, una para cada jugador, una lista de pagos que
reciben los jugadores.
Profesores MA475 2
UPC – Departamento de Ciencias – Matemática Computacional
Profesores MA475 3
UPC – Departamento de Ciencias – Matemática Computacional
Estrategias Puras
La representación en forma normal de un juego con 𝑛 jugadores especifica los espacios de
estrategias puras de los jugadores 𝑠1 , … , 𝑠𝑛 y sus funciones de ganancias 𝑢1 , 𝑢2 … , 𝑢𝑛 .
Denotemos este juego con
𝐺 = {𝑠1 , … , 𝑠𝑛 ; 𝑢1 , … , 𝑢𝑛 }
donde 𝑠𝑖 ≠ ∅ y 𝑢𝑖 : 𝑠1 × 𝑠2 … × 𝑠𝑛 → ℝ, para todo 𝑖 = 1, 2, … , 𝑛.
Preso 2
Callarse Confesar
Callarse –1; –1 –9; 0
Preso 1
Confesar 0; –9 –6; –6
Nota: Adaptado de Chevalier-Roignant & Trigeorgis (2011)
Profesores MA475 4
UPC – Departamento de Ciencias – Matemática Computacional
Jugador 2
C S
C –1; 1 1; –1
Jugador 1
S 1; –1 –1; 1
µ1 (c,c) = –1 µ2 (c,c) = +1
µ1 (c,s) = +1 µ2 (c,s) = –1
µ1 (s,c) = +1 µ2 (s,c) = –1
µ1 (s,s) = –1 µ2 (s,s) = +1
PORTERO
Izquierda Centro Derecha
Izquierda 0; 1 1; 0 1; 0
PATEADOR Centro 1; 0 0; 1 1; 0
Derecha 1; 0 1; 0 0; 1
Observe que, en las celdas de la tabla anterior, las recompensas siempre se suman a la suma
constante 1 ya que, si la recompensa de un jugador es 1, la del otro es cero. En ambos juegos
solo hay un ganador y el otro jugador es un perdedor.
Profesores MA475 5
UPC – Departamento de Ciencias – Matemática Computacional
Jugadora 2
Cine Fútbol
Cine 1; 2 0; 0
Jugador 1
Fútbol 0; 0 2; 1
Profesores MA475 6
UPC – Departamento de Ciencias – Matemática Computacional
De esta definición se deduce que un Equilibrio de Nash (EN) es un perfil de estrategias del que
ningún jugador desearía desviarse unilateralmente, es decir, ninguno se arrepiente de la
decisión tomada, dadas las estrategias decididas por el resto de los jugadores. Un EN esta
formado por estrategias que son óptimas para cada jugador dadas las estrategias del resto de
los jugadores.
Esto no significa que en una EN cada jugador este alcanzando el mejor resultado posible, sino
el mejor resultado condicionado por el hecho de que los demás jugadores jueguen las
estrategias indicadas para ellos en dicho perfil.
Puede haber múltiples equilibrios de Nash en un juego y, por analogía con la notación
llamaremos S EN al conjunto de perfiles que son equilibrios de Nash.
El dilema del prisionero representa cuatro perfiles como posibles soluciones en el juego:
(Callarse, callarse), (callarse, confesar)
(Confesar, callarse), (Confesar, confesar)
Profesores MA475 7
UPC – Departamento de Ciencias – Matemática Computacional
Profesores MA475 8
UPC – Departamento de Ciencias – Matemática Computacional
𝐽 = {1,2} , 𝑠1 = 𝑠2 = [0,1] ,
𝑠 si 𝑠1 + 𝑠2 ≤ 1 𝑠2 si 𝑠1 + 𝑠2 ≤ 1
𝑢1 (𝑠1 , 𝑠2 ) = { 1 𝑢2 (𝑠1 , 𝑠2 ) = {
0 si 𝑠1 + 𝑠2 > 1 0 si 𝑠1 + 𝑠2 > 1
En este juego a cada jugador le conviene, en respuesta a un hipotético 𝑥 que pudiera haber
escrito el otro, escribir un número 𝑦 lo más grande posible de modo que 𝑥 + 𝑦 no exceda a 1.
2
Por ejemplo, la respuesta óptima 𝑠2 = 3 sería 𝑠1 = 1/3. Formalmente, el jugador 1 (y
análogamente razonaría el jugador 2) determinaría su respuesta óptima a cualquier estrategia
𝑠2 del jugador 2 resolviendo.
𝑚á𝑥(𝑆1 ), 𝑠𝑢𝑗𝑒𝑡𝑎 𝑎: 0 ≤ 𝑆1 ≤ 1 𝑦 𝑆1 + 𝑆2 ≤ 1
Profesores MA475 9
UPC – Departamento de Ciencias – Matemática Computacional
Donde
Profesores MA475 10
UPC – Departamento de Ciencias – Matemática Computacional
Introducción
Consideremos el juego de las monedas (similar al juego de “pares o nones”) representado en
su forma estratégica en la siguiente tabla.
Jugador 2
C S
C –1; 1 1; –1
Jugador 1
S 1; –1 –1; 1
Podemos comprobar que ninguna de las cuatro combinaciones de estrategias posibles
constituye un equilibrio de Nash (en estrategias puras).
Consideremos que los jugadores en lugar de elegir una única estrategia, lo que hacen es
asignar una probabilidad a cada una de ellas. Resulta útil pensar que los jugadores lo que
eligen es una regla para seleccionar de manera aleatoria entre sus estrategias originales.
Denominaremos a cada una de esas posibles reglas estrategia mixta y a cada una de las
estrategias originales estrategia pura. Una estrategia mixta es, por tanto, una distribución de
probabilidad sobre el conjunto de estrategias puras {𝐶, 𝑆}. Podemos considerar que una
estrategia pura como una estrategia mixta degenerada que asigna toda la probabilidad a una
de las alternativas.
Profesores MA475 11
UPC – Departamento de Ciencias – Matemática Computacional
Considerando ambas gráficas en una misma figura, observamos que el equilibrio de Nash en
estrategias mixtas ocurre si 𝑝 = 1/2 y 𝑞 = 1/2.
Profesores MA475 12
UPC – Departamento de Ciencias – Matemática Computacional
Profesores MA475 13