0% encontró este documento útil (0 votos)
39 vistas15 páginas

SEMANA4

1) El documento habla sobre equilibrios de Nash mixtos y la eliminación de estrategias dominadas en la teoría de juegos. 2) Se define una estrategia dominada como aquella con pagos menores para un jugador independientemente de la estrategia del otro jugador. Los jugadores racionales eliminarán estrategias dominadas. 3) Un equilibrio de Nash ocurre cuando ningún jugador tiene incentivos para cambiar su estrategia unilateralmente, dado que los otros jugadores mantienen sus estrategias.

Cargado por

LIZ
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
39 vistas15 páginas

SEMANA4

1) El documento habla sobre equilibrios de Nash mixtos y la eliminación de estrategias dominadas en la teoría de juegos. 2) Se define una estrategia dominada como aquella con pagos menores para un jugador independientemente de la estrategia del otro jugador. Los jugadores racionales eliminarán estrategias dominadas. 3) Un equilibrio de Nash ocurre cuando ningún jugador tiene incentivos para cambiar su estrategia unilateralmente, dado que los otros jugadores mantienen sus estrategias.

Cargado por

LIZ
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 15

Unidad 2 / Escenario 4

Lectura fundamental

Equilibrios de Nash mixtos

Contenido

1 Eliminación de estrategias dominadas

Palabras clave: estrategias mixtas, criterio de dominancia.


Introducción
La aplicación del criterio de dominancia en la teoría de juegos implica que se puede realizar una
eliminación de filas y de columnas. En los ejemplos anteriores se han tomado las matrices de pago, en
donde los valores positivos son ganancias para el jugador que se ubica en las filas, por ende, representa
pérdidas para el jugador que se ubica en las columnas. La eliminación de estrategias se realiza
utilizando el procedimiento que se verá a continuación. 

Si hay una fila con iguales o mayores pagos que otra fila; en este caso el jugador de la fila procede a
eliminar de sus posibles estrategias aquella que tenga el menor pago. Si se tiene la posibilidad de elegir
una columna con menor o igual pago que otra columna; el jugador de la columna procede a eliminarla
de sus estrategias una vez tenga los mayores pagos, pues al jugador de la columna le conviene obtener
menores valores o pérdidas.

1. Eliminación de estrategias dominadas


Consideremos una estrategia de mayores pagos que otra en un juego definido como Ω, decimos
entonces que una estrategia Ci domina a otra estrategia para el jugador i Siempre y cuando se
cumpla la siguiente condición:

Ui (ci,c-i )>Ui (ci',c-i)


Para todo c-i, denotamos que c-i es el vector de estrategias de los jugadores distintos a i. Veamos el
siguiente juego:
Estudiante
Estudiar No estudiar
Profesor Parcial fácil 10, 5 0,3
Parcial difícil 20,4 5,0

El profesor tiene un pago mayor si hace un parcial difícil; eso prueba que es mucho más competente,
maneja o domina el tema de una manera amplia y además les exige más a sus estudiantes,
fortaleciendo su aprendizaje. El estudiante prefiere repasar independientemente de la estrategia del
docente, por lo cual decimos que la estrategia dominante para el estudiante es estudiar.

Como principio de solución del juego tenemos que un jugador racional siempre elegirá estrategias
dominantes, no elije estrategias dominadas, la solución de este juego sería (parcial difícil y estudiar),
pues representan los pagos más altos.

POLITÉCNICO GRANCOLOMBIANO 2
Estudiante
Estudiar No estudiar
Profesor Parcial fácil 10, 5 0,3
Parcial difícil 20,4 5,0

A esta técnica se le conoce como eliminación de estrategias dominadas; el estudiante obtiene más
pago al estudiar y así el profesor obtiene mejor remuneración cuando hace un parcial difícil.

1.1. Dilema del prisionero

Como se mencionó en Lecturas anteriores, se tiene a 2 sospechosos y la justicia requiere


condenarlos; por ello se tienen dos opciones: confesar o no confesar.
Jugador 1
Confesar No confesar
Jugador 2 Confesar -4, -4 0,-5
No confesar -5,0 -1,-1

Para el jugador 1 la estrategia de confesar domina a la de no confesar; así mismo para el jugador 2 la
estrategia de confesar domina a la de no confesar.

Jugador 1
Confesar No confesar
Jugador 2 Confesar -4 -4 0 -5
No confesar -5 0 -1 -1

En este caso, si cada uno confiesa obtiene el peor castigo que son 4 años de cárcel. En este ejemplo
vemos que al tener una estrategia se puede obtener un estado indeseable, dado que al buscar el
beneficio individual se obtiene un resultado ineficiente, toda vez que se puede obtener una mejoría sin
empeorar al otro jugador. En el ejemplo, lo óptimo es que ninguno confiese, pues ambos pagarían 1
año de cárcel que sería la solución más “barata” del juego.

POLITÉCNICO GRANCOLOMBIANO 3
1.2. Eliminación iterada de estrategias dominadas

El principio de solución es el siguiente:

A. Los jugadores eliminan estrategias dominadas

B. Es de conocimiento común para el resto de los jugadores que los demás participantes eliminan
estrategias dominadas.

Para entender este concepto veamos un ejemplo:


Jugador 1
C D E
Jugador 2 A 10,5 3,4 0,1
B 4,6 2,10 2,5

En este caso el jugador 2 no tiene ninguna estrategia dominada, para el jugador 1 la opción E es
dominada. En este caso, el jugador 2 elige la opción A, ya que representa un pago mucho mayor que
la opción B, salvo en el caso que el jugador 1 elija la opción E; no obstante, al ver los pagos del jugador
1, como es de conocimiento común, el jugador 2 estará confiado en que el jugador 1 nunca va a elegir
la opción E, que representa los menores pagos. La solución de este juego sería (A, C).

1.3. Equilibrio de Nash

El principio de solución de un equilibrio de Nash surge bajo la siguiente premisa: ¿qué se debería hacer
si un juego no tiene solución por eliminación iterada de estrategias dominadas?

Pensemos en el siguiente juego que se denomina batalla de los sexos, el cual es un ejemplo muy famoso
para analizar un problema frecuente en la vida cotidiana. Asuma dos jugadores: “él” y “ella”. Cada uno de
ellos tiene la opción de elegir entre dos posibles planes para compartir en pareja: “fútbol” y “discoteca”.
Ella
Fútbol Disco
Él Fútbol 2,1 0,0
Disco 0,0 1,2

POLITÉCNICO GRANCOLOMBIANO 4
En este caso ambos jugadores tienen pagos más altos sí coinciden en el mismo plan; entonces vemos
que ningún jugador tiene estrategias dominadas.

Definimos formalmente un equilibrio de Nash de la siguiente manera: en un juego ∑ con un vector


de estrategias C=(ci,c-i*) existe un equilibrio de Nash si para todo jugador se cumple la siguiente
condición:

U(ci*,c-i* )≥U(ci,c-i* )
¿Qué hacer si un juego no tiene solución por eliminación iterada de estrategias dominadas?
Retomemos el ejemplo de batalla de los sexos:
Ella
Fútbol Teatro
Fútbol 2,1 0,0
Él
Teatro 0,0 1,2

En este caso, ningún jugador tiene estrategias dominadas y además ambos se sientes mejor si
coinciden juntos en el mismo plan. En un equilibrio de Nash ningún jugador tiene incentivos al
desviarse de forma unilateral o cambiarse de estrategia, a no ser que otros jugadores lo hagan.

En un juego Ω, un vector de estrategias c*=(ci*,c-i*) es un equilibrio de Nash si para todo jugador se


cumple la siguiente condición:

ui (ci*,c-i* )≥ui (ci ,c-i* )


En el ejemplo anterior no hay incentivos al cambiar de estrategia; en este caso los equilibrios de Nash
serían: fútbol, fútbol o teatro, teatro:
Ella
Fútbol Teatro
Fútbol 2,1 0,0
Él
Teatro 0,0 1,2

1.4. Ejemplo de juegos de marketing

Asuma 2 empresas que venden un producto similar, cada porcentaje de participación en el mercado
representa un pago neto de 1. Sin la publicidad, la participación de mercado de cada firma sería del
50 %. El costo de publicidad es de 10, pero conlleva a un incremento en la participación del 20 % a
costa de la otra empresa. Las firmas toman su decisión de forma independiente y simultánea.

POLITÉCNICO GRANCOLOMBIANO 5
A. Plantear el juego en forma normal identificando jugadores, estrategias y pagos.
Empresa 2
Publicidad No publicidad
Publicidad 40,40 60,30
Empresa 1
No publicidad 30,60 50,50

En el equilibrio con publicidad cada empresa tiene un pago de 40,40, lo anterior se debe a que cada
empresa tiene una participación del 50 %, pero al incurrir en un gasto de publicidad se tiene un costo
de 10, por lo cual la participación total sería de 40 % (en la matriz de pago sería de 40).

En el caso de los pagos cuando se tiene publicidad y no publicidad, tenemos lo siguiente: si la empresa
1 elige publicidad el pago sería: 50-10+20=60, pero en el caso que la empresa 2 decida no publicidad
el pago sería: 50-20=30. Se le resta 20 ya que pierde participación de mercado, y esa misma
participación es la que gana la empresa 1.

B. ¿Puede el juego resolverse por eliminación iterada de estrategias dominadas?


Empresa 2
Publicidad No publicidad
Publicidad 40,40 60,30
Empresa 1
No publicidad 30,60 50,50

Por eliminación iterada de estrategias, el equilibrio de Nash de este juego es que ambas empresas
opten por la estrategia de Publicidad. En caso de que alguna decida desviarse de su estrategia
obtendría un pago menor.

1.5. Ejemplo de la batalla del mar de Bismark

En el año 1943 en el Pacífico Sur, el gobierno de Japón tomó una decisión en torno a transportar sus
tropas; mientras que el presidente de EE. UU., Jhon F. Kennedy, adopta la decisión de bombardear a
dicha tripulación.

En este caso Japón tiene dos elecciones: 1) una ruta corta por el norte que puede durar 2 días; 2)
optar por una ruta larga por el sur, la cual dura 3 días. De manera simultánea, el presidente Kennedy
debe decidir a cuál de estas rutas enviará sus aviones.

POLITÉCNICO GRANCOLOMBIANO 6
Si eligen la ruta equivocada, puede redirigir sus aviones hacia la ruta correcta, pero pierde 1 día de
ataque y bombardeo. Asuma que el número de días de ataque y bombardeo representa el pago de
Kennedy, mientras que el pago para Japón es el negativo de este valor.

A. Plantear el juego en forma normal identificando jugadores, estrategias y pagos.

Definimos el pago del juego como el número de días que Kennedy puede bombardear
Kennedy
Ruta norte Ruta sur
Ruta norte -2,-2 -1,1
Japón
Ruta sur -2,2 -3, 3

Si asumimos que Kennedy prefiere bombardear cuantos antes, se asume que Japón debe decidir el
viaje que le represente menor costo en tiempo, por lo cual el equilibrio de este juego sería que ambos
optaran por ir a la ruta norte, es decir:
Kennedy
Ruta norte Ruta sur
Ruta norte -2,-2 -1,1
Japón
Ruta sur -2,2 -3, 3

1.6. Juegos de coordinación

En la cotidianidad los agentes se enfrentan a situaciones en las que es necesario coordinar con
jugadores para obtener el mejor pago, en algunas ocasiones se puede llegar al mismo resultado,
sin embargo, en algunas otras se dificulta la coincidencia en las acciones. Definimos un juego de
coordinación como una situación donde los agentes tienen varias opciones, donde el pago es más alto
cuando todas las decisiones coinciden.

Una dificultad común es la ausencia de comunicación, en este escenario la coordinación se vuelve


complicada, por ende, los jugadores requieren de algún mecanismo para tomar su elección y de esta
manera poder coordinar. En la vida cotidiana vemos este tipo de situaciones de la siguiente manera:
no es común que los conductores decidan cada día si deben conducir por la derecha o por la izquierda,
así que por convención se tiene como regla conducir por la izquierda, salvo en países como Gran
Bretaña, Australia y Japón que conducen por la derecha.

POLITÉCNICO GRANCOLOMBIANO 7
1.7. Ejemplo de la batalla de los sexos

Retomando el ejemplo anterior, denominada la batalla de los sexos, que consiste en elegir el plan para
una pareja; tenemos que Andrea y Tony quieren salir el viernes, pero mientras Andrea prefiere ir a
bailar, Tony prefiere ir al cine. En esta situación se tiene compatibilidad en el plan y en las acciones,
pero no en las preferencias. Esta situación da origen a una diferencia en los pagos de cada uno en
caso de ir al cine o a bailar.
Tony
Bailar Cine
Bailar 6,2 0,0
Andrea
Cine 0,0 2, 6

En este juego se tienen dos equilibrios de Nash en estrategias puras; surgen donde ambos coordinan
en el mismo plan para coincidir en su salida de manera conjunta el viernes. No obstante, dadas las
preferencias de cada uno los pagos son desiguales. Se tiene que Andrea debe renunciar a su mejor
preferencia para coincidir con Tony, o viceversa.

Una herramienta que podría mejorar los pagos y resultados de este juego es la comunicación. No
obstante, algunas investigaciones arrojan que en caso de que los agentes se puedan comunicar antes
de jugar, es posible que puedan llegar a un acuerdo y así obtener el mejor pago posible. Algunos
autores indican que el exceso de comunicación genera más ruido, por lo tanto, los jugadores actúan
de forma individual y envidiosa.

1.8. El criterio de la dominancia

En algunas ocasiones se puede tener que los jugadores comparten un interés común, sin embargo,
aparecen algunas situaciones que dificultan la coordinación. El criterio de dominancia en pagos se
puede utilizar para seleccionar un equilibrio y resolver el problema de coordinación.

Situación 1

Tony
Casa Cine
Casa 1,1 0,0
Andrea
Cine 0,0 2, 2

POLITÉCNICO GRANCOLOMBIANO 8
Situación 2

Tony
Parque Café
Parque 2,2 0,0
Andrea
Café 0,0 2, 2

La primera situación muestra un ejemplo claro de dominancia en los pagos, toda vez que uno de los
Equilibrios de Nash genera mayor pago, en este caso la opción de ir al cine es un equilibrio dado que
proporciona mayores pagos a los dos agentes de forma conjunta. En el segundo escenario no es clara
la dominancia. Por lo cual, Andrea y Tony no pueden coordinar si asisten al parque o al café.

1.9. Ejemplo del halcón o paloma

A continuación, se muestra un juego que ilustra la no coordinación. Se tienen dos jugadores: el halcón
(comportamiento agresivo) y la paloma (actitud tranquila). En dicha situación de competencia por
un pago si ambos jugadores eligen una actitud agresiva (halcón), se produce una molestia y discordia,
cuyo costo (C=8) es mayor que el valor del pago sobre el cual compiten (V=6); y adicionalmente
ambos pierden ((V-C)/2=-1).

Si solo uno de los jugadores opta por la estrategia agresiva, este gana y se queda con el pago y el otro
no obtiene nada. Si ambos optan por la estrategia pacífica, comparten el pago en partes iguales o
alguno de ellos se queda con dicho pago con una probabilidad del 50 % (V/2=3).

Jugador 2
Halcón Paloma
Halcón -1,-1 6,0
Jugador 1
Paloma 0,6 3, 3

Este juego tiene dos equilibrios de Nash, que son asimétricos en estrategias puras: halcón-paloma y
paloma-halcón.

La razón de la asimetría es que ambos jugadores deben propender por la coordinación en estrategias
diferentes, no obstante, es necesaria la coordinación con el objetivo de evitar que el resultado sea
demasiado negativo. Esta situación es análoga en la vida real a la de dos países que se enfrentan a un
posible conflicto armado.

POLITÉCNICO GRANCOLOMBIANO 9
1.10. Estrategias mixtas

En un equilibrio de Nash los jugadores no tienen incentivos al cambiar sus estrategias, pues de no
hacerlo reciben un menor pago; tampoco se espera que el otro jugador tenga incentivos de cooperar,
en este caso se puede tener un dilema social, en la medida que la solución conlleva a una situación
indeseable por los incentivos egoístas y personales de los jugadores. Como se mencionó, en una
estrategia mixta se tiene una distribución de probabilidades sobre las estrategias puras. Formalmente
decimos que una estrategia mixta es un vector:

σi=[pi (c1 ),pi (c2 ),pi (c3 ),….,pi (cm )]


Donde pi (cj ) es la probabilidad de que el jugador i juegue la estrategia j. Tenemos que el jugador i
tiene disponible m estrategias diferentes, el vector tiene la probabilidad con la cual se puede jugar cada
estrategia. Entonces, pi (cj )≥0; además que se cumple lo siguiente:

Considere la siguiente matriz de pago:


Jugador 2
C S
C 1,-1 -1,1
Jugador 1
S -1,1 1,1

Asuma que el jugador 1 elige la estrategia C con probabilidad p y elige la estrategia S con probabilidad
1-p, es decir, su vector de probabilidades es el siguiente: p1=(p,1-p), donde p≥0.

Asuma que el jugador 2 elige la estrategia C con probabilidad q y la estrategia S con probabilidad 1-q,
donde q≥0. Inicialmente podemos decir que el pago es de 0 dado que si se juega cualquiera de las dos
opciones con probabilidad de 1⁄2 se pierde la mitad y se gana la otra mitad. Asumiendo que los jugadores
desean maximizar su utilidad esperada, se plantea la siguiente función para el jugador 1 si opta por elegir
la opción C:

u1e (cara)=(1)*q+(-1)*(1-q)=2q-1
u1e (sello)=(-1)*q+(1)*(1-q)=1-2q

POLITÉCNICO GRANCOLOMBIANO 10
En estrategias mixtas se genera incertidumbre, por esta razón se debe plantear la función de utilidad
esperada, así mismo el resultado que se obtenga depende de la elección del otro jugador.

Es importante indicar que todo juego finito (es decir con un número determinado de jugadores y
estrategias) tiene al menos 1 equilibrio de Nash, que posiblemente es mixto. Por otro lado, en un
equilibrio de Nash mixto cada jugador es indiferente entre las estrategias puras que se juegan con una
probabilidad distinta de cero. En este juego, las estrategias mixtas son del estilo:

p1=(p,1-p) y p2=(q,1-q)
Cada jugador es indiferente entre las estrategias puras, así que podemos hacer lo siguiente.

Para el jugador 1 se tiene la siguiente situación:

u1e (cara)=u1e (sello)


Por lo cual tenemos:

2q-1=1-2q
Despejando queda:

4q=2
Luego:

q=1/2

Entonces se obtiene que:

1-q=1/2
Por el resultado anterior, afirmamos que este jugador es indiferente entre jugar cara o sello, pero
tenemos que el resultado final depende de , esta es la probabilidad de jugar del agente 2 del juego, así
que esta estrategia se encuentra condicionada a lo que haga este participante. Para el jugador 2, y de
manera análoga, tenemos la siguiente solución:

u2e (cara)=u2e (sello)


(-1)*p+(1)*(1-p)=(1)*p+(-1)*(1-p)
Resolviendo algebraicamente tenemos:

1-2p=2p-1

POLITÉCNICO GRANCOLOMBIANO 11
Es decir, la solución es:

p=1/2
Además:

1-p=1/2
En este caso, el equilibrio de Nash Mixto es el siguiente:

El resultado implica que la conclusión es que cada jugador optimiza su estrategia cuando le hace creer
al otro que elige la opción C o S, con probabilidad de 1⁄2 .

Considere la siguiente matriz de pagos:


Jugador 2
F (p) T (1-p)
F (q) 2,1 0,0
Jugador 1
T (1-q) 0,0 1,2

En este caso se debe encontrar el equilibrio de Nash Mixto; como se mencionó anteriormente, no se
tiene un equilibrio de Nash en estrategias puras. para el jugador 1 tenemos la siguiente solución:

u1e (F)=(2)*(p)+(0)*(1-p)
u1e (T)=(0)*(p)+(1)*(1-p)
Al resolver algebraicamente obtenemos:

2p=1-p
En este caso las probabilidades serían:

p=1/3
Y el complemento es:

1-p=2/3

POLITÉCNICO GRANCOLOMBIANO 12
Para el jugador 2 tenemos la siguiente solución:

q=2-2q
Al resolver algebraicamente para el jugador 2 tenemos:

q=2/3
Es decir:

1-q=1/3
De forma complementaria:

En este caso, el equilibrio de Nash mixto es el siguiente:

Observamos que las probabilidades son diferentes para cada jugador y para cada estrategia, lo anterior
significa que cada uno optimiza cuando elige su estrategia que esté acorde a su preferencia, en caso
de elegir la otra estrategia no obtiene la máxima utilidad posible.

POLITÉCNICO GRANCOLOMBIANO 13
Referencias
Barron, E. (s. f.). Game Theory an Introduction. Loyola University Chicago.

Blázquez, M. y Gámez, C. V. (2006). Teoría de juegos y aplicaciones: el dilema del prisionero. Madrid:
Universidad Carlos III de Madrid, Departamento de Ingeniería Telemática.

Ferreira, J. L. (2009). La teoría de los juegos, la historia más lúdica jamás contada (parte 2). Recuperado
de http://todoloqueseaverdad.blogspot.com/2009/09/la-teoria-de-los-juegos-la-historia-mas_16.
html

Kreps, D. (s. f.). Teoría de juegos y modelación económica. México: FCE.

Lemaire, J. (s. f.). An Application of Game Theory: Cost Allocation. Universite Libre de Bruxelles.

Martínez, M. A. y Martínez, M. M. (2011). Teoría de juegos. Autores científico-técnicos y académicos.


Recuperado de https://dialnet.unirioja.es/servlet/articulo?codigo=5724682

Minbang, J. Van Steenkiste, I. & Bernal, L. (s. f.). La teoría de juegos: el arte del pensamiento estratégico
(Kindle edition).

POLITÉCNICO GRANCOLOMBIANO 14
INFORMACIÓN TÉCNICA

Módulo: Teoría de Juegos


Unidad 2: Equilibrios de Nash: puros y mixtos
Escenario 4: Equilibrios de Nash mixtos

Autor: Juan Pablo Roa

Asesor Pedagógico: Jessica Katherin Pinzón Arias


Diseñador Gráfico: Katherinne Pineda Rodriguez
Asistente: Julieth Ortiz

Este material pertenece al Politécnico Grancolombiano.


Prohibida su reproducción total o parcial.

POLITÉCNICO GRANCOLOMBIANO 15

También podría gustarte