BLOG / TEORÍA DE JUEGOS Y REDES
 
Carlos Rodríguez-Sickert
Ph.D. Cambridge, Reino Unido.
 
Teoría de Juegos y Redes
TEORÍA DE JUEGOS: Modelar el comportamiento social cuando hay interdependencia estratégica
Publicación 1 de 4, Clases del MBA - UDD todos los domingos en El Mercurio
Podemos predecir qué hará un equipo, un grupo de empresas o de ciudadanos o unos cazadores frente a un mamut.
Nov
22
2015

Robert Wright: la sociedad se vuelve cada vez menos un juego de suma cero, a medida que se vuelve más compleja e interdependiente.



Esta teoría se ha transformado en un lenguaje unificador de las ciencias del comportamiento con aplicaciones desarrolladas en la psicología, las ciencias de la administración, la sociología y las ciencias políticas.
Click para ampliar la imagen.

Como en el póker


En situaciones de interdependencia estratégica, la posición final en la que nos encontremos en relación a los objetivos que nos hemos planteado no dependen únicamente de nuestras propias elecciones, sino también de las elecciones que adopten otros individuos involucrados, quienes también persiguen un objetivo propio, y que a su vez dependen de nosotros para obtenerlo.

Una de las ventajas de la Teoría de Juegos es su potencial para representar relaciones de interdependencia en distintos contextos: entre los miembros de un equipo en una organización productiva, entre ciudadanos que comparten un espacio común, un grupo reducido de firmas que compiten en un mercado con altos niveles de concentración, los generales que comandan dos ejércitos involucrados en un conflicto militar o los cazadores de una tribu del paleolítico al toparse con un mamut.

Bajo este esquema, el primer desafío de un practicante de la Teoría de Juegos es caracterizar la relación de interés como un juego. Para esto se deben especificar los siguientes elementos:

a. Jugadores: ¿Quiénes son los actores involucrados en la situación? Pueden ser individuos (empleados, ciudadanos) o grupos (firmas, estados).

b. Reglas: ¿Qué acciones tiene a su disposición cada jugador? ¿Cuál es la secuencia de la interacción? ¿Qué información posee cada jugador al tomar cada decisión?

c. Desenlaces: ¿Cuáles son los posibles resultados de la interacción a partir de la implementación de distintas estrategias por parte de los jugadores? En escenarios en los que existe una fuente de incertidumbre externa a la situación, la combinación de estrategias implementadas definirá el desenlace de este juego solo cuando se haya resuelto dicha incertidumbre.

d. Preferencias: ¿Cómo ordena cada jugador los posibles desenlaces? Este orden dependerá de la valoración que este jugador les asigne a las distintas dimensiones de la experiencia.

Una vez definidos estos cuatro elementos, la Teoría de Juegos permite predecir las estrategias que cada jugador implementará (equilibrio del juego). En la práctica, para aplicar el concepto de equilibrio en un juego necesitamos conocer a priori las preferencias de los jugadores involucrados (motivaciones).

La forma en que ha operado la teoría de juegos de facto, sobre todo en sus aplicaciones económicas, ha sido asumir que cada jugador intenta maximizar su interés propio sin consideraciones por el bienestar del resto de los agentes involucrados en el juego. Los resultados obtenidos durante las últimas décadas nos han mostrado, sin embargo, que este supuesto puede no ser el adecuado en algunos contextos sociales. Más aún, como veremos en los próximos domingos, la aplicación de estos experimentos en distintos grupos sociales nos puede entregar información acerca de la intensidad con la que operan motivaciones que se desvían del modelo del homo economicus como el altruismo o la reciprocidad.

El trabajo seminal de la Teoría de Juegos fue desarrollado por John Von Neumann y plasmado en el Theory of Games and Economic Behavior (1944) escrito en colaboración con Oskar Morgenstern que propuso un concepto de equilibrio para un caso particular de juegos de suma cero.
En un juego de suma cero, las eventuales ganancias de un jugador tienen como correlato inexorable pérdidas por un monto equivalentes en el resto de los jugadores, esto es, el tamaño de la torta a repartir es fija. En un juego de suma distinta de cero, la ganancia de un jugador no está necesariamente asociada a la pérdida por parte de otro. Un ejemplo es el póker.

Las limitaciones de la herramienta provistas por el trabajo de Von Neumann explican por qué en sus inicios, las aplicaciones de la teoría de juegos estuvieron en gran medida restringidas, además del póker, al ámbito militar. La ganancia territorial que obtiene el ejército vencedor está asociada a la pérdida de dicho territorio por parte del derrotado, es decir, es un juego de suma cero. Von Neumann mismo, se rumorea, fue un asesor de alto nivel durante la administración de Nixon en plena guerra fría.

En 1950, John Nash en un artículo en la prestigiosa revista PNAS presentaba su gran contribución a la Teoría de Juegos y que hoy conocemos como “Equlibrio de Nash”. A partir de este trabajo, se desplazó el foco hacia juegos de suma distinta de cero. En 1994, más de cuatro décadas después de su artículo, John Nash recibió el Premio Nobel junto a John Harsanyi, que amplió el concepto de Nash para incorporar la incertidumbre y Reinhard Selten, que refinó el concepto para incorporar aspectos estratégicos en juegos secuenciales.

Robert Wright en su libro Non-Zero: The Logic of Human Destiny argumenta que la sociedad se vuelve cada vez menos un juego de suma cero, a medida que se vuelve más compleja, especializada, e interdependiente.

Un caso: ¿Confiar o no en un profesor que me pide desarrollar un software?


A partir de los trabajos de Putnam y Fukuyama se le ha asignado un rol central a la confianza en las sociedades modernas porque esta se relaciona con el desempeño de la economía. Veamos las condiciones que se cumplen en una relación de confianza:
1. Participación voluntaria por parte del actor que deposita la confianza (DC).
2. Beneficios potenciales mutuos asociados a un desenlace cooperativo tanto para el agente que deposita la confianza como para su agente receptor (RC)
3. Incentivos perversos enfrentados por el receptor de la confianza.
Para ejemplificar una relación de confianza consideremos la siguiente situación de interdependencia estratégica: un profesor universitario le solicita a un alumno con habilidades computacionales que desarrolle un determinado software. El valor de este último es de $8MM, pero solo el profesor posee los contactos para materializar su venta. Asociado al costo alternativo de su tiempo, el desarrollo de este software tiene un costo de $ 2MM para el alumno. Sin que medie contrato alguno, el profesor le propone repartir los beneficios netos de la venta en partes iguales. De esta forma, el alumno puede rechazar la oferta (desconfiar), caso en que no habrá ni pérdidas ni ganancias para ninguno.



Click para ampliar la imagen.

En caso de que el alumno decida confiar en el profesor y este último honrar dicha confianza entregándole $5MM, ambos obtendrán un beneficio neto de $3MM. Si alternativamente el profesor decide traicionar la confianza, terminará con una ganancia material de $ 8MM y el alumno con una pérdida de $2MM. A la culpa que sufre el profesor cuando decide traicionar al alumno, medida en unidades monetarias, se le designara C.

Asumiremos que su eventual parte de la venta y el costo asociado a la producción son las únicas variables que afectan las preferencias del alumno, y que sus ganancias materiales por la venta y el eventual costo moral de la traición son las únicas variables que afectan las preferencias del profesor. A partir de esta información podemos representar esta interdependencia estratégica (ver figura).
La posibilidad de desconfiar por parte de RC, hace que se cumpla la primera condición de una relación de confianza; el que ambos jugadores estén mejor cuando el alumno confía y el profesor honra dicha confianza hace que se cumpla la segunda condición, y el que existan ganancias materiales adicionales por parte del profesor al traicionar la confianza, la tercera.

En la figura el valor C representa el costo moral que sufre el profesor en caso de no honrar la confianza.Consideraremos dos casos: En el primero, el alumno enfrenta a un profesor tipo homo economicus y por lo tanto, el valor de la culpa para este profesor al quedarse con los $8MM es de C = $0; en el segundo caso, el alumno enfrenta a un profesor tipo homo moralis que sufre una culpa de C = $7MM al quedarse con el valor completo de la venta. En la medida en que no incorporamos fuentes externas de incertidumbre este juego corresponde a un juego de información completa.
Asimismo, hemos asumido que los valores de venta y el costo de productos alternativos son conocidos por ambos jugadores y que el profesor decide si traicionar o no la confianza una vez que el alumno ya decidió confiar. Asi, este juego corresponde además de un juego de información incompleta a un juego de información perfecta.

Si el profesor tuviera que tomar la decisión de honrar o traicionar la confianza sin saber si el alumno decidió confiar en él, o si el alumno al decidir si confiar o no en el profesor no sabe si se encuentra frente a un profesor como el presentado en el caso 1 o a uno como el del caso 2, nos enfrentaríamos a un juego de información imperfecta.
En un juego de información completa y perfecta, para computar el equilibrio, se utiliza el método de la inducción hacia atrás (sobre el que se construye el concepto de perfección en subjuegos desarrollado por Selten y que refina el concepto de equilibrio propuesto por Nash): mediante la previsión de lo que el último jugador que elige va a hacer en esa situación es posible determinar qué va a hacer el penúltimo jugador en elegir, y así sucesivamente.

En el primer caso, aplicando el método de la inducción hacia atrás, cuando el alumno se enfrenta a un profesor sin escrúpulos, anticipará su traición (el profesor tiene una ganancia adicional de $5MM si decide quedarse con el valor completo de la venta) y por lo tanto decidirá desconfiar. En el segundo caso, la culpa medida en unidades monetarias es mayor a los incentivos perversos y por ende opera como un disuasivo interno, el alumno anticipará que, en caso de confiar, esta confianza será honrada por el profesor por lo que se justifica hacer el software.

HASTA EL DOMINGO



ÚLTIMOS COMENTARIOS
Deja tu comentario:
Nombre*:   
E-mail*:   
Validador*:   captcha
   
Mensaje*:  
  500 Caracteres restantes.
   

Última actualización: 12 de Noviembre de 2018 a las 17:43