Nash.docx

  • Uploaded by: Natalia Son Vargas
  • 0
  • 0
  • April 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Nash.docx as PDF for free.

More details

  • Words: 2,597
  • Pages: 7
El esquema de arbitraje de Nash y las soluciones cooperativas En nuestro análisis de los juegos de suma no cero hasta este punto, los jugadores han jugado de manera no cooperativa. Cada uno ha tratado de hacer lo mejor posible por sí mismo al elegir estrategias o al hacer compromisos estratégicos, amenazas o promesas. En este capítulo consideraremos un enfoque diferente. Imagine a los jugadores sentados juntos para decidir cuál es un resultado razonable o justo para el juego, y luego acordar implementar ese resultado. Alternativamente, imagine que los jugadores llaman a un árbitro externo imparcial para determinar un resultado razonable y justo, y aceptan cumplir con su decisión. ¿Qué principios deberían guiar a los jugadores o al árbitro externo en este contexto? ¿Podemos determinar un resultado razonable y justo para un juego? Como ejemplo, considere

¿Cómo recomendarías a los jugadores que resuelvan este juego de manera justa? El consejo más obvio podría ser que Rose y Colin elijan el resultado con el mayor pago total y luego lo dividan en partes iguales. En este juego jugarían a Rose A-Colin B por un total de 15, y dividirían el pago para obtener 7.5 cada uno. Llamemos a esto la propuesta igualitaria. A pesar de su atractivo democrático, la propuesta igualitaria está viciada de dos maneras diferentes que ilustran importantes sutilezas en nuestro problema. El primer defecto es que las ganancias en el juego se supone que son utilidades. Como sabemos por el Capítulo 9 que las entidades de diferentes jugadores no se pueden agregar de manera significativa, no podemos calcular la utilidad total "de cada uno de nosotros, para elegir el total más grande. Dado que las utilidades de los diferentes jugadores no se pueden comparar o transferir, no podemos dividirnos por igual. La propuesta simplemente no tiene sentido. La segunda falla es que la propuesta igualitaria, incluso si pudiéramos encontrar una manera de darle sentido, descuida las asimetrías de la posición estratégica en el juego. En este juego, Colin tiene una posición estratégica fuerte. ya que Colin A dona a Colin B y el resultado natural del juego es que Rose B Colin A. le da a Colin su mejor resultado. Colin podría razonablemente argumentar que es injusto ignorar la realidad de su posición estratégica superior para determinar un resultado justo para el juego Por lo tanto, nuestro desafío es encontrar un método de arbitraje de juegos que implique una manipulación ilegítima de las utilidades, que tenga en cuenta las desigualdades estratégicas y que tenga un efecto de desmayo. La primera buena idea en este sentido se remonta a von Neumann y Morgenstern 944]. Argumentaron que cualquier solución arbitrada razonable para un juego de suma no nula debería ser i) ii)

Pareto opimal. No debería haber otro resultado mejor para ambos jugadores, o mejor para uno e igualmente bueno para el otro En o por encima el nivel de seguridad para ambos jugadores. Ninguno de los jugadores debe ser obligado a aceptar menos de lo que podría garantizarse a sí mismo

mediante un juego no cooperativo. El conjunto de resultados (puros y mixtos) que satisfacen estas dos condiciones se denomina conjunto de negociación del juego. En el Juego 16.1 puede verificar que los niveles de seguridad son 10/3 para Rose, 6 para Colin. Mirando el polígono de pagos Figura 16.1, vemos que los resultados óptimos de Pareto son aquellos en el segmento de línea que une (4, 8) a (10.5). Por lo tanto, el conjunto de negociación consiste en resultados en el segmento de línea trom (4, 8) a (8,6). Éstas corresponden a las mezclas Rose y Colin plaving de BA y AB, y BA se juega al menos la mayoría del tiempo. Tenga en cuenta que esta receta no implica agregar o comparar servicios, y tiene en cuenta, a través de los niveles de seguridad, al menos algo de Colin. ventaja estratégica en el juego. Por supuesto, solo especificamos una serie de resultados razonables. ¿Podríamos elegir, dentro de ese rango, un solo resultado como el más justo?

John Nash propuso una hermosa idea de cómo hacer esto [19501b Se conoce como el esquema de arbitraje de Nash. Nash consideraba un problema más general. Supongamos que dos partes negociadoras, Rose y Colin, tienen disponible una colección de resultados que. cuando están representados en un plano de coordenadas por sus utilidades a Rose y Colin, dan un polígono convexo. Las partes intentan ponerse de acuerdo sobre algún tema de este conjunto. Si no están de acuerdo, obtendrán algo de "default" Resultado en el polígono, llamado punto status quo. ¿Cómo podrían elegir un punto justo para acordar? Un método general para resolver este problema debe tomar cualquier polígono convexo en el planc, con un punto SQ de status quo en ese polígono, y producir un punto en el polígono como solución. Un método que hace esto se llamará esquema de arbitraje. Nash comenzó escribiendo cuatro axiomas (compárese con el Capítulo 10) que él creía que un esquema de arbitraje razonable debería satisfacer AXIOM 1: RACIONALIDAD. El punto de solución debe estar en el conjunto de negociación. AXIOM 2: INVARIANZA LINEAL. Si las utilidades de Rose o de Colin se transforman mediante una función lineal positiva, el punto de solución debe transformarse mediante la misma función. AXIOM 3: SIMETRÍA. Si el polígono

resulta ser simétrico con respecto a la línea de pendiente +1 a SQ. entonces el punto de solución debería estar en esta línea. AXIOM 4: INDEPENDENCIA DE ALTERNATIVAS IRRELEVANTES. Supongamos que N es el punto de solución para un polígono P con punto quo status SQ. Supongamos que Q es otro polígono que contiene SQ y N, y está totalmente contenido en P. Entonces, N también debería ser el punto de solución para Q con SQ de status quo. Vea la Figura 16.2 para imágenes de los axiomas. Los tres primeros axiomas parecen bastante sencillos. En particular, Axiom 3 encarna la idea de equidad como simetría o no discriminación, en el caso especial de circunstancias completamente simétricas. Axioma 4. por otro lado, es más complicado. Nash defendió

Axioma 4 de la siguiente manera. Supongamos que en la situación donde P es el conjunto de alternativas disponibles y SQ es el status quo, Rose y Colin están de acuerdo en que N es el resultado más justo posible. Ahora suponga que se descubre que algunos de los resultados en P no están disponibles después de todo, el conjunto de resultados disponibles se reduce a. Entonces, N, que fue juzgado más justo que todos los demás resultados en P, aún debería ser más justo que todos los demás resultados en 2 Me parece convincente el argumento de Nash, pero debemos ser claros sobre el tipo de cosas que excluye el Axioma 4. En la figura 16.3. Supongamos que N es la solución al problema de arbitraje (EAC, SQ). Luego, por Axiom 4, también debe ser la solución al problema (EAB, SQ). Pero si pensáramos que N era justo porque parecía ser un compromiso razonable entre el punto C preferido de Rose y el punto A

preferido de Colin, ¿no sería más justo un punto como M si resulta que C no está disponible y es lo mejor que puede Rose? esperanza para es B? Nash argumenta que si N era más justo que M con Cavailable, aún es más justo si Cis no está disponible. El desvanecimiento no debe verse afectado por la disponibilidad o indisponibilidad de alternativas poco realistas de pastel en el cielo. No todos los que han considerado el problema están de acuerdo. Vea el Ejercicio 7 para un enfoque diferente.

Si aceptamos aceptar los cuatro axiomas de Nash como condiciones que un esquema de arbitraje debe cumplir. entonces el esquema de arbitraje que deberíamos usar está completamente determinado, ya que Nash demostró el siguiente teorema notable: TEOREMA [NASH, 1950B]. Hay un único esquema de arbitraje que satisface los axiomas 1 al 4. Es este: Si SQ = (x_0, y_0), entonces el punto N de solución arbitrada es el punto (x, y) en el polígono con x> = x_0 y y> = y_0 que maximiza el producto (x-x_0) (y-y_0).

(Si el valor máximo de este producto es positivo, el punto (x, y) se determina de forma única. Si el máximo del producto es cero, debe ser porque y-y_0 o x-x_0 nunca son positivos. Si y- y_0 nunca es positivo, el punto de solución se define como (x, y_0) donde x es el valor más grande, de modo que este punto está en el polígono, y de manera similar, si x-x_0 nunca es positivo.) El teorema es sorprendente en primer lugar debido a la declaración de unicidad: este esquema de arbitraje es el único que satisfará los axiomas de Nash. En segundo lugar, es sorprendente porque nos obliga a maximizar el producto de las ganancias de utilidad de los jugadores desde el punto del status quo. Eso parece misterioso, pero note que encaja bien con el axioma 2. Si multiplicamos todos los valores de x, digamos, por una constante positiva, el producto (x-x_0) (y-y_0) se multiplicaría por esa constante, y el resultado que maximizó el producto antes todavía lo maximizaría después. De hecho, es bastante fácil comprobar que este esquema de arbitraje satisface los cuatro axiomas de Nash. Es un poco más difícil demostrar que es el único esquema que lo hace, pero la prueba es bastante instructiva y vale la pena seguirla de cerca. PRUEBA. Comenzamos con cualquier polígono 2, con el punto del status quo (x_0, y_0). Indica con N el punto en Q con x≥x_0, y≥y_0 que maximiza el producto (x-x_0) (y- y_0). Debemos demostrar que

cualquier esquema de arbitraje que satisfaga los Axiomas 1-4 debe elegir N como el punto de solución para esta situación. Usando Axioma 2, primero restamos x_0 de todas las utilidades x y de y_0 de todas las utilidades y, de modo que el punto de status quo esté en (0,0). Luego, multiplicamos las utilidades x y y por las constantes positivas, de modo que el punto N esté en (1,1). Luego, por la propiedad de maximización del producto de N, todo el polígono Q debe estar sobre o debajo de

(Si el punto de solución tiene x = x_0 o y = y_0 o ambos, se necesita un argumento diferente, pero se lo dejo a usted) la rama positiva de la hipérbola xy = 1 (ver Figura 16.4). De hecho, como la hipérbola es cóncava hacia arriba y Q es convexa, Q debe estar sobre o debajo de la línea tangente a la hipérbola en (1,1), que es la línea x + y = 2. Por lo tanto, podemos encerrar a Q en una el polígono P más grande que tiene esta línea tangente como su límite noreste, y es simétrico con respecto a la línea x = y. La relación se ilustra en la Figura 16.4. Ahora, por los axiomas 1 y 3, la solución al problema de arbitraje (P, (0,0)) debe ser N. Luego, por el axioma 4, la solución al problema de arbitraje (Q, (0,0)) también debe ser N , y hemos terminado! Observe cómo cada uno de los axiomas entra en juego en este argumento, y en particular el poderoso papel del Axioma 4 al final. Además de la elegancia teórica de su prueba, la solución de Nash al problema del arbitraje tiene la ventaja de ser fácil de

calcular. Consideraremos dos ejemplos. EJEMPLO 1. Suponga que Rose y Colin deben estar de acuerdo con uno de los resultados A = (0,0), B = (2,0), C = (4,2), D = (1,5), o alguna probabilidad Mezcla de estos resultados. Los números para cada resultado son, por supuesto, las utilidades de Rose y Colin para ese resultado. Si no pueden ponerse de acuerdo, el resultado será SQ = (2,1). Como árbitro de Nash, ¿qué propugnaría por una solución justa? La situación se ilustra en la figura 16,5a. El punto de Nash debe estar en el conjunto de negociación, que es el segmento de línea de (2, 4) a (4,2). Es el punto en este segmento de línea que maximiza el producto (x- 2) (y -1). Como la ecuación del segmento de línea es y = 6- x (2≤ x ≤4), la expresión que debemos maximizar es (x - 2) (6-x-1) = - x ^ 2 + 7x - 10 Para el expresión cuadrática general -ax ^ 2 + bx + c (a≥0) puede usar el cálculo si lo sabe, o completar el cuadrado si no lo hace, para encontrar que el máximo ocurre en x = b / 2a. Por lo tanto, para nuestro problema, el máximo es x = 7/2. y y = 6-7 / 2 = 5/2. Esto es 5 / 6C + 1 / 6D, que es lo que debe recomendar como solución. Este problema tiene la propiedad especial de que el límite óptimo de Pareto es un segmento de pendiente -1. Cuando eso es cierto, hay una forma geométrica fácil de encontrar el punto de solución de Nash: comience en SQ y viaje al noreste hasta que llegue al límite, y ese punto será el punto de Nash (consulte la Figura 16.5a). En los ejercicios se le pide que explique por qué esto es cierto y que averigüe qué sucede cuando el conjunto de negociación se encuentra en una línea de pendiente distinta de -1. EJEMPLO 2. Supongamos que las alternativas son A = (1, 😎, B = (6,7), C = (8,6), D = (9,5), E = (10,3), F = (11, -1), G = (- 1, -1) y el status quo es SQ = (2, 1). ¿Cuál es el punto de solución de Nash? La situación se ilustra en la Figura 16.5b. El conjunto de negociación es una colección de segmentos de línea. Para tener una idea de dónde puede estar el punto de solución, calculamos

(x-2) (y-1) para los puntos de esquina del conjunto de negociación:

Como C tiene el producto más grande, el punto de solución estará en uno de los dos segmentos de línea BC o CD. La línea que contiene BC tiene la ecuación y = 10- 1 / 2x, por lo que debemos maximizar

El máximo se produce en x = 10, que está más allá del extremo C del segmento de línea BC. Por lo tanto, el máximo en este segmento de línea se encuentra en el punto final C. De manera similar, puede verificar (Ejercicio 3) que el máximo de (x-2) (y-1) en el CD del segmento de línea se produce en el punto final C. Por lo tanto, C es El punto de solución de Nash. Con la solución de Nash al problema de arbitraje general en la mano, podemos considerar nuestro problema original de encontrar una solución arbitrada justa para un juego de suma no nula. El polígono de pagos del juego nos da el polígono para un problema de arbitraje. Para encontrar el punto del status quo, tenemos que preguntar qué sucederá si el arbitraje falla. Una posibilidad es admitir que no sabemos qué sucederá, excepto que cada jugador puede garantizar al menos su nivel de seguridad. Por lo tanto, podríamos tomar como el status quo el punto cuyas coordenadas son los niveles de seguridad de Rose y Colin. Para el Juego 16.1 tomaríamos SQ = (3 1 / 3,6). La solución arbitrada de Nash resulta ser (5 2/3, 7 1/6), o 13/18 BA + 5 / 18AB (Ejercicio 1). Recomendaríamos a los jugadores que acepten jugar BA con probabilidad 13/18, AB con probabilidad 5/18. Si estuvieran jugando el juego muchas veces, podrían jugar BA 13/18 del tiempo, AB 5/18 del tiempo

More Documents from "Natalia Son Vargas"

April 2020 5
Lebes.pdf
December 2019 10
Nash.docx
April 2020 4
1409.pdf
April 2020 17
Anillos2.pdf
April 2020 1