Un teorema de imposibilidad sobre decir la verdad en sistemas completamente descentralizados


Un teorema de imposibilidad sobre la verdad en sistemas totalmente descentralizados

Mostramos que los informes veraces sobre la realización de un evento observado públicamente no pueden implementarse como un equilibrio único en un entorno completamente descentralizado. Nuestro trabajo proporciona una base teórica de la necesidad de oráculos y el «problema del oráculo» relacionado.

Palabras clave: sistemas descentralizados, contratos inteligentes, decir la verdad, problema del oráculo

Los contratos inteligentes son contratos programables autoejecutables entre dos o más partes. Los contratos inteligentes no requieren una autoridad de investigación porque su legitimidad se basa en tecnologías de contabilidad descentralizadas. Sin embargo, la implementación de muchas aplicaciones de contratos inteligentes potencialmente útiles depende de la verificación de que algún evento del mundo real ha tenido lugar (piense en los contratos de seguro). Esto es un problema. Dada su naturaleza totalmente descentralizada, ¿cómo selecciona un contrato inteligente cuál es el verdadero estado del mundo? En términos más generales, ¿cómo funcionan los sistemas totalmente descentralizados cuando su funcionamiento depende de la existencia de un registro único y mutuamente aceptado de la verdad, pero no existe una sola autoridad que pueda proporcionar este registro?

Este documento considera una situación en la que varias personas buscan celebrar acuerdos basados en el resultado de un evento del mundo real, pero no hay una parte confiable (es decir, una fuente contraíble) que pueda usarse para determinar los pagos. En este caso, los pagos deben basarse en alguna forma de acuerdo colectivo sobre el verdadero estado del mundo. Al apelar a tres propiedades básicas, el anonimato, la neutralidad y la mono tonicidad, podemos restringir la atención al voto mayoritario. En este entorno, los agentes informan la verdad que es más beneficiosa para ellos. Los incentivos para recompensar el consenso no necesariamente mejoran las cosas. Más bien, conducen a una situación que es similar a un concurso de belleza ‘a la Keynes (1936), en el que los agentes informan lo que creen que la mayoría de los otros agentes informarán. Con o sin incentivos de información, el informe del verdadero estado que resulta de la votación por mayoría no depende del verdadero estado.

Nuestro análisis principal se centra en la votación simultánea. Sin embargo, también exploramos brevemente la posibilidad del juego secuencial, permitiendo que las personas voten en un orden aleatorio y permitiendo que cada persona vea los votos anteriores. En un modelo de tres agentes con votación secuencial, los individuos acuerdan unánimemente cuál es el estado del mundo, pero este puede no ser el verdadero estado. El resultado sugiere que el voto secuencial no es una solución al problema de decir la verdad.

Nuestro resultado general, que se aplica a los juegos de votación simultánea, es que la única forma en que los individuos están dispuestos a votar de acuerdo con el verdadero estado es si son completamente indiferentes en cuanto a lo que debería ser el verdadero estado. Es decir, sus pagos no pueden depender de sus acciones o sus informes individuales. Este resultado general sugiere que en ausencia de motivación adicional (por ejemplo, preferencias deontológicas hacia la verdad reveladora, ver Bergström et al. (2019)) que vincule los pagos individuales con la verdad, no hay forma de implementar contratos que paguen en función de un estado observado sin una fuente confiable.

Nuestro análisis tiene aspectos en común con los juegos de predicción entre pares y las referencias que contienen. En estos entornos, normalmente hay un objeto que tiene una característica desconocida y varios agentes pueden esforzarse para obtener una señal sobre esta característica. Estas señales pueden estar correlacionadas (es decir, provienen de la misma distribución), pero normalmente no hay una «verdad básica» conocida. La literatura estudia los mecanismos de predicción por pares que se utilizan para asegurarse de que los agentes ejerzan esfuerzo y que comuniquen sus señales con veracidad.

Un aspecto que hace que tanto nuestro juego como PPG sean similares es que en ambos casos los agentes tienen que enviar señales sobre lo que observan. Además, ni el mecanismo de predicción entre pares ni el nuestro pueden confiar en la verdad básica (incluso si existe) para disciplinar a los agentes. Sin embargo, hay diferencias importantes entre los PPG y nuestro juego. Nuestro juego es de conocimiento común (todos conocen el verdadero estado, y todos saben que todos saben, etc.), mientras que no hay conocimiento común en PPG. Esto se debe en parte a que puede no haber una verdad objetiva, sino que la verdad puede ser subjetiva. Además, en los PPG, los agentes no conocen las señales de los demás. Trivialmente, nuestros agentes no necesitan esforzarse para coordinar lo que comúnmente y libremente observan. Nuestros agentes tienen un interés ex ante en la «verdad», mientras que en PPG la única recompensa es la que los agentes obtienen al «hacerlo bien» en relación con otros agentes. Finalmente, en nuestro juego, la recompensa es idiosincrásica y depende de los «tipos».

La importancia de la capacidad de escribir contratos basados en estados observados ha sido reconocida durante mucho tiempo en la literatura económica. Radner (1968) formalizó el requisito de verificación estatal en el análisis competitivo clásico al limitar los contratos a eventos que podían ser verificados por todas las partes. Los escenarios en los que las partes están asimétricamente informadas fueron analizados por primera vez quienes utilizan las limitaciones implícitas de la información asimétrica para explicar la prevalencia de los contratos de deuda simples. Esta literatura, incluidos los muchos documentos que siguieron a estos trabajos seminales, reconoce los problemas que surgen cuando la verificación estatal es costosa, pero generalmente asume que una parte (que puede determinar el estado a través de acciones privadas) conoce el verdadero estado y que esto no es fácilmente verificado por la otra parte. El problema que consideramos es muy diferente en que no hay asimetría informativa sobre la realización del estado verdadero y el verdadero estado se determina exógenamente. También es distinta de la literatura sobre contratos incompletos (por ejemplo, Grossman y Hart (1986), Hart y Moore (1999), Tirole (1999)), que tiene más que ver con la incapacidad de especificar todas las contingencias, o los costos asociados con hacerlo.

Este trabajo es relevante para las aplicaciones financieras descentralizadas en las que los contratos se escriben con pagos que dependen de los resultados de los eventos del mundo real. Nuestros trabajos proporcionan una base teórica de la necesidad de oráculos y el «problema del oráculo» relacionado (Caldarelli (2020)).

Un ejemplo de lanzamiento de moneda

Comenzamos con un ejemplo en el que un número impar N, de agentes apostan por el resultado de un lanzamiento de moneda pública. El modelado comienza después de que se realizan las apuestas. Estas apuestas están determinadas por factores exógenos que están fuera del modelo. De hecho, está bien asumir que estas apuestas están determinadas por los propios lanzamientos de monedas independientes de los agentes. El propósito es ilustrar la dificultad de obtener el resultado veraz del lanzamiento de monedas públicamente observable de la población de apostantes.

Votación simultánea

Cada agente i = 1, …, la apuesta inicial de N se denota por bi ∈ {H, T}, donde H representa cara y T representa colas. Sea b = {b1, …, bN} el perfil de apuestas. La fracción de agentes que apuestan por las caras se denota por β = P i I {bi = H}/N, donde I{x} es la función indicadora. Después de su apuesta, los agentes aprenden el registro agregado de apuestas β, pero no las apuestas individuales. Entonces la naturaleza lanza la moneda con la realización θ ∈ {H, T}. Esta realización es públicamente observable, pero no directamente contraíble. Más bien, el resultado del lanzamiento de la moneda, con el fin de pagar las apuestas, debe determinarse mediante algún procedimiento de votación. Así que el voto del agente i es, al menos en principio, una función vi (bi, β, θ) que mapea la apuesta inicial del agente i, el registro de apuestas agregado y la realización pública del lanzamiento de la moneda en {H, T}. Asumimos que la regla de votación es la votación por mayoría. Esto se justifica apelando al teorema de May (mayo (1952)):

Teorema de May. Considere cualquier elección de 2 candidatos con un número impar de votantes. Si el sistema de votación satisface (1) la igualdad de trato de los votantes (anonimato), (2) la igualdad de trato de los candidatos (neutralidad) y (3) la mono tonicidad (si A gana con un voto, entonces A gana con un + 1 votos), entonces el sistema de votación es la mayoría simple.

Votación secuencial

Hasta ahora hemos analizado un juego en el que los agentes votan simultáneamente sobre el resultado observado del lanzamiento de la moneda. En ese contexto, el resultado del juego es indeterminado porque depende de las creencias de los agentes. Ahora intentamos resolver esta indeterminación haciendo que los agentes voten secuencialmente. Intuitivamente, con la votación secuencial, los agentes pueden actualizar sus creencias en función de los votos que ya se han realizado. Mostramos que, si bien la votación secuencial puede romper la indeterminación, los agentes aún no pueden coordinar el resultado observado públicamente.

En el juego de votación simultánea de la sección anterior, la información privada de cada agente individual sobre cómo apostaban era irrelevante. En el entorno secuencial, la información privada sobre apuestas individuales es importante, ya que los agentes deben hacer inferencias sobre si los agentes están siguiendo estrategias contingentes de tipo particular. Estas inferencias determinan las probabilidades que los agentes asignan a estar en cualquier conjunto de información particular en el juego.

Ahora consideramos un juego en el que la estrategia de un agente especifica su acción en cada conjunto de información, y los agentes tienen creencias sobre en qué nodo se encuentran dentro de cada conjunto de información. El concepto de solución que utilizamos es el equilibrio bayesiano perfecto (PBE).

Consideremos al tercer votante. En el camino de equilibrio este agente ve dos votos T. Si apuesta H, sabe en qué conjunto de información está y vota T. Esto le da un pago de π (3). Si apuesta T, asigna la misma probabilidad a dos posibles rutas de votación, pero aun así vota T, ya que esto produce el mayor pago posible de w (2) + π (3). Fuera del camino de equilibrio, el tercer votante ve al menos un voto H y el agente que apuesta H y vota al final votará H (ya que ya hay al menos otro voto H). Un agente que apueste T y vote al final votará T a menos que el historial de votación fuera de ruta sea (H, H), en cuyo caso también votará H y ganará π (3).

A continuación, considere la decisión de voto del segundo votante. En el camino del equilibrio ve un voto de T por el primer votante. Si apuesta T, asigna el mismo peso a las dos rutas de votación (que dependen del tipo de apostante desconocido del primer votante) y vota T, ya que esto le garantiza el mayor pago posible de w (2) + π (3). Si apuesta H, entonces conoce el camino, y sabe que el tercer votante votará T, por lo que también vota T para obtener un pago de π (3). Fuera del camino del equilibrio, si ve que el primer votante vota H y apuesta T, entonces cree con probabilidad 1 que el primer votante apuesta H. Por lo tanto, es mejor votar T ya que cree que el tercer votante debe haber apostado T. Si el segundo votante apuesta H y ve que el primer votante vota H, entonces vota H para obtener el pago máximo w (2) + π (3).

Finalmente, considere la decisión de voto del primer votante. Si el primer votante apuesta H, entonces sabe que los siguientes dos votantes apuestan T y que votarán T, independientemente de cómo vote, por lo que el primer votante vota T para obtener el pago π (3). Si el primer votante apuesta T, vota T esperando que los dos votantes restantes sigan adelante con las estrategias de equilibrio.

Curiosamente, la introducción del voto secuencial en el caso con γ < 1 induce a los agentes a condicionar sus votos a sus tipos individuales (es decir, apuestas iniciales determinadas exógenamente). Es decir, la votación secuencial permite a los agentes coordinarse en uno de los dos equilibrios que están presentes en el juego simultáneo. Naturalmente, se coordinan en los equilibrios preferidos por la mayoría.

Resultado de imposibilidad

El número de agentes, N, es grande e impar. Agente i ∈ {1, …, N} tiene tipo (anteriormente llamado su apuesta) bi ∈ {0, 1}. Sea b el perfil tipográfico determinado aleatoriamente para esta economía. Supongamos que la naturaleza (al azar) selecciona el estado (anteriormente el resultado del lanzamiento de la moneda) θ ∈ {0, 1}, que comúnmente se sabe que es observado por todos. Cada uno de los agentes N tiene que anunciar cuál es el estado. Como antes, la fracción de agentes cuyo tipo es 1 se denota por β = P i bi/N.

Un mecanismo descentralizado para determinar el estado acordado es un espacio de mensaje M, una función de estado g: MN → {0, 1} que mapea el perfil de mensaje m = (m1, …, mN) ∈ MN en un estado, y una función de resultado f: {0, 1} N × {0, 1} → R N que mapea el perfil de tipo y el resultado de la función de mensajería en un vector equilibrado de pagos a los N agentes. El agente de utilidad i recibe del mecanismo se escribe como u (fi (b, g(m))) donde u (·) es creciente y cóncavo en f, u (0) = 0. El mecanismo está equilibrado siempre que P i fi (b, g(m)) = 0. El mecanismo implementa de forma única el estado verdadero θ siempre que g(m) = θ para todos los θ ∈ {0, 1} y β ∈ [0, 1].  

Una estrategia para el agente i es un mensaje mi (bi, β, θ) ∈ M. Tenga en cuenta que las estrategias pueden ser dependientes del tipo y los tipos son información privada. El concepto de solución es, por lo tanto, el equilibrio bayesiano (BE).

Tenga en cuenta que, aunque los individuos solo conocen su propio tipo y la estadística de resumen β, asumimos que el mecanismo puede condicionar los pagos a los tipos individuales. Esto refleja sólo una suposición sobre cómo se transmite la información recibida por el mecanismo a los participantes antes de votar. Consideramos que esta es una suposición más realista, consistente con, por ejemplo, cómo las casas de apuestas deportivas informan las probabilidades, pero no las apuestas de cada individuo.

Consideramos solo mecanismos simétricos por los cuales todos los agentes que son del mismo tipo y que votan igual son tratados de la misma manera. También asumimos que los agentes son individualmente racionales en el sentido de que están dispuestos a jugar bajo el supuesto de que los tipos serán asignados aleatoriamente (independientemente y con la misma probabilidad) y dispuestos a votar después de aprender su propio tipo bi, el tipo estadístico β y θ.

Conclusión

Un sistema completamente descentralizado solo puede funcionar bien cuando los agentes no tienen interés en él. Si bien expresamos este resultado como un teorema de imposibilidad, realmente apunta al límite de la descentralización: la descentralización de la verdad tiene que ser entregada a un grupo de agentes que no tienen otro interés en lo que es la verdad que el pago que reciben para hacer su trabajo. Esto abre la puerta a un problema de free rider y al llamado problema del oráculo. Dejamos el estudio de la mejor organización para determinar cuál es el verdadero estado del mundo para futuras investigaciones.



Deja una respuesta