jueves, 24 de agosto de 2017

Una solución a la paradoja del diablo


En esta entrada planteé la paradoja. En esta otra examiné la causa de la paradoja. Una vez entendido por qué el argumento de la paradoja es falaz toca encontrar un argumento que no lo sea y que nos resuelva el problema de decisión planteado.

La cuestión principal, recordemos, era encontrar una manera de valorar los infinitos días en el cielo (por la probabilidad de que esto ocurra), si la lotería del diablo nos envía allá, y compararlos con el daño de esperar unos días en el infierno hasta que la lotería tenga lugar y con los infinitos días en el infierno en caso de que no tengamos suerte.

Hay varias soluciones coherentes posibles. Voy a exponer una, la que creo es más natural. Imaginémonos en el infierno. En lugar de la lotería de esta paradoja, el diablo nos da a elegir entre pasar un día en el cielo hoy o pasarlo dentro de un año. Lo normal es valorar más un mismo grado de satisfacción ahora que en el futuro. Si estas son las preferencias (y si son más complicadas se pueden hacer argumentos parecidos, pero eso ya lo veremos) podemos hablar de una tasa de descuento. Por ejemplo, un día en el cielo dentro de un año equivale (en el momento presente) a 0,9 días en el cielo hoy. De manera más general podemos decir que estar mañana en el cielo equivale a D días en el cielo hoy (donde D será un número positivo menor que uno y que llamaremos tasa de descuento), estar un día en el cielo pasado mañana equivale entonces a DxD días hoy y así sucesivamente. Con estas últimas preferencias, la felicidad de estar en el cielo para siempre a partir de ahora según mi valoración de hoy será:

Si repasamos nuestras matemáticas de bachillerato sabremos que la suma anterior es exactamente igual a
siempre y cuando D sea un número mayor o igual que cero y menor que uno, pero eso es exactamente lo que es, por ser una tasa de descuento. Podemos hacer lo mismo para calcular la infelicidad de estar toda la eternidad en el infierno si C es la de un día.

1. Si decidimos jugar (día uno) hoy esperamos ganar:
Es decir: la probabilidad de ganar multiplicada por el valor actual descontado de estar toda la eternidad en el cielo menos la probabilidad de perder por el valor actual descontado de estar toda la eternidad en el infierno.

2. Si decidimos esperar a mañana (día dos) tendremos:
Es decir: el fastidio de estar hoy en el infierno (C) más la misma ganancia neta calculada antes, pero a partir de mañana (por eso la multiplicamos por la tasa de descuento).

3. Si esperamos un día más (día tres), la utilidad esperada será:

Y así sucesivamente.

Obsérvese que podemos calcular los valores numéricos de las expresiones en cuanto sepamos los valores de F, C y D. Es decir, en cuanto sepamos la valoración de estar un día en el cielo (F), un día en el infierno (C) y la paciencia (D), cosas todas ellas que tienen que ver con las preferencias personales de cada uno. Una vez valoradas las expresiones, basta elegir el día que corresponda a la de valor más alto. Para los más avanzados, se puede escribir la expresión de un día general y usar el cálculo diferencial para encontrar el día óptimo.

Haciendo unos cálculos se encuentra que para los impacientes (con tasa de descuento D=0,9), con F=1 y C=-1, lo mejor es hacer la apuesta el tercer día. Si uno es más paciente (D=0,99), para conjuntos de valores muy amplios de F y C conviene esperar hasta el noveno o décimo día.

La entrada ya se ha alargado bastante. En otra próxima discutiremos algunos aspectos de esta metodología de cálculo y algunas alternativas.

---------------------------------------------------------------------------------------------------------
Hace tres años en el blog: Derechos humanos y derechos contractuales.
-----------------------------------------------------------------------------------------------------------

miércoles, 23 de agosto de 2017

La falacia en la paradoja del diablo

Recordemos la paradoja presentada en la entrada anterior, a la que me remito para los detalles:
  1. Estás en el infierno para siempre.
  2. El diablo te da la opción de elegir un día (y solo uno) para entrar en una lotería cuya ganancia es ir al cielo para siempre.
  3. Las condiciones: si eliges hoy, la probabilidad de ir al cielo es 1/2; si eliges mañana es 2/3; si pasado mañana, 3/4; al día siguiente, 4/5, y así sucesivamente.
  4. La paradoja: siempre merece la pena esperar un día más, pues se cambia un día en el infierno por aumentar la probabilidad de estar toda la eternidad en el cielo.
Y ahora, con ustedes, la resolución de la paradoja.

La cuestión principal es que la paradoja asume una suma infinita de felicidad. Cada día en el cielo nos da una felicidad, y una suma infinita de días nos da una suma infinita de felicidad. Multiplicada por un incremento de probabilidad por pequeño que sea nos da un incremento de felicidad infinito si esperamos un día más, puesto que el coste es una infelicidad finita de estar un día más en el infierno.

El problema es que no existe tal cosa como una suma infinita. Si el nivel de felicidad por pasar un día en el cielo es, digamos, F (en la escala apropiada), estar toda la eternidad en el cielo no implica tener una felicidad de

F+ F + F + F +…,

entre otras cosas porque tal operación no existe. La suma se define como una operación binaria (entre dos elementos) que, por satisfacer ciertas propiedades (conmutativa, asociativa), se puede extender a la suma de finitos elementos, pero no a la suma de infinitos. Cuando se cumplen ciertas condiciones sí se puede hablar de sumas infinitas, pero para ello la serie sumas parciales tiene que converger. Así, se puede hablar de la suma de

1/2+1/4+1/8+1/16+1/32+…,

cuyo resultado es 1. Y se puede hacer porque dando como resultado el límite de las sumas parciales se mantienen las misma propiedades de las sumas finitas (operación cerrada, elemento neutro, elemento simétrico, conmutativa, asociativa,…). Para series no convergentes tal cosa no es posible.

Es decir, que el enunciado de la paradoja nos está metiendo un gol al hacer parte de su argumentario una suma infinita carente de significado. No es que diga algo falso cuando dice eso, sino que dice un sinsentido. Lo falso es concluir algo de un sinsentido y esa es la falacia. Cosas parecidas nos encontramos en la paradoja de la lámpara de Thompson.

La cuestión siguiente será: ¿qué es lo que hay que hacer, entonces? Esperen ustedes unos días más en el infierno de la ignorancia y en la próxima entrada contestaré a la pregunta y les llevaré a la felicidad de la sabiduría por siempre jamás.

En una próxima entrada diré cómo afrontar esta oferta del diablo.

-----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: France Télécome, ¿tenemos un problema?
-----------------------------------------------------------------------------------------------------------

martes, 22 de agosto de 2017

La paradoja del diablo


Esta es la paradoja del diablo:

Estás en el infierno, condenado para toda la eternidad. El diablo te ofrece una salida. Solo tienes que decidir qué día participar en una lotería en la que, si ganas, vas al cielo también para toda la eternidad y, si pierdes, te quedas como estabas, en el infierno para siempre jamás. El truco es que las probabilidades de ganar cambian cada día de la siguiente manera: si eliges que la lotería sea hoy la probabilidad de ganar es 1/2, si eliges que sea mañana pasará a ser 2/3, pasado mañana será 3/4, al día siguiente 4/5 y así sucesivamente. Como vemos, a medida que esperas la probabilidad de ganar aumenta. Permíteme que insista: la lotería es solo una vez, ganes o pierdas, ya no habrá más. Suponemos, habrá que decirlo, que el infierno te disgusta mucho (quema y eso) y el cielo te encanta (hay más atracciones aparte de estar tocando la lira).

La paradoja surge porque pareciera que siempre conviene esperar un día más. Por mucho que te disguste el infierno y te guste el cielo, esperar un día más supone estar un día en el infierno a cambio de un aumento de la probabilidad de estar infinitos días en el cielo. Por pequeño que sea este aumento, es un aumento y es por infinitos días. Claro que si siempre merece la pena esperar, entonces te quedas siempre en el infierno, cosa que tampoco quieres.

Este es el planteamiento. Hay quien lo relaciona con la apuesta de Pascal (podéis verlo aquí). Yo las veo muy distintas, pero de eso ya hablaré en otro momento. Ahora os dejo la paradoja para que le deis vueltas. En una próxima entrada explicaré la falacia y en otra daré la solución.

-----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: Preguntas últimas, preguntas siguientes.
-----------------------------------------------------------------------------------------------------------

lunes, 21 de agosto de 2017

El dilema del tranvía



Hace unas semanas hablamos de los problemas de tranvías en el Otto Neurath y poco después acudí a un seminario del psicólogo Robert Kurzban, que los utiliza como ejemplo de su tesis sobre la mente modular. Me persiguen desde que me dedico a la teoría de los juegos, así que aquí va una entrada para ellos.

Un tranvía está en loca carrera sin frenos a punto de arrollar y matar con toda seguridad a un grupo de 10 personas. La única posibilidad de salvarlos es desviar el tranvía a otra vía en la que solo hay una persona, que también morirá irremediablemente si se hace ese desvío. ¿Qué harías si tuvieras la posibilidad de apretar el botón que active el desvío?

Este tipo de problemas nos muestran que nuestras posiciones morales pudieran no tener una buena justificación.

Esto último es así porque está documentado en experimento tras experimento (mentales, claro, nunca se mata a nadie) que las respuestas a la pregunta crucial depende de variables aparentemente irrelevantes.

Por ejemplo, la respuesta varía si la persona a la que sacrificar es un trabajador de la compañía que hace su trabajo reparando la vía o es una persona que camina irresponsablemente por ella, o si en lugar de desviar el tranvía lo que se puede hacer es arrojar a una persona desde un puente para que caiga delante del tranvía y lo haga descarrilar, o si no se sabe en qué posición está el interruptor que hace desviarse al tranvía, pero se puede dar la orden de que se quede en la que queremos, y así infinitas variaciones del tema.

¿Por qué habría de cambiar la respuesta? ¿Qué tal si esas 10 personas son ciudadanos en un hospital que morirán si no reciben un transplante y la persona que puede salvarlos y morir al donar sus órganos es un ciudadano cualquiera? En todos los casos se trata de 10 vidas frente a una.

Esta es mi postura ante el problema del tranvía. Por una parte debo decir que si el dilema es exactamente como se describe en cada problema, entonces la decisión debe ser la misma en todos ellos. El problema, a mi entender, radica en que no hay manera de pensar ninguno de los problemas en su descripción exacta. Me pasa lo mismo que cuando intento explicar el equilibrio en un juego. Logro ser más convincente cuando exagero hasta el ridículo el contexto del juego: dos personas nacen, juegan el juego, son lo felices que les toque ser según el resultado y se mueren. Ese es todo su universo. En esas circunstancias es más aceptable el equilibrio. Claro que esas son exactamente las circunstancias del modelo, pero es claro también que no existen de esa manera en el mundo real.

Pienso que nos ocurre los mismo con los problemas de tranvías. Tomados al pie de la letra requieren una solución única, tomados en contexto –y cada uno es libre o esclavo de sus instintos de montarse un contexto- pueden estar pidiendo a gritos soluciones distintas.

Una sociedad que sacrifique al azar un ciudadano para donar sus órganos es poco apetecible y poco viable. Sospechosamente, los órganos de los familiares de los ministros o de los médicos se verán poco en el quirófano, los ciudadanos dedicarán grandes recursos a esconderse de las patrullas que buscan donante, .... Este tipo de arbitrariedades, con sus costes añadidos puede estar detrás de una regla impresa en nuestro cerebro que diga que es una mala manera de decidir. Otras reglas, tal vez justificadas, tal vez confundidas, pueden estar detrás de reacciones distintas en las otras versiones del problema.

domingo, 20 de agosto de 2017

La Teoría de Juegos y el dilema discursivo (2)

Esta es la segunda parte de la versión en español de mi artículo de mayo en Mapping Ignorance. Debe leerse la primera parte para entender esta.


Clipper y Eliaz (2015) [2] usan los juegos bayesianos para desarrollar su análisis. Esto significa que las distintas creencias de los miembros del jurado se deben a que cada miembro tiene acceso a distinta información. En el modelo bayesiano, ex-ante todos los miembros del jurado están de acuerdo en las probabilidades a priori de que cada premisa sea cierta. En un segundo momento cada miembro del jurado tiene acceso a una información privada (llamada señal) a partir de la cual pueden actualizar sus creencias de acuerdo con la regla de Bayes. Como cada uno puede recibir información distinta, los tres miembros pueden acabar con distintas creencias acerca de las premisas. En el modelo de Clipper y Eliaz (2015) la señal está restringida a los valores 0 y 1 para cada una de las premisas y las reglas de decisión comprenden todas la reglas super-mayoritarias (una proposición es aceptada si una mayoría cualificada de los votantes están de acuerdo en que es cierta, donde el valor cualificación puede ser cualquier proporción de votantes entre la mitad, para una mayoría simple, hasta la casi unanimidad).

Expliquemos esto con el ejemplo primero. Hay cuatro posibilidades para el verdadero estado: (1,1), (1,0), (0,1) y (0,0), donde un 1 en la primera posición de la señal significa “la primera premisa es cierta”. Un cero significa “falsa”, y la segunda posición se refiere a la segunda premisa. Hay una probabilidad a priori de que cada uno de estos estados posibles sea cierto y los tres miembros del jurado conocen estas probabilidades. A partir de ahí cada miembro recibe una señal sobre el estado. En el caso más simple hay tantas señales como estados. El primer miembro del jurado recibirá una señal correcta o incorrecta con unas probabilidades. Por ejemplo, si el estado verdadero es (1,1), puede recibir la señal (1,1) con probabilidad 0,7, la señal (1,0) con probabilidad 0,2 y cada una de las señales (0,1) y (0,0) con probabilidad 0,05. Los otros dos miembros recibirán sus señales con sus propias probabilidades. Cada miembro del jurado desconoce las señales que reciben los otros, pero sabe las probabilidades. Usando la regla de Bayes, cada miembro del jurado puede calcular la probabilidad de que cada premisa sea cierta y puede también calcular la probabilidad que cada uno de los otros miembros asignará a cada premisa dependiendo de qué señales reciben.

En el juego de la premisas, después de recibir las señales, los miembros votan sí o no a cada proposición de la forma “la premisa x es cierta”. Según los votos, una premisa se declarará cierta o falsa. En el juego de los resultados, votan a favor o en contra de la aceptar la conclusión lógica. En ambos casos cada miembro del jurado quiere minimizar la distancia esperada entre la decisión y el estado verdadero. Por ejemplo, si el estado verdadero implique que el candidato debe ser aceptado (1), pero en equilibrio se acepta solo con probabilidad 0,6, la distancia será 1-0,6=0,4. Por supuesto, los miembros no saben si el estado cierto implica que el candidato deba ser aceptado, pero pueden calcular las probabilidades de acuerdo con las señales recibidas y, a partir de ahí, calcular el valor verdadero esperado y la distancia esperada entre el equilibrio y el este valor.

En el modelo, los autores logran probar los siguientes teoremas:
  1. Para cada grupo finito de individuos, recabar opiniones sobre las premisas es sistemáticamente por lo menos tan bueno como recabarlas sobre los resultados, pero lo contrario no es cierto. Para ser más precisos, la primera parte dice que para cada equilibrio de Nash bayesiano simétrico en el juego basado en resultados existe un equilibrio de Nash bayesiano en el juego basado en premisas tal que, par cada vector de realizaciones de la señal, el perfil estratégico del segundo juego induce la misma distribución de probabilidad sobre las decisiones que el primero.
  2. Genéricamente, las ganancias del juego basado en las premisas sobre el juego basado en el resultado solo pueden llegar a ser marginales cuando muchos individuos expresan su opinión independientemente.
  3. Ambos procedimientos son casi siempre eficientes asintóticamente.
En lenguaje llano, la conclusión puede resumirse así: a pesar de que el método basado en las premisas es mejor que el basado en los resultados, solo lo es de manera marginal, puesto que ambos métodos tienden a ser eficientes cuando el número de miembros aumenta, excepto en casos extremadamente raros.

Referencias:

2. de Clippel, G., and Eliaz, K. 2015. Premise-based versus outcome-based information aggregationGames and Economic Behavior 89, 34–42. 

----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: Alemania-Grecia.
Hace cinco años en el blog: El que quiera entender que entienda.
-----------------------------------------------------------------------------------------------------------

sábado, 19 de agosto de 2017

La Teoría de Juegos y el dilema discursivo (1)

Esta es la primera parte de la versión en español de mi artículo de mayo en Mapping Ignorance.


He aquí un ejemplo del “dilema discursivo” o “paradoja doctrinal”: Pongamos que hay un jurado de tres miembros que deben decidir mayoría si un candidato debe ser aceptado en un grupo. Las reglas especifican que el candidato debe cumplir dos requisitos, A y B, para ser aceptado. El primer miembro del jurado cree que el candidato cumple ambos requisitos, el segundo miembro cree que solo cumple el A, mientras que el tercero cree que solo cumple B. La paradoja aparece cuando uno compara dos métodos diferentes para decidir la admisión del candidato.

El primer método requiere que el jurado vote sobre si el candidato cumple el requisito A y, a continuación, sobre si cumple el B. Si el candidato obtiene una mayoría en ambas votaciones, será aceptado. Dos de los tres miembros creen que se satisface la condición A (el primero y el segundo así lo creen), y también dos de tres creen que se satisface la condición B (ahora lo creen el primero y el tercero). De acuerdo con este método el candidato es aceptado.

El segundo método requiere que el jurado vote directamente si piensa que el candidato debe ser aceptado. Ahora solamente el primer miembro piensa que se cumplen ambas condiciones y votará a favor. Los otros dos, al creer que una de las dos condiciones no se cumplen, votarán en contra.

Podemos entender los dos métodos de votación como dos maneras diferentes de agregar información. La paradoja muestra que la regla mayoritaria da resultados inconsistentes cuando agrega información sobre las premisas frente a la situación cuando agrega las conclusiones. En el ejemplo, la conclusión se sigue de la conjunción de las premisas, pero se podrían usar otras proposiciones lógicas para mostrar la paradoja. Más aún, numerosos resultados han mostrado que este no es un problema especial de la regla mayoritaria. De hecho, estos resultados muestran que es imposible encontrar un método de agregación que ofrece juicios lógicamente consistentes, esto es, que dan el mismo resultado sin importar sin se agregan premisas o conclusiones. Para obtener un panorama de sobre estos resultados léase List y Puppe (2009) [1].

Dada la imposibilidad de encontrar consistencia, la siguiente cuestión es saber qué procedimiento, agregar opiniones acerca de premisas o resultados, es la mejor. Para enfrentarse a este problema, lo primero que se necesita es especificar qué significa “mejor”. Clippel y Eliaz (2015) [2] comparan ambos procedimientos en términos de su capacidad para agregar información en presencia de individuos que toman decisiones estratégicas y que tienen intereses comunes. Contrariamente a lo que se asumía en el ejemplo introductorio, los individuos estratégicos pueden votar o no de acuerdo con su información privada (la literatura sobre votaciones está llena de ejemplos en que los votantes no lo hacen). El interés común significa que todos los votantes quieren lo mismo: agregar la información y generar una correcta conclusión a partir de premisas correctas. In nuestro ejemplo eso significaría que los tres miembros del jurado quieren que el candidato sea aceptado si se cumplen las premisas y quieren saber si estas premisas se cumplen verdaderamente. Las consideraciones estratégicas en la paradoja doctrinal han sido estudiadas por primera vez en Dietrich y List (2007) [3], pero solo para agregadores por unanimidad (donde todas la premisas deben ser ciertas para que se cumpla la conclusión).

Referencias:

1. List, C., and Puppe, C. 2009. Judgement aggregation. In Handbook of Rational and Social Choice, pp. 457–483. Chapter 19.

2. de Clippel, G., and Eliaz, K. 2015. Premise-based versus outcome-based information aggregation. Games and Economic Behavior 89, 34–42. 

3. Dietrich, F., and List, C. 2007. Strategy-proof judgment aggregation. Economics and Philosophy 23, 269–300.

----------------------------------------------------------------------------------------------------------
Hace tres años en el blog: Sobre el nacionalismo (2).
Y también: Economistas contra la crisis y el hombre de paja.
Hace cinco años en el blog: ¿El 99%?
Y también: O ano da morte de José Saramago.
-----------------------------------------------------------------------------------------------------------

viernes, 18 de agosto de 2017

Greguerías filosóficas

Debo el título a @ptarra, que así llamó a estas ocurrencias tuiteras de ayer. Las dos primeras son de Saturday Morning Breakfast Cereal e inspiraron las demás:

-Has leído la paradoja d Zenón?
-No puedo: antes d llegar al final debo pasar x la mitad, y antes, x la mitad d la mitad y así sucesivamente

-Conoces el mito de la caverna de Platón?
-Apenas unas nociones difusas y esquemáticas.

-¿Crees que el método de Descartes es correcto?
-Lo dudo.

-Haznos un comentario sobre el Tractatus de Wittgenstein.
-Mejor me callo.

-¿Me puedes explicar con detalle las tesis de la Dialéctica?
-No. Mejor te hago una síntesis.

-¿Entra Kant en el examen?
-Categóricamente, sí.

-¿Me puedes explicar el existencialismo?
-¿Para qué? Te vas a morir antes de entenderlo.

-¿En qué consiste tu filosofía, Nietzsche?
-Deja de preguntar cosas con esa moral de esclavo y crea tu propia respuesta.

-¿Es correcta la paradoja del gato de Schrödinger?
-Pues sí y no.

-¿Me puedes explicar el utilitarismo?
-Si eso te hace feliz...

-¿Cuál es tu filosofía, Parménides?
-Siempre estás con la misma pregunta, nunca cambiarás.

-¿Me puedes repetir lo del río, Heráclito?
-Ese era el tema de ayer, hoy toca otro.

-Hija, te quiero explicar el libre albedrío.
-Vale, cuando acabe los deberes.
-Es que luego tengo que arreglar la lámpara.
-Pues mañana.
-Ok

-Me gusta la filosofía de Freud.
-¿De ese? ¡Pero si es un inconsciente!

-¿En qué piensas, Hobbes?
-¿Otra vez atosigando? Déjame en paz o te parto la cara.

-Data, ¿te has hecho ya el test de Turing?
-Sí, he dado falso positivo.
-¿Cómo sabes que es falso?
-Ooops!

-Oye, Epiménides, ¿es verdad que los griegos para decir "sí" decís "nai"?
-Nai.
-¡Ya sabía yo que no podía ser!