Jugando al dilema del prisionero en clase de Física

Chuck Norris Quirantes
¿Quieres delatarme? ¿En serio?

Hay veces en las que me meto en un sembrado sin saber cuál será la salida, y ayer fue una de esas veces. Comencé preparando los horarios de prácticas y acabé hablando a mis alumnos sobre el dilema del prisionero. No lo tenía planeado, pero apareció la oportunidad y la aproveché.

Por si no lo sabéis, el dilema del prisionero es un ejemplo de situación en la que hay que realizar una elección. El resultado será mejor o peor dependiendo de tu propia elección, pero también de la elección de otros. Es un caso clásico dentro de la teoría de juegos.

El ejemplo que se suele dar es el siguiente. Yo soy inspector de policía, y tengo a dos ladrones de bancos detenidos en celdas individuales y aisladas. El jefe no está muy contento porque las pruebas que tenemos contra ellos no son muy sólidas y no quiere que salgan de rositas con una condena ligera, así que me encarga a mí que les arranque una confesión. Cojo a uno de los ladrones, me lo llevo a la sala de interrogatorios y me preparo para convencerle. La conversación es más o menos como sigue:

INSPECTOR: Bueno, chico, la cosa pinta mal para vosotros dos. Tenemos pruebas como para enchironaros un par de años. Pero el fiscal está de buenas y dice que puedes hacer un trato. Confiesa y acusa a tu compañero. Si lo haces le caerán diez años y tú saldrás libre. Si no, bueno, puede que sea él quien te entregue a ti. El primero que cante se lleva el premio.

LADRÓN 1: ¿Y cómo sé que no has hablado ya con mi compañero y te ha mandado a freír espárragos?

INSPECTOR: Buena pregunta. La respuesta es que no lo sabes. Igual que no lo sabrá él cuando le interrogue.

LADRON 1: ¿Y si no hablamos ninguno de los dos?

INSPECTOR: Pues con lo que ya tenemos os podemos echar dos años de condena a cada uno. Pero claro, si los dos os acusáis mutuamente y confesáis, no habrá rebaja. Con dos confesiones sobre la mesa no habrá necesidad de un trato, así que os caería un mínimo de cinco años a cada uno. Piénsatelo y luego hablamos.

Por supuesto, la conversación con el segundo ladrón será idéntica. Una vez que los dos estén a solas en sus respectivas celdas, cada uno de ellos piensa cuál será la forma de salir mejor parado. El proceso de razonamiento sería algo así:

«A ver, supondré que los dos somos igualmente listos y ambos queremos lo mejor para los dos. La mejor opción será que ambos nos callemos y salgamos en dos años. Vale, pues entonces a callar se ha dicho. Punto en boca. Claro que si yo me callo y él me traiciona, me como todo el marrón yo solito (¡diez años nada menos!) y él sale libre. Ahora que lo pienso, si yo le acuso a él saldré libre, y eso será lo mejor que me puede pasar. Pero si él piensa lo mismo que yo y también me traiciona, ambos cumpliremos cinco años de condena. Entonces será mejor ninguno de los dos confiese, así saldremos en dos años. Pero si después de todo él me traiciona…»

Como ven se trata de un dilema sin solución óptima clara. Si ambos ladrones pudiesen acordar una estrategia común, y en el caso de existir confianza, podrían salir airosos con una pena menor, pero en otro caso la tentación de traicionar es muy fuerte. Cosa que los policías saben perfectamente.

Una variante interesante sucede cuando el proceso se repite varias veces. Digamos que ahora yo soy un ladrón de joyas. Para convertirlas en dinero necesito a un perista. Quedamos en que un día concreto yo le envío por correo las joyas y él me envía un sobre con el dinero. Aquí la tentación de engañar es muy fuerte. Yo puedo meter piedras en la caja, y él puede enviarme un sobre lleno de recortes de periódico. Quien traicione se lo lleva todo, y quien no lo haga se queda si nada.

¿Pero qué pasará en el siguiente robo? Yo volveré a necesitarlo, y él a mí. ¿Cuál será mi estrategia? ¿Y la suya? ¿Y para las siguientes ocasiones? Yo tengo diversas opciones a mano. Puedo ser un ingenuo y cumplir siempre; o ser un traidor y engañar siempre; o decidir echando una moneda al aire; o diseñar algún otro tipo de estrategia. Puedo ser tolerante si me engañan un par de veces; o puedo ser un rencoroso y traicionar el doble que el contrario.

Lo interesante viene cuando comparamos todas las posibles estrategias entre sí. Se ha hecho mediante simulaciones por ordenador, y resulta que la estrategia más eficiente, es decir, la que a la larga proporciona mayores beneficios en promedio, es tan sencilla como esto:

a) En el primer intercambio cooperamos

b) En los siguientes intercambios, hago lo mismo que hizo el otro en el anterior intercambio.

Es decir, comienzo siendo legal, y después todo depende del otro: si él me engaña hoy yo lo engañaré mañana, y si él coopera hoy yo cooperaré mañana. Simple y efectivo.

Mis alumnos se enfrentaron ayer al dilema clásico del prisionero, con relación al horario de las prácticas de laboratorio. En principio yo doy a mis alumnos libertad para que escojan tanto la pareja de prácticas como el grupo. Hay tres horarios, que podemos llamar bueno, regular y malo. Como imaginaba, la mayoría de ellos escogieron el horario bueno. El problema, claro, es que no caben todos. En cursos pasados me limité a hacer un sorteo en el despacho y pasar algunas parejas del horario bueno al regular, o al malo si no hay más remedio, a menos que algunos de ellos prefiriesen cambiarse de forma voluntaria. ¿Pero por qué querrían hacerlo y empeorar su situación?

En ese momento se me encendió una bombillita. Dejaría que los propios alumnos hiciesen el trabajo sucio. Comencé preguntando «¿habéis oído hablar del dilema del prisionero?» (algunos dijeron que sí), y luego les planteé el problema en los siguientes términos:

«Hay demasiadas parejas en el grupo bueno. Puedo arreglarlo pasando algunos de vosotros a los otros grupos, pero prefiero que decidáis vosotros. Os pido que os planteéis la posibilidad de cambiaros de grupo voluntariamente. Si lo hacéis, respetaré vuestra decisión y os pondré en el grupo escogido; si no, tendré que escoger yo al azar. En ese caso cabe la posibilidad de que os quedéis en el grupo bueno, pero también podéis acabar en el grupo regular, o incluso en el grupo malo.

Sé lo que debéis estar pensando. Será algo así como ‘Si no me cambio, puedo acabar en el grupo malo, así que mejor me cambio al grupo regular; claro que si algunos de los demás piensan lo mismo y se cambian ellos, habrá sitio para los demás en el grupo bueno, incluido yo; pero si todos piensan así, nadie se cambiará de grupo y habrá sorteo, y lo mismo acabo en el grupo malo… ¿qué hacer?’ Dependerá de lo listos que creáis que son los demás, y por supuesto vosotros. Tenéis que decidir con lo que sabéis ahora. Vosotros veréis.»

Cuando les planteé el dilema, algunos soltaron una carcajada; habían entendido que la solución ideal no existía. Era hora de decidir. Y esto fue lo que sucedió. El número máximo de parejas por grupo es de 10. Antes de plantear el dilema, había 22 parejas inscritas; después de que se lo pensaran mejor, el número de grupos era ya de 24 (se habían incorporado dos parejas nuevas que no habían decidido hasta entonces). Y esta fue la distribución por grupos:

Grupo bueno Grupo regular Grupo malo
ANTES 18 2 2
DESPUÉS 10 12 2

 

Como veis, ocho de las parejas del grupo bueno prefirieron cambiar voluntariamente en lugar de tentar la suerte. En este caso, el cambio de grupo para evitar males mayores resultó una estrategia con éxito para ellos, ya que ninguno de los que cambiaron acabaron en el grupo malo. Los que optaron por no cambiar consiguieron quedarse el grupo bueno, así que podríamos decir que la suya fue la estrategia ganadora, ya que obtuvieron lo que querían sin sacrificar nada. ¿Injusto? Posiblemente, igual que es injusto ver cómo el compañero sale libre de la cárcel mientras tú te pudres en la celda. Por supuesto, eso último resulta algo egoísta y en cierto modo injusto, pero nadie dijo que esto fuese una cuestión de justicia.

La elección ya estaba hecha, pero aún no estaba dicha la última palabra. Fijaos en que ahora hay 12 parejas en el grupo regular, es decir, sobran dos. Pensé en escoger dos de esas parejas al azar y pasarlas al grupo malo. Enseguida caí en la cuenta de que no sería justo. Si las parejas desplazadas hubiesen sido las que escogieron el grupo regular desde el principio, les estaría fastidiando su elección. Si, por el contrario, fuesen parejas provenientes del grupo bueno, entonces la situación sería doblemente injusta para ellos, puesto que habrían cambiado del grupo bueno al regular para evitar males mayores, ¡y resulta que al final acaban en el grupo malo! Ya estaban sonando en mi mente sus voces de protesta reclamando justicia.

Mi decisión fue la siguiente: cogería dos parejas del grupo regular y las pasaría al bueno, y para hacer hueco en el grupo bueno tomaría dos parejas de allí y las pasaría al grupo malo. De ese modo, dos parejas altruistas del grupo regular volverían al grupo bueno (justo premio por su sacrificio) y dos parejas que se habían aferrado al grupo bueno pasarían al malo (justo castigo por su egoísmo).

Fijaos que estoy ahora hablando de justicia. El dilema del prisionero trata sencillamente de una cuestión de elección. La justicia no tiene ahí nada que ver. Pero en este caso hay una pequeña diferencia: soy el profesor y es mi clase, puedo hacer la situación algo más justa y lo hago. También yo he tomado mi decisión, y cuando el próximo lunes haga público el reparto de grupos, habrá un par de caras de asombro.

Y es que, cuando me subo a la tarima de clase tiza en ristre, YO soy la justicia.



15 Comentarios

  1. No es justo castigo, los egoistas jugaron usando las mismas reglas que todos, cambiar las reglas a mitad del dilema añade nuevas variables y no podemos hablar entonces del problema del prisionero. Como has dicho no hay una solución ideal, al menos sin algún tipo de «intervención divina»

    1. Como el problema plantea .. Es un dilema ! , mas no! una forma de ser justo , el profe ,al final, decidió ponerle un toque de justo de balance a la situación, me temo que tu pertenecerias al grupo que decidio que darse en el bueno.. xD un egoísta pide justica? xD

    2. no hay cambio de reglas… desde un principio se dijo que existía un tope de 10 parejas por grupo, y obviamente si se mantiene alguno de los grupos con más de 10 parejas se tendrá que resolver de alguna forma para lograr el número tope… así que estimado, se entregó la posibilidad de elección pero ante el problema de que se mantiene un excedente el profesor debe tomar un decisión y lo mas justo es no castigar a aquellos que fueron más generosos.

  2. Sí que es justo. Los que se quedaron sabían que se arriesgaban a terminar en el grupo malo, y eso es lo que les ha ocurrido. Algunos apostaron y les salió bien y a otros les salió mal.

  3. Señalo que la expresión «irse de rositas» solo es comprensible en España. Si se quiere alcanzar un público internacional no español conviene evitar esas expresiones incomprensibles para quien no es español: la leche, mola y otras tantas expresiones coloquiales exclusivas de España (españolismos).

    1. No estoy de acuerdo, al menos si la expresión no es muy rebuscada.
      Si es una expresión corriente como ésta, la pones en san Google, «irse de rositas», y obtienes el significado. Así de sencillo.
      Saludos.

    2. Soy de Chile y para mí, esas expresiones le dan sabor al texto ya que demuestran la personalidad del autor.

      Saludos y muchas gracias por la existencia de Naukas.

    3. Soy de Colombia y Arturo puede expresarse(y no porque yo lo diga sino porque la ley española se lo garantiza) como le venga en gana en su blog: es una delicia leer las expresiones de otros países, y averiguar porque se usan. A mi de las expresiones que más me gustan en España es «se fue por los cerros de Ubeda». La historia de esa expresión es extraordinariamente divertida. Las expresiones propias de los países le dan color al lenguaje escrito y permiten entender un poco más la idiosincrasia del país donde se escriben.

  4. De hecho si quisieras hacer justicia deberías hacer un cambio total entre los grupos bueno y regular, y las parejas que sobren en el regular que vayan al malo pero tienen que ser parejas que hayan venido del bueno. ¡Que lio!

    Los que se han cambiado al regular son los que han cogido el toro por los cuernos (expresión española internacional ¿?), han actuado y han intentado resolver el problema que no es otro más que no todos caben en el bueno, así que por ese «esfuerzo» se merecen un premio, y los inmoviles que lo han hecho para intentar beneficiarse de que a los demás les vaya peor… se merecen un castigo.

    PD: ¿No será que hay que exigir a estancias superiores (a la dirección, a la comunidad o al ministerio de educación) más recursos para que todos puedan estar en el bueno?

  5. No creo que, con la decisión tomada, se haya hecho justicia porque, en se han variado las reglas establecidas que sirvieron para tomar las decisiones: «Los grupos no podían ser mayores ed 10 parejas» y así sucedió con el grupo bueno y, a pesar de ello, se cambió a dos integrantes, en principio, por justicia.
    Si hacer justicia es beneficiar a los que se sacrificaron y no beneficiar a los egoístas, lo más justo hubiera sido pasar, de los 10 del grupo bueno, 8 al regular y 2 al malo, y pasar al grupo bueno a 10 de los 12 y dejar dos en el regular.

  6. xD. Muy gracioso. Al final de todo, después de ellos haberse divertido jugando al dilema del prisionero tú hiciste lo propio echando un vicio al Juez Dredd.

    Por cierto, no recuerdo dónde pero me pareció haber leído algo similar recientemente. En una universidad china, compitieron 300 alumnos al Piedra-Papel-Tijera, la conclusión principal fue que el jugador que ganaba una ronda repetía jugada, por lo general, en la siguiente. Haciendo un símil y apartando la psicología que se esconde detrás del juego y lo que conozcas a tu adversario, el joyero del caso 2 representa a la «diosa fortuna» en el P-P-T: si ganas, repites y si no, procuras cambiar de estrategia. Lo que puede dar de sí un juego tan sencillo.

  7. Entiendo que es la solución correcta (siempre y cuando a los que se cambiaron al grupo bueno del regular no fuesen los que inicialmente eligieron el grupo regular).
    Las reglas eran claras y jerárquicas y podían redefinirse así:
    1.- No podía haber más de 10 parejas por grupo.
    2.- El que cambiaba de grupo voluntariamente no podía salir perjudicado en su elección.
    3.- El que no cambiaba de grupo, en un grupo no viable, podía salir perjudicado.
    Los del grupo regular o malo no tenía sentido que cambiasen porque transformarían el problema en un juego de dados. Esos grupos no tenían problemas. El que tenía problemas era el grupo bueno.
    El hacerlo como se hizo cumple todas las reglas: los que cambiaron al regular (pero preferían el bueno) no se vieron perjudicados en su elección cuando los devolvieron al bueno. Los que siguieron en el bueno y fueron pasados al malo se le aplicó la norma 3 que ya sabían que podía ocurrir si no efectuaban un cambio.
    (El que un grupo se defina como bueno, regular o malo entiendo que es por la cantidad de gente que lo elige. Los que inicialmente eligieron el grupo malo sus motivos personales tendrían para elegirlo por lo que para ellos era el mejor).

  8. Una divertida variante del dilema del prisionero se puede ver en un concurso de la BBC llamado «Golden Balls» en la ronda final los dos últimos jugadores se juegan todo el bote en una prueba que se llama «Split or Steal».
    Ambos toman una decisión sin que el otro lo sepa, si ambos deciden «Split» el bote se reparte al 50% entre ambos jugadores. Si uno elige «Split» y el otro «Steal» el que elige «Steal» se lleva todo el bote y el otro nada. Si ambos eligen «Steal» los dos lo pierden todo.
    Lo gracioso es que antes de elegir tienen un minuto para convencer al otro de que van a elegir «Split» y no les van a robar.

    Hay muchos videos en Youtube del programa

  9. En el ejemplo de los grupos bueno, regular y malo hay un problema. Imagina que todos los del grupo bueno se cambian al grupo regular (para evitar acabar en el grupo malo). El grupo regular acaba con 22. Y una de las reglas era que los que se cambiasen voluntariamente al grupo regular no tendrían el riesgo de acabar en el grupo malo. Pero resulta que al menos 4 deben ir al grupo malo. ¿Cómo se arreglaría?

Deja un comentario

Por Arturo Quirantes
Publicado el ⌚ 23 octubre, 2015
Categoría(s): ✓ Historias del Profe
Etiqueta(s): ,