Simulación Interactiva: El Dilema del Prisionero

El Dilema del Prisionero: ¿Por Qué Cooperar Siempre No Es la Opción Obvia?

Imagina la siguiente situación: dos cómplices de un crimen son arrestados y encerrados en celdas separadas, sin posibilidad de comunicarse. La policía les ofrece el mismo trato:

  • Si ambos se quedan callados (cooperan entre sí), cada uno recibirá una condena menor (ej. 1 año).
  • Si uno traiciona al otro y el otro se calla, el traidor quedará en libertad (0 años) y el que cooperó recibirá la condena máxima (ej. 3 años).
  • Si ambos se traicionan entre sí, ambos recibirán una condena intermedia (ej. 2 años).

Esta paradoja, conocida como el Dilema del Prisionero, es uno de los conceptos más famosos y estudiados de la Teoría de Juegos. A primera vista, parece simple, pero sus implicaciones son profundas y revelan mucho sobre la cooperación, la confianza y el conflicto en la sociedad.

🎯 Ideas Clave en un Vistazo

  • La elección «racional» individual (traicionar) conduce a un peor resultado para ambos.
  • Esto se conoce como Equilibrio de Nash, donde nadie puede mejorar su situación unilateralmente.
  • La cooperación puede surgir de forma espontánea si el juego es iterado (se repite en el tiempo).
  • Estrategias como «Ojo por ojo» (amable, vengativa y perdona) son muy exitosas a largo plazo.

La Trampa de la Razón Individual

Analicémoslo desde la perspectiva de uno de los prisioneros. No sabes qué hará tu compañero.

  • Si él coopera (se calla): Tu mejor opción es traicionarlo (quedas libre).
  • Si él te traiciona (confiesa): Tu mejor opción también es traicionarlo (2 años en lugar de 3).

En ambos escenarios, la elección «racional» y egoísta es traicionar. El problema es que si ambos siguen esta lógica, acaban con 2 años de condena cada uno, cuando podrían haber salido con solo 1 año si hubieran cooperado. La óptima individual conduce a un resultado colectivo subóptimo.

La Clave: La Iteración y la Reputación

El dilema se vuelve fascinante cuando no es un juego único, sino iterado. Si sabes que te volverás a encontrar con la misma «IA» o persona en el futuro, tus cálculos cambian. Ahora importa tu reputación. La cooperación puede surgir de forma espontánea.

Aquí es donde entran en juego estrategias como:

  • Tit for Tat (Ojo por ojo): Cooperas en la primera ronda y luego copias la jugada anterior de tu oponente. Es simple, amable (nunca traiciona primero), vengativa (castiga la traición) y perdona (vuelve a cooperar si el otro lo hace).
  • Grim Trigger (Desconfiado): Cooperas hasta que la otra persona te traiciona una sola vez. A partir de ese momento, la traicionas para siempre, sin perdón.
  • Win-Stay, Lose-Shift (Ganas-Quédate, Pierdes-Cambia): Repites tu última acción si te dio un buen resultado, pero la cambias si te fue mal.

¿Dónde lo vemos en la vida real?

Este modelo no es solo un ejercicio mental. Explica fenómenos en:

  • Economía: Guerras de precios entre empresas.
  • Política: Carreras armamentistas entre países.
  • Biología: La cooperación entre especies (simbiosis).
  • Nuestra vida diaria: Desde el esfuerzo en un trabajo en grupo hasta cómo interactuamos con nuestros vecinos.

Tu Turno para Jugar: La Teoría Encuentra la Práctica

Ahora que entiendes las reglas y las paradojas, es tu turno de ponerte en la piel del prisionero. La simulación interactiva de abajo te permite experimentar con estas estrategias de primera mano.

Te invitamos a que te conviertas en el prisionero. ¿Puedes vencer a la IA? ¿Es siempre mejor cooperar?

¡Adelante, inicia el juego y empieza a experimentar!

Simulador iterado · controlado

Simulación Interactiva: El Dilema del Prisionero

Ronda: 0/30
Tus años: 0
Años IA: 0
Coop. acumulada: 0%

Controles




0%


0.90








¡RUIDO!

Estado

Decisión:

IA (Tit for Tat)

Decisión:

Matriz de decisiones (años)

IA coopera IA traiciona
Tú cooperas Ambos: -1 Tú: -3, IA: 0
Tú traicionas Tú: 0, IA: -3 Ambos: -2
Presiona «Iniciar Juego» para comenzar.

Registro

Gráficas

Torneo rápido contra estrategias



Notas de uso

  • Los valores negativos son años de condena. Menos es mejor.
  • γ pondera el valor del futuro en juegos iterados. Ruido invierte acciones con la probabilidad indicada.
  • Tit for Tat: Reciprocidad pura. Grim Trigger: Cooperar hasta la primera traición rival, luego siempre traicionar. WSLS/Pavlov: Repite la última acción si fue exitosa (obtuviste R o T), si no, cámbiala.