Wumpus Revisitado

Site hosted by Angelfire.com: Build your free website today!

Parte V

Decisiones con agentes múltiples

Aunque la sinergia que resulta de la cooperación es generalmente ventajosa, la así llamada optimización egoísta u optimización del subsistema muestra la imposibilidad de alcanzar un arreglo cooperativo global óptimo.

Esta situación es ejemplificada por el juego del dilema del prisionero. En ese juego se repasan diversas tentativas de explicar la evolución de la cooperación:

selección de las parejas,
selección de grupo,
altruismo recíproco (TFT o "tit for tat“, esto por aquello), y
moralismo.

Los mecanismos propuestos están limitados en su alcance, son inestables, o están poco detallados.

El análisis debe por lo tanto ir más allá del nivel de la evolución puramente genético para explicar la ultrasociabilidad solo típica del humano.

Los conflictos intergrupos son caracterizados por conflictos de intereses dentro de los grupos competidores entre sí. El conflicto intragrupo proviene de un hecho básico: mientras que todos los miembros del grupo estarían algo mejor si todos cooperan en la competición contra los fuera-del-grupo, cada miembro individual del grupo estaría bastante mejor desertando.

El juego del dilema del prisionero intergrupal (IPD) se propone como marco teórico para combinar los niveles de conflicto del intragrupo y del intergupo.

Este marco se utiliza para examinar temas importantes referentes al comportamiento del individuo y del grupo en conflictos intergrupales. Éstos incluyen:

el efecto del conflicto real del intergrupo en la cooperación del intragrupo;
la base de motivación de la cooperación;
la distinción entre los grupos no cooperativos, los grupos unitarios, y los individuos; y
rutas alternativas de resolución de conflictos.

Dilema del prisionero con dos agentes

Dos supuestos ladrones, Alicia y Bob, son pescados por un policía con las manos en la masa cerca de la escena de un robo con violación de morada y son interrogados por separado. Ambos saben que si ambos confiesan el crimen, tienen 5 años de prisión por el delito de robo con violación de morada, pero que en caso de confesar, estarán prisioneros solamente 1 año cada uno debido a la poca importancia del material robado que se les encontró. Sin embargo, el policía ofrece por separado a cada un trato: si usted atestigua contra su socio como líder de una banda de delincuentes que roban con violación de morada, usted saldrá libre, mientras que el socio tendrá cárcel por 10 años. Ahora Alicia y Bob frente al caso presentado, están en un típico dilema del prisionero -¿deben ellos atestiguar o callar? Siendo agentes racionales, tanto Alicia como Bob desean, cada uno, maximizar su propia utilidad esperada.

Vamos a suponer que a Alicia no le interesa el destino de su socio y así minimizar el número de años que ella pasará en prisión, sin importar qué le suceda a Bob. Bob siente exactamente la misma manera. Para ayudar a alcanzar una decisión racional, ambos construyen la matriz de utilidad siguiente:

	Alicia: testifica	Alicia: negar
Bob: testifica	A=-5 y B=-5	A=-10 y B=0
Bob: negar	A=0 y B=-10	A=-1 y B=-1

Tit for tat en dilema del prisionero multiagentes

Axelrod y Hamilton (1981) utilizaron un torneo de computación para detectar las estrategias que favorecerían la cooperación entre los individuos afectados a un juego de Intergroup Prisoner Dilemma.

En una primera vuelta, 14 estrategias más o menos sofisticadas y una estrategia totalmente al azar compitieron frente a frente para obtener los valores medios más altos de un Intergroup Prisoner Dilemma de 200 movimientos.
Lo inesperado resultó en la adecuación de una estrategia muy simple: coopere en el primer movimiento y después copie el movimiento pasado de su opositor para todos los movimientos subsecuentes. Esta estrategia fue llamada ' tit for tat ' (TFT) – esto por aquello - y sirvió de base para una fértil descendencia colección cada vez mayor de estrategias acertadas.

En una competición similar con 62 participantes, TFT ganó otra vez. Tiene tres características que explican su funcionamiento impresionante es:

agradable (coopera en el primer movimiento),
vengativo (castiga la defección en el movimiento anterior con la defección) y
perdonador (vuelta inmediata a la cooperación después de un indicio de arrepentimiento del adversario).

Subastas

No se sabe el precio de objetos poco conocidos
- Flexible
- Dinámico
- Mecanizado
Menor complejidad en las negociaciones
Ideal para su implementación computacional
Eficiente desde un punto de vista económico

Subastas e Inteligencia Artificial

Un ejemplo de donde las subastas pueden actuar dentro de la IA aparece cuando una colección de agentes está decidiendo cooperar en un plan común.

Hunsberger y Grosz (2000) demuestran que esto se puede lograr eficientemente con una subasta en la cual los multiagentes ofertan el papel que pueden satisfacer en un proyecto cooperativo.

Supongamos la existencia de multiagentes decisión-intensivos que podrían colaborar en una actividad grupal. Para incentivarlos a participar el diseñador enfrenta el llamado ICDP, o sea el problema inicial de compromiso en una dada decisión.

El mecanismo es una subasta combinatoria en la cual los agentes ofertan conjuntos de papeles que son parte de la actividad grupal. Cada papel abarca ciertas subtareas que debe satisfacer un agente. Cada oferta podría especificar algunas restricciones en el tiempo de ejecución de dichas subtareas. Este mecanismo admite entonces que cada agente mantenga privada una serie de detalles de su futura colaboración a la cual prestó conformidad a priori.

Resulta que las restricciones impuestas a los tiempos que ingresan con las diferentes ofertas contribuyen a dificultar la factibilidad del proyecto en común. No hay solución óptima cuando las restricciones temporasles son numerosas.

El diseñador prueba entonces diversas estrategias acordes con un único mecanismo, lo cual resulta en un novedoso tipo de conocimiento de cómo distribuir tareas en proyectos multiagentes, conocimiento demasiado importante como para ignorarlo.