Un agente teórico es aquel capaz de tomar decisiones racionales basado en aquello que cree y desea, también puede tomar decisiones en contextos en los que la incertidumbre y las metas conflictivas no ofrecen ninguna opción para decidir.
Las preferencias de un agente por ciertos estados del mundo está, incorporados en una función de utilidad, la cual asigna un sólo número para expresar que tan deseable es un estado. Las utilidades se combinan con el resultado de las probabilidades de las acciones para dar una utilidad esperada de cada una de éstas. La notación U(S) representará la utilidad del estado S de acuerdo con el agente que está tomando las decisiones.
El principio de la máxima utilidad esperada (MUE) afirma que el agente debe elegir aquellas acciones que permitan obtener el máximo de la utilidad esperada del agente. Todo lo que tiene que hacer el agente inteligente es calcular las diversas cantidades implicadas, maximizar sus acciones y eso es todo.
La teoría de la utilidad muestra que cuando un agente cuyas preferencias por determinadas loterías son congruentes con un conjunto de sencillos axiomas, se dice que dicho agente cuenta con una función; además el agente selecciona las acciones como si se tratara de obtener el máximo de su utilidad esperada.
Restricciones que se aplican a preferencias racionales: se especificarán algunas restricciones para las preferencias que debería tener un agente racional y entonces mostrar la deducción del principio de la MUE a partir de las restricciones. En el lenguaje de la teoría de utilidades, a los escenarios complejos se les denomina loterías, para destacar al idea de que los diversos resultados obtenidos son como distintos premios, y que el resultado está sujeto al azar. La siguiente notación sirve para expresar preferencias, o la falta de preferencia por loterías o estados:
La utilidad es una función mediante la que se correlacionan estados y números reales. Existen maneras sistemáticas para diseñar funciones de utilidad que, una vez instaladas en un agente artificial, permiten a éste producir el tipo de conducta que se desea.
La utilidad del dinero: proporciona un candidato como medida de utilidad: el dinero. Si nos limitamos a aquellas acciones que sólo afectan la cantidad de dinero que posee un agente, por lo general el agente preferirá tener más dinero. Se dice entonces que el agente muestra una preferencia monotónica por el dinero.
Escalas de utilidad y evaluación de la utilidad: Los axiomas de la utilidad no especifican una función de utilidad única para un agente, con base en su conducta de preferencias. Es decir, que la escala de utilidades es algo arbitraria. Un procedimiento usualmente empleado para asignar utilidades consiste en establecer una escala que tenga "el mejor premio posible" y la peor posible catástrofe en.
Funciones de utilidad de atributos múltiples
Los problemas en el que los resultados dependen de dos o más atributos, se abordan por medio de la lotería de la utilidad por atributos múltiples o TUAM. Los atributos son valores escalares continuos o discretos. El método que se utiliza básicamente en la teoría de la utilidad por atributos múltiples consiste en identificar las irregularidades que se producen en la conducta de preferencias que es de esperar, y utilizar lo que se conoce como teoremas de representación.
Dominancia
Existen algoritmos que sirven para difundir información cualitativa entre variables inciertas en las redes probabilistas cualitativas, lo que permite a un sistema tomar decisiones racionales con base en la dominancia estocástica y sin necesidad de calcular utilidades o probabilidades numéricas.
El procedimiento general para tomar decisiones racionales se le conoce como diagrama de influencia, aunque utilizaremos el termino mas descriptivo de red de decisión. En las redes de decisión se combinan las redes de creencia con tipos adicionales de nodos para acciones y utilidades.
Representación de un problema de decisión mediante redes de decisión
En una red de decisión está representada la información sobre el estado actual del agente, sus posibles acciones, el estado que resultará de las acciones que emprenda el agente así como la utilidad de dicho estado. Se utilizan tres tipos de nodos:
Una de las partes más importantes de la toma de decisiones es saber qué preguntas hay que hacer. La teoría del valor de la información permite a un agente decidir qué tipo de información obtener. La información se logra a través de acciones de percepción, es decir la teoría del valor de la información es un tipo especial de toma de decisiones secuencial.
El valor de la información se desprende del hecho que con la información, el curso de las acciones se modifica de manera adecuada para una situación propia. Permite juzgar con base en la situación, en tanto que sin información lo único que se puede hacer es optar por lo mejor que en promedio ofrecen las diversas situaciones posibles.
Implantación de un agente recopilador de información: el diseño general de un agente capaz, de antes de actuar, recopilar información de manera inteligente. A cada variable de evidencia Ej se asocia un costo, Costo(Ej); el agente solicita lo que a su juicio representa el elemento de información más valioso, dependiendo de su costo. Suponemos que el resultado de la acción Solicitar(Ej) será que la siguiente percepción proporcione el valor de Ej. Si ninguna información vale su costo, el agente opta por una acción de no recopilación de información. Mediante este algoritmo se implanta una forma de recopilación de información conocida como miope, que utiliza la fórmula “corta de vista” del VIP, calculando el valor de la información, basándose en que sólo se obtendrá una variable de evidencia. Se basa en el mismo criterio heurístico de la Búsqueda Avara. Sin embargo, un agente recopilador de información perfectamente racional deberá tomar en consideración el total de las secuencias posibles de peticiones de información que culminan en una acción externa; es decir hasta considerar los subconjuntos de posibles peticiones de información, sin preocuparse por su orden.
El campo del análisis de decisiones estudia la aplicación de la teoría de las decisiones en los problemas de decisión reales. El proceso implica un cuidadoso estudio de acciones y resultados posibles, así como de las preferencias por cada resultado. En el análisis de decisiones figuran dos actores:
La incorporación de redes de decisión permitió el diseño de sistemas expertos de manera que éstos fuesen capaces de recomendar decisiones óptimas, que tomarán en cuanta las preferencias del usuario y que reflejaran también la evidencia disponible.
Muchas son las ventajas obtenidas con la inclusión de modelos y cálculos de utilidad explícita en el marco de los sistemas expertos. Tales ventajas son: