Razonam. lógico

Site hosted by Angelfire.com: Build your free website today!

Parte V

Toma de decisiones sencillas

Un agente teórico es aquel capaz de tomar decisiones racionales basado en aquello que cree y desea, también puede tomar decisiones en contextos en los que la incertidumbre y las metas conflictivas no ofrecen ninguna opción para decidir.

Combinación de creencias y deseos en condiciones de incertidumbre

Las preferencias de un agente por ciertos estados del mundo está, incorporados en una función de utilidad, la cual asigna un sólo número para expresar que tan deseable es un estado. Las utilidades se combinan con el resultado de las probabilidades de las acciones para dar una utilidad esperada de cada una de éstas. La notación U(S) representará la utilidad del estado S de acuerdo con el agente que está tomando las decisiones.

El principio de la máxima utilidad esperada (MUE) afirma que el agente debe elegir aquellas acciones que permitan obtener el máximo de la utilidad esperada del agente. Todo lo que tiene que hacer el agente inteligente es calcular las diversas cantidades implicadas, maximizar sus acciones y eso es todo.

La teoría de la utilidad muestra que cuando un agente cuyas preferencias por determinadas loterías son congruentes con un conjunto de sencillos axiomas, se dice que dicho agente cuenta con una función; además el agente selecciona las acciones como si se tratara de obtener el máximo de su utilidad esperada.

Las bases de la teoría de la Utilidad

Restricciones que se aplican a preferencias racionales: se especificarán algunas restricciones para las preferencias que debería tener un agente racional y entonces mostrar la deducción del principio de la MUE a partir de las restricciones. En el lenguaje de la teoría de utilidades, a los escenarios complejos se les denomina loterías, para destacar al idea de que los diversos resultados obtenidos son como distintos premios, y que el resultado está sujeto al azar. La siguiente notación sirve para expresar preferencias, o la falta de preferencia por loterías o estados:

A > B : se prefiere A sobre B
A ~ B : para el agente es indiferente elegir entre A y B
A ≥ B : el agente prefiere A sobre B, o ambos le son indiferentes.

Funciones de utilidad

La utilidad es una función mediante la que se correlacionan estados y números reales. Existen maneras sistemáticas para diseñar funciones de utilidad que, una vez instaladas en un agente artificial, permiten a éste producir el tipo de conducta que se desea.

La utilidad del dinero: proporciona un candidato como medida de utilidad: el dinero. Si nos limitamos a aquellas acciones que sólo afectan la cantidad de dinero que posee un agente, por lo general el agente preferirá tener más dinero. Se dice entonces que el agente muestra una preferencia monotónica por el dinero.

Escalas de utilidad y evaluación de la utilidad: Los axiomas de la utilidad no especifican una función de utilidad única para un agente, con base en su conducta de preferencias. Es decir, que la escala de utilidades es algo arbitraria. Un procedimiento usualmente empleado para asignar utilidades consiste en establecer una escala que tenga "el mejor premio posible" y la peor posible catástrofe en.

Funciones de utilidad de atributos múltiples

Los problemas en el que los resultados dependen de dos o más atributos, se abordan por medio de la lotería de la utilidad por atributos múltiples o TUAM. Los atributos son valores escalares continuos o discretos. El método que se utiliza básicamente en la teoría de la utilidad por atributos múltiples consiste en identificar las irregularidades que se producen en la conducta de preferencias que es de esperar, y utilizar lo que se conoce como teoremas de representación.

Dominancia

Dominancia estricta: es cuando el valor de los atributos de una opción es inferior que los de otra, no hay necesidad de seguir evaluando. Si bien la dominancia estricta es muy útil para reducir el campo de alternativas de los contendientes reales, rara es la vez que indica una sóla opción.
Dominancia estocástica: es una técnica especialmente útil para tomar decisiones sin ambigüedad, aun sin contar con valores precisos de utilidad sobre los atributos.

Existen algoritmos que sirven para difundir información cualitativa entre variables inciertas en las redes probabilistas cualitativas, lo que permite a un sistema tomar decisiones racionales con base en la dominancia estocástica y sin necesidad de calcular utilidades o probabilidades numéricas.

Redes de decisión

El procedimiento general para tomar decisiones racionales se le conoce como diagrama de influencia, aunque utilizaremos el termino mas descriptivo de red de decisión. En las redes de decisión se combinan las redes de creencia con tipos adicionales de nodos para acciones y utilidades.

Representación de un problema de decisión mediante redes de decisión

En una red de decisión está representada la información sobre el estado actual del agente, sus posibles acciones, el estado que resultará de las acciones que emprenda el agente así como la utilidad de dicho estado. Se utilizan tres tipos de nodos:

Nodos aleatorios (óvalos): representan variables aleatorias. A cada nodo corresponde una tabla de probabilidad condicional (TPC), la que se indiza a partir del estado de los nodos padre. En el caso de las redes de decisión, en los nodos padre puede haber tantos nodos de decisión como nodos aleatorios.
Nodos de decisión (rectángulo): representan puntos para los cuales puede decidirse qué acción emprender.
Nodos de utilidad (rombos): representan la función de utilidad.

La importancia de la información

Una de las partes más importantes de la toma de decisiones es saber qué preguntas hay que hacer. La teoría del valor de la información permite a un agente decidir qué tipo de información obtener. La información se logra a través de acciones de percepción, es decir la teoría del valor de la información es un tipo especial de toma de decisiones secuencial.

El valor de la información se desprende del hecho que con la información, el curso de las acciones se modifica de manera adecuada para una situación propia. Permite juzgar con base en la situación, en tanto que sin información lo único que se puede hacer es optar por lo mejor que en promedio ofrecen las diversas situaciones posibles.

Implantación de un agente recopilador de información: el diseño general de un agente capaz, de antes de actuar, recopilar información de manera inteligente. A cada variable de evidencia Ej se asocia un costo, Costo(Ej); el agente solicita lo que a su juicio representa el elemento de información más valioso, dependiendo de su costo. Suponemos que el resultado de la acción Solicitar(Ej) será que la siguiente percepción proporcione el valor de Ej. Si ninguna información vale su costo, el agente opta por una acción de no recopilación de información. Mediante este algoritmo se implanta una forma de recopilación de información conocida como miope, que utiliza la fórmula “corta de vista” del VIP, calculando el valor de la información, basándose en que sólo se obtendrá una variable de evidencia. Se basa en el mismo criterio heurístico de la Búsqueda Avara. Sin embargo, un agente recopilador de información perfectamente racional deberá tomar en consideración el total de las secuencias posibles de peticiones de información que culminan en una acción externa; es decir hasta considerar los subconjuntos de posibles peticiones de información, sin preocuparse por su orden.

Sistemas expertos por decisión teórica

El campo del análisis de decisiones estudia la aplicación de la teoría de las decisiones en los problemas de decisión reales. El proceso implica un cuidadoso estudio de acciones y resultados posibles, así como de las preferencias por cada resultado. En el análisis de decisiones figuran dos actores:

Tomador de decisiones: quien define qué resultados son preferibles obtener.
Analista de decisiones: quien enumera las posibles decisiones y resultados correspondientes.

La incorporación de redes de decisión permitió el diseño de sistemas expertos de manera que éstos fuesen capaces de recomendar decisiones óptimas, que tomarán en cuanta las preferencias del usuario y que reflejaran también la evidencia disponible.

Muchas son las ventajas obtenidas con la inclusión de modelos y cálculos de utilidad explícita en el marco de los sistemas expertos. Tales ventajas son:

El experto aprovecha la posibilidad de representar de manera explícita sus preferencias.
El sistema realiza automáticamente el procedimiento de selección de acciones.
Se deducen conclusiones a partir de la evidencia.
Contar con información sobre la utilidad es un apoyo para la ingeniería del conocimiento.