Parte V
Sistemas de razonamiento Probabilístico
Aquí se explica un mecanismo de inferencia, para
construir un sistema de razonamiento para situaciones en donde está presente la
incertidumbre. La principal ventaja del razonamiento probabilístico con el
razonamiento lógico reside en el que el agente puede tomar decisiones
racionales aun sin disponer de suficiente información para probar que una
acción dada funcionará.
Para representar la dependencia que existe entre
determinadas variables se utiliza una estructura de datos conocida como red de
creencia, y también para especificar de manera concisa la distribución de
probabilidad conjunta. La red de creencia es una gráfica en la que se cumple lo
siguiente:
- Los nodos de la red están formados por un
conjunto de variables aleatorias.
- Cada par de nodos se conecta entre si mediante
un conjunto de enlaces o flechas. El significado implícito de una flecha
que vaya del nodo X al nodo Y es el de que X ejerce una influencia directa
sobre Y.
- Por cada nodo hay una tabla de probabilidad
condicional que sirve para cuantificar los efectos de los padres sobre el
nodo. Los padres de un nodo son aquellos nodos cuyas flechas apuntan hacia
éste.
- La gráfica no tiene ciclos dirigidos, por lo
tanto es una gráfica dirigida, acíclica, o GDA.
Luego hay que especificar la tabla de
probabilidad condicional, o TPC, de cada uno de los nodos, donde cada hilera de
la tabla indica la probabilidad condicional correspondiente al valor de nodo de
un caso condicionante. Un caso condicionante es una posible combinación de los
valores de los nodos padres.
Ejemplo de una tabla:
Robo |
Temblor |
P(Alarma|Robo, |
Temblor) |
|
|
Verdadero |
Falso |
Verdadero |
Verdadero |
0.950 |
0.050 |
Verdadero |
Falso |
0.950 |
0.050 |
Falso |
Verdadero |
0.290 |
0.710 |
Falso |
Falso |
0.001 |
0.999 |
La semántica de las redes de creencia
Hay dos maneras de interpretar la semántica de
las redes de creencia:
- Considerar la red como una representación de
la distribución de probabilidad conjunta.
- Considere la red como la codificación de un
conjunto de aseveraciones de independencia condicional.
Aunque ambas consideraciones son equivalentes, la
primera es útil para poder saber cómo construir las redes, en tanto que la
segunda sirve en el diseño de procedimientos de inferencia.
Representación de la Distribución de Probabilidad Conjunta
Es posible calcular cada una de las entradas de
la distribución de probabilidad conjunta desde la información de la red. Una entrada genérica es la probabilidad de una conjunción de asignaciones particulares hechas a cada variable. Como ejemplo, P(X1=x1^...^Xn=xn). Una forma abreviada es P(x1,...,xn). La fórmula genérica
es: P(x1,...,xn) = П P(xi|Padres(Xi))
desde i = 1 hasta n
Por lo tanto, las entradas de la probabilidad
conjunta se representan mediante el producto de los respectivos elementos de la
TPC de la red de creencia.
Relaciones de independencia condicional en las
redes de creencia
La información sobre la independencia
condicional es una forma vital y sólida de estructurar información sobre un
dominio incierto. Para poder diseñar algoritmos de inferencia, es necesario
saber si también son válidas independencias condicionales de tipo más
general. Nos entregan una red. ¿Hay alguna manera de saber si el conjunto de nodos X es independiente de otro conjunto Y, dado que poseemos un conjunto E de nodos de
evidencia? La respuesta es sí, y el método se deriva del concepto de
separación de la dirección o separación d. Esta última se trata de la separación dependiente de la dirección de las flechas convergentes y/o divergentes de un nodo y de su condición de oculto u observable.
La inferencia en las redes de creencia
El
principal objetivo de un sistema de inferencia probabilista es el cálculo de la
distribución de probabilidad posterior de un conjunto de variables de consulta (p.ej., “robo” es una variable de
consulta), con base en determinadas variables de evidencia. En general la forma como un agente captura valores para las variables de evidencia
es ya sea a través de sus percepciones o de su razonamiento basado en otros mecanismos. Pregunta los valores posibles de otras variables de manera de poder decidir qué acción tomar.
Las redes de creencia tienen una flexibilidad que permite a un nodo funcionar
como variable de evidencia.
Las redes de creencia efectúan cuatro tipos de
inferencia:
- Inferencias por diagnóstico (de los efectos a
las causas).
- Inferencias causales (de las causas a los
efectos).
- Inferencias intercasuales (entre las causas de
un efecto común).
- Inferencias mixtas (combinación de una o
varias de las inferencias anteriores).
La
inferencia en redes de creencia con múltiples conexiones
Un grafo con múltiples conexiones es aquél en el que dos nodos se conectan entre sí por más de una ruta.
La importancia de la novedad reside en que se nos autoriza a construir redes con varios mecanismos causales por los cuales una variable antecesora puede influir sobre una sucesora.
El inconveniente de la novedad reside en que el algoritmo ya usado deja de servir y debemos expandirlo recurriendo a alguno de estos tres tipos básicos de algoritmos:
- Algoritmos basados en métodos de agrupamiento (clustering)
donde transforman la red a su poliárbol probabilista equivalente, mediante
la fusión de los nodos que estorban.
- Algoritmos basados en métodos de condicionamiento por conjunto de corte (cutset conditioning) [La definición de un conjunto de corte es la de un conjunto de variables que puede ser concretizado para crear poliárboles, uno para cada caso concreto]
- Algoritmos usando métodos estocásticos (Monte-Carlo, etc.) de simulación.
Otros Enfoques para el Razonamiento Incierto
- Razonamiento por defecto o razonamiento
predefinido: La habilidad humana de basarse en evidencia cualitativa durante la toma de decisiones bajo incertidumbre es de asombrosa eficiencia.
El razonamiento por defecto simula la naturaleza cualitativa del razonamiento humano permitiendo el salto hacia las conclusiones como base del esquema. Se aparta así de la tradición probabilista basada en números, que raramente emplea el humano en su vida diaria.
Ejemplo: Se concluye por defecto que la sangre suya es roja, salvo que experimentalmente se vea que al cortarse la piel, aparezca verde. El razonamiento por defecto es que su sangre es roja. Si luego aparece verde, pondrá en duda que es roja y empezará a pensar que en realidad es verde. A este mecanismo se lo llama de retractación frente al razonamiento por defecto.
Retractación en las creencias.
- Métodos basados en reglas: también se ha
experimentado con métodos para manejar la incertidumbre mediante reglas. La
elaboración de tales métodos se intenta a partir del éxito obtenido por
los sistemas lógicos basados en reglas, añadiendo en cada regla un factor
de inserción para dar cabida a la incertidumbre. Además de la monotonicidad, los sistemas de razonamiento
lógico tienen otras 3 propiedades importantes: Localidad (en los sistemas
lógicos, la presencia de una regla como A => B, se interpreta como B
dada A, sin preocuparse por otras reglas. En los sistemas
probabilistas es necesario tomar en cuenta todas las evidencias disponibles);
Distanciamiento (Una vez que se ha derivado una prueba para una oración, ella se puede usar sin preocupaciones ulteriores acerca de la evidencia que ayudó a la derivación)
y Funcionalidad de verdad (El valor de verdad de una oración compleja se puede computar a partir de los valores de verdad de sus componentes).
Lo malo de los sistemas funcionales basados en la verdad es que las características localidad, distanciamiento y funcionalidad basados en la
verdad no son adecuados para el razonamiento en condiciones de
incertidumbre.
- Teoría de Dempster-Shafer: En esta teoría se
diferencia entre incertidumbre e ignorancia. En vez de calcular la
probabilidad de una proposición, calcula la probabilidad de que una
evidencia justifique la proposición. A esta medida de creencia se la conoce
como función de creencia. Intervalo de probabilidad: Los sistemas basados en esta teoría usan intervalos de probabilidad para adquirir cierta idea acerca de la necesidad de evidencia o no. El intervalo de probabilidad representa la diferencia entre la “probabilidad, dada la evidencia existente” y la “máxima probabilidad obtenible en presencia de evidencia adicional”.
- Lógica difusa: propone una ontología en
donde tiene cabida la vaguedad, es decir cuando un evento puede ser mas o
menos cierto. La vaguedad y la incertidumbre son temas ortogonales. La
teoría de los conjuntos difusos constituye un método para especificar que
tan bien corresponde un objeto a una descripción vaga.
Para algunos autores la teoría de los conjuntos difusos no es en lo más
mínimo un método para el razonamiento en condiciones de incertidumbre. La
lógica difusa se vale de oraciones complejas como PersonaAlta(Nate) \/
Inteligente(Nate) y determina su función de verdad como función de los
valores de verdad de sus respectivos componentes.