Práctico N-2: Redes de Bayes Comercio Electrónico Integrantes: *Agustín Heraldo Giannoni *Mariano Larrondo *Ernesto Gabriel Alberto Medina
Modelo del problema Para modelar el dominio de Comercio electrónico, utilizamos una red de Bayes que es una representación gráfica de conocimiento incierto, adecuada para manipulación probabilística. Estas redes proveen una forma compacta de representar conocimiento y métodos flexibles de razonamiento. Las cuestiones a definir son dos: Variables y Dependencias El primer paso es descubrir las variables implicadas en el problema y definir los posibles estados que esas variables pueden tomar. Luego se procede a identificar las dependencias entre dichas variables, una dependencia de una variable B a una variable A implica que el conocimiento de A influye en el conocimiento de B. Como el sistema posee algoritmos de aprendizaje, las tablas de probabilidades de actualizan automáticamente basada en la experiencia anterior del usuario.
Variables y estados. Se definieron las siguientes variables con sus respectivos estados para modelar el dominio de comercio electrónico: Tipo de producto: (Comestibles / Electrónicos / Amoblado / Decoración / Vestimenta invierno / Vestimenta verano). Corresponde a los distintos tipos de productos en el comercio electrónico y son las diferentes opciones de compra de una persona. Calidad: (Usado / Nuevo). Corresponde a si el producto comprado es nuevo o usado. Precio: (Menos de 50 / Menos de 100 / Menos de 500 / Menos de 1000 / Menos de 5000 / Menos de 10000) corresponde a los distintos rangos de precios que puede tomar un producto. Modelo: (Moderno / Clásico). Corresponde a una característica del producto, siendo un modelo clásico anterior a uno moderno. Tamaño: (De fácil transporte / De difícil transporte). Corresponde a una característica del tipo de producto. Fecha de Compra: (Enero / Febrero / Marzo / Abril / Mayo / Junio / Agosto / Septiembre / Octubre / Noviembre / Diciembre). Corresponde a los distintos meses en los que se pudo hacer una compra. Forma de Envío: (Correo / Transporte). Corresponde a la forma en que se puede entregar un producto. Forma de Pago: (Tarjeta / Efectivo). Corresponde a la forma en que se puede realizar un pago de un producto.
Los estados de las variables son excluyentes, es decir, en un momento dado una variable sólo puede estar instanciado con uno de los valores.
Relaciones entre las variables. Tipo --> Precio Como ejemplo los productos comestibles suelen costar menos que los muebles, o los electrónicos. Los distintos tipos de productos en general están dentro de un rango de precio (ej. comestibles de 1$ a 100$, electrónicos de 50$ a 8000$ por decir algo). De esa manera se ve claramente la dependencia del precio, con respecto al tipo de producto. Calidad --> Precio La calidad de un producto influye directamente en el precio del producto, a mayor calidad es seguro que el precio sea mayor. Tamaño --> Precio Mayor tamaño implica mayor cantidad de materiales para elaborar el producto, lo que supone que el tamaño impacta en el precio. Fecha de compra --> Precio La fecha de compra puede influir en el precio de un producto. Por ejemplo en Diciembre las empresas suelen poner sus productos en oferta para garantizar una buena cantidad de ventas durante las fiestas de Diciembre. Modelo --> Precio Suponiendo que modelo es como la antigüedad que se lanzo el producto, influiría en el precio. Por ejemplo un auto de modelo anterior no valdrá lo mismo que uno último modelo, artículos electrónicos del año pasado no valen igual que los nuevos, etc. Tipo --> Tamaño Cada tipo de producto tiende a ser de un determinado tamaño Tamaño --> Forma de envío El tamaño influye sobre la forma en que se puede transportar el producto Precio --> Forma de pago El precio del producto puede llevar a decidir qué forma de pago tomar, muy probablemente si el precio de la compra es elevado se tomara una opción de pago con crédito, en caso contrario lo más probables es que se page en efectivo.
El grafo queda de la siguiente forma:
Probabilidades Las tablas probabilidades de cada variable se obtienen automáticamente por medio de un proceso de aprendizaje (Utilizando algunos de los algoritmos de aprendizaje) . Cuando el usuario realiza compras, eso impacta en el sistema, llevando a actualizar las probabilidades a base de estas experiencias.
Tipo: Posee una tabla de probabilidad marginal. Representa la probabilidad de que el usuario compre cada producto, en base a los productos que compró en el pasado. Tamaño: Depende del Tipo, por lo tanto tendrá una tabla de probabilidad condicionada por Tipo. Representa las probabilidades de que el tamaño tome distintos valores dependiendo del Tipo. Por ejemplo si se instancia el Tipo con el valor “Electrónico” entonces la Probabilidad de que el Tamaño sea “De fácil transporte” viene dada por P (Tamaño=De fácil transporte/Tipo=Electrónico). Calidad: Posee una tabla de probabilidad marginal. Representa la probabilidad de que el usuario compre un producto de distinta calidad. En base a las compras pasadas, se generan las probabilidades de que la calidad de la compra tome los valores Nuevo y Usado. Modelo: Posee una tabla de probabilidad marginal. Representa la probabilidad de que el usuario compre un producto de modelo antiguo o contemporáneo. En base a la experiencia pasada, se generan las probabilidades de que el modelo tome estos 2 valores. Precio: Esta variable depende del Tamaño, Tipo, Calidad, y Modelo, por lo tanto tendrá una tabla de probabilidad condicionada que manifieste la probabilidad de que el precio tome los distintos valores, dados que se conocen los valores del Tamaño, Tipo, Calidad y Modelo. Forma de envío: Esta variable depende de la variable Tamaño, por lo tanto posee una tabla de probabilidad condicionada. Representa la probabilidad de que la forma de envío tome el valor “Correo” o “Transporte” dado los distintos valores de Tamaño. Por ejemplo P(Forma de envío=Transporte/Tamaño=De difícil transporte) será alta. Forma de pago: Está condicionada por el Precio, por lo tanto poseerá una tabla de probabilidad condicionada. Representa la probabilidad de que la forma de pago tome uno de los dos valores (Crédito o Efectivo) dado el valor de la variable Precio. Por ejemplo P(Forma de pago=Efectivo/Precio=Menos de 10000) será baja, ya que para un precio tan alto es más probable que se realice un pago en crédito. Fecha de compra: Posee una tabla de probabilidad marginal. Representa la probabilidad de que la fecha tome un valor entre Enero y Diciembre.
Entonces si definimos las variables como: (V1)Tipo: Comestibles/Electrónicos/Muebles / Decoración/Vestimenta Invierno /Vestimenta Verano. (V2)Calidad: Usado/Nuevo. (V3)Tamaño: fácil transporte / difícil transporte. (V4)Modelo: Moderno/Clásico. (V5)Forma de Pago: Tarjeta/Efectivo. (V6)Fecha de Compra: Enero/Febrero, etc. (V7)Precio: menos de 50 / menos de 100 / menos de 500 / menos de 1000 / menos de 5000 / menos de 10000. (V8) Forma de Envío: Correo/Transporte La expresión del caculo de la probabilidad será: P(V1, V2, V3, V4, V5, V6, V7,V8)= P(V7|V1,V2,V3,V4,V6)P(V5|V7)P(V8|V3)P(V1)P(V2)P(V3|V1)P(V4)P(V6)
Uso de la Red Cómo utilizará la red el agente para asistir al usuario. Qué queremos obtener mediante inferencia probabilística, qué tenemos como evidencia y cuál sería la decisión del agente, para diferentes situaciones con los dominios. La evidencia sería el conjunto de observaciones con las que contamos inicialmente. Luego se van introduciendo las nuevas observaciones asociadas a la elección del usuario, y se propagan las probabilidades para el resto de las variables (a este proceso se le llama inferencia). La red de bayes define un modelo que hace uso de un razonamiento predictivo, dado un cierto hecho del mundo real (la elección de las características de una compra por un comercio electrónico por parte de un usuario), la red es capaz de propagar esta información para predecir sus efectos (posibles estados que van a tomar la otras variables). Se conoce la estructura de la red y las dependencias entre las variables, para el cálculo de las tablas de probabilidades se utilizarían algoritmos de aprendizaje ya que no se cuenta con experto para obtener las probabilidades asociadas.
Resumiendo, la utilidad de esta red radica en la asistencia al usuario a través de un agente encargado de interactuar con ellos, para anticiparse a sus necesidades y objetivos, en base a experiencias previas.