Académique Documents
Professionnel Documents
Culture Documents
Presentación
Dentro del mundo de Wumpus, tenemos una agente que está dentro de este mundo, el objetivo
del agente es encontrar el tesoro que se encuentra en este mundo, para lo cual tiene que pasar
por una serie de obstáculos, los cuales son un monstruo llamado Wumpus por el que puede ser
devorado y la otra forma de morir es cayendo a un hoyo, el cual es una muerte muy lenta, pero
para no morir en estos obstáculos tenemos ciertas percepciones que como agente percibimos,
en caso del Wumpus antes de encontrarlo percibimos su hedor que emana, con eso nos damos
cuenta que está cerca, o en caso de los hoyos se percibe una briza con el cual también sabemos
que está cerca un hoyo, así que nuestro agente tiene que pasar por estos obstáculos hasta
encontrar el tesoro armado con un arco y una sola flecha.
En este presente trabajo se presentara la forma en como “El mundo de Wumpus” puede ser
programado, no llegando a la programación pero si formulando el problema y estructurar la forma
de cómo se puede programar.
Introduccion
Dentro de la práctica uno de los problemas muy conocidos es el caso del Mundo de Wumpus, el cual
nosotros vamos a estructurar la forma de implantación.
Descripción REAS
Rendimiento. Encontrar eficazmente oro, y no caer en el hoyo o ser comido por el wumpus.
Entorno. En una matriz 4x4 habitaciones. El agente comienza en la casilla [1,1], las posiciones
de los obstáculos y del oro se cogen de forma aleatoria.
Actuadores. Se puede girar en 90° a la derecha, izquierda, arriba y abajo. Muere si cae en un
hoyo o se encuentra con el wumpus. Puede agarrar el arco y lazar una flecha pero solo tiene una
oportunidad.
Estados: El agente está localizado en la posición [1,1] puede tener los siguientes estados como:
1.-ninguna percepción
2.-brisa
3.-hedor
4.-wumpus
5.-brillo
-Estado Inicial: El estado del agente comienza con la posición 1.1 de la matriz 4x4.
-Función Sucesor: Esta genera los estados legales que resulta de aplicar laa cuatro acciones
(mover ala izquierda, derecha, arriba, abajo).
-Test Objetivo: El objetivo es buscar el tesoro y salir sin ser devorado o no caer en un hoyo.
-Costo del camino: El costo individual de cada paso es igual a 1 y el corto del camino es el
numero de paso que realiza
Es el agente que se moverá por el tablero. Deberá salir victorioso del tablero consiguiendo un
tesoro. Cuando los algoritmos de Búsqueda Heurística decidan el siguiente paso a seguir, será
éste el que se moverá según sus órdenes. Sin embargo, él será el que percibirá la heurística que
implicará uno u otro paso. Cuando llegue a una casilla, indicará lo que percibe en ella,
casillas adyacentes.
casillas adyacentes.
• Disparar en las direcciones de movimiento una flecha para matar al Wumpus cuando quiera.
• Coger el Tesoro.
• Si el agente muere de una de las anteriores maneras, volverá a la casilla de Entrada sin perder
el conocimiento obtenido del mapa.
• Modificará su información heurística cuando perciba algo, así como memorizará los elementos
visitados o deducidos.
• Entrará por la casilla de Entrada y saldrá por la casilla de Salida, que pueden ser la misma.
ESTRUCTURA
Si la casilla no tiene el oro y la casilla es o brisa o peste, marca las casillas adyacentes como
posibles brisa o peste (E_PIT,E_WUMPUS). Luego, realiza una visita al mapa mental para
revisar consistencias en la "sospecha":
Si la casilla es E_PIT y una de las casillas adyacentes que sea conocida no tiene el valor BRISA,
entonces la casilla se desmarca como E_PIT.
Si la casilla es E_WUMPUS y una de las casillas adyacentes que sea conocida no tiene el valor
STENCH, entonces la casilla se desmarca como E_WUMPUS.
Una vez que se hace la marcación y se delibera, se pasa a elegir la dirección a la cual moverse.
4
El agente tiene 4 direcciones posibles (top, right, bottom y left) siendo vistos desde una
orientación de manecillas del reloj, donde el top serían las 12, right serían las 3, bottom serían
las 6 y left serían las 9. El agente siempre avanza en la dirección que esté apuntando.
Inicialmente el agente inicia con top (apuntando hacia la casilla 1,2 de la figura 1). Para la toma
de decisión se siguen los siguientes pasos:
Si la celda a la cual está apuntando el agente no ha sido visita y es segura (no es E_PIT o
E_WUMPUS), se mueve a esa celda. Si la celda ya ha sido visitada o no es segura, entonces se
pasa a la siguiente dirección posible (en el sentido de las manecillas del reloj) hasta encontrar
una celda que no haya sido visitada.
Si no encuentra una celda a la cual se pueda mover, se regresa a la celda anterior Y repite el
procedimiento.
Una vez que encuetra el oro, inicia el proceso de “backtracking” Debido a que cada movimiento
válido se registra en un stack que indica la “dirección” a la que apuntó el agente al moverse (top,
right, bottom y left) lo que se hace es ir sacando del stack el valor en el tope, y se le invierte la
dirección (top se vuelve bottom, right se vuelve left, etc.). El agente se regresará, casilla por
casilla, por donde vino. Al llegar al lugar inicial, se detiene.
5
BIBLIOGRAFIA