Vous êtes sur la page 1sur 5

1

Presentación

Dentro del mundo de Wumpus, tenemos una agente que está dentro de este mundo, el objetivo
del agente es encontrar el tesoro que se encuentra en este mundo, para lo cual tiene que pasar
por una serie de obstáculos, los cuales son un monstruo llamado Wumpus por el que puede ser
devorado y la otra forma de morir es cayendo a un hoyo, el cual es una muerte muy lenta, pero
para no morir en estos obstáculos tenemos ciertas percepciones que como agente percibimos,
en caso del Wumpus antes de encontrarlo percibimos su hedor que emana, con eso nos damos
cuenta que está cerca, o en caso de los hoyos se percibe una briza con el cual también sabemos
que está cerca un hoyo, así que nuestro agente tiene que pasar por estos obstáculos hasta
encontrar el tesoro armado con un arco y una sola flecha.

En este presente trabajo se presentara la forma en como “El mundo de Wumpus” puede ser
programado, no llegando a la programación pero si formulando el problema y estructurar la forma
de cómo se puede programar.

Introduccion

La Inteligencia Artificial es un campo de la Computación actualmente en auge, debido a la necesidad de


encontrar soluciones a problemas de la vida real de manera automatizada.

Dentro de la práctica uno de los problemas muy conocidos es el caso del Mundo de Wumpus, el cual
nosotros vamos a estructurar la forma de implantación.

Planeación del problema

Descripción REAS

Rendimiento. Encontrar eficazmente oro, y no caer en el hoyo o ser comido por el wumpus.

Entorno. En una matriz 4x4 habitaciones. El agente comienza en la casilla [1,1], las posiciones
de los obstáculos y del oro se cogen de forma aleatoria.

Actuadores. Se puede girar en 90° a la derecha, izquierda, arriba y abajo. Muere si cae en un
hoyo o se encuentra con el wumpus. Puede agarrar el arco y lazar una flecha pero solo tiene una
oportunidad.

Sensores. Dispone de 5 sensores.

- El agente percibirá un mal hedor si se encuentra en la misma casilla que el wumpus o


en las directamente adyacentes a él (no en diagonal).
- El agente recibirá una pequeña brisa en las casillas directamente adyacentes donde hay
un hoyo.
- El agente verá un resplandor en las casillas donde está el oro.
- Si el agente intenta atravesar un muro sentirá un golpe.
- Cuando el wumpus es aniquilado emite un desconsolado grito que se puede oír
en toda la cueva.
2

Formulación del problema.

Estados: El agente está localizado en la posición [1,1] puede tener los siguientes estados como:

1.-ninguna percepción

2.-brisa

3.-hedor

4.-wumpus

5.-brillo

6.-brillo, brisa y hedor

-Estado Inicial: El estado del agente comienza con la posición 1.1 de la matriz 4x4.

-Función Sucesor: Esta genera los estados legales que resulta de aplicar laa cuatro acciones
(mover ala izquierda, derecha, arriba, abajo).

-Test Objetivo: El objetivo es buscar el tesoro y salir sin ser devorado o no caer en un hoyo.

-Costo del camino: El costo individual de cada paso es igual a 1 y el corto del camino es el
numero de paso que realiza

Es el agente que se moverá por el tablero. Deberá salir victorioso del tablero consiguiendo un
tesoro. Cuando los algoritmos de Búsqueda Heurística decidan el siguiente paso a seguir, será
éste el que se moverá según sus órdenes. Sin embargo, él será el que percibirá la heurística que
implicará uno u otro paso. Cuando llegue a una casilla, indicará lo que percibe en ella,

pudiendo ser las siguientes posibilidades:

• El agente percibe si en su casilla se encuentra el Wumpus.

• El agente percibe en su casilla Hedor, por tanto hay un Wumpus en las

casillas adyacentes.

• El agente percibe en su casilla Viento, por tanto hay un Pozo en las


3

casillas adyacentes.

• El agente percibe si en su casilla se encuentra el tesoro.

• El agente percibe si en su casilla hay un pozo o agujero.

• El agente puede percibir un grito desde su casilla.

En función de lo que perciba, el aventurero reaccionará de una manera u otra, muriendo o


actualizando su información Heurística. Las vidas o intentos que tiene el aventurero para resolver
el problema, es decir, las veces que puede morir, son limitadas por el usuario, aunque
clásicamente tiene intentos ilimitados. Además dispone de una Flecha, aunque del mismo modo
pueden añadirse más, para defenderse del Wumpus.

El Aventurero podrá realizar las siguientes acciones:

• Moverse en dirección Norte, Sur, Este y Oeste, pero nunca en diagonal.

• Disparar en las direcciones de movimiento una flecha para matar al Wumpus cuando quiera.

• Coger el Tesoro.

• Morirá devorado si cae en la casilla del Wumpus, estando éste vivo.

• Morirá al caer por un pozo si cae en una casilla de este tipo.

• Si el agente muere de una de las anteriores maneras, volverá a la casilla de Entrada sin perder
el conocimiento obtenido del mapa.

• Modificará su información heurística cuando perciba algo, así como memorizará los elementos
visitados o deducidos.

• Entrará por la casilla de Entrada y saldrá por la casilla de Salida, que pueden ser la misma.

ESTRUCTURA

Para cada visita a una celda no conocida:

Si la casilla no ha sido visitada anteriormente, lee el valor de la casilla actual y lo marca en la


representación mental (matriz 4x4).

Si la casilla tiene el oro, lo toma e inicia el regreso a la salida.

Si la casilla no tiene el oro y la casilla es o brisa o peste, marca las casillas adyacentes como
posibles brisa o peste (E_PIT,E_WUMPUS). Luego, realiza una visita al mapa mental para
revisar consistencias en la "sospecha":

Para cada casilla conocida que sea adyacente a E_PIT o E_WUMPUS

Si la casilla es E_PIT y una de las casillas adyacentes que sea conocida no tiene el valor BRISA,
entonces la casilla se desmarca como E_PIT.

Si la casilla es E_WUMPUS y una de las casillas adyacentes que sea conocida no tiene el valor
STENCH, entonces la casilla se desmarca como E_WUMPUS.

Una vez que se hace la marcación y se delibera, se pasa a elegir la dirección a la cual moverse.
4

El agente tiene 4 direcciones posibles (top, right, bottom y left) siendo vistos desde una
orientación de manecillas del reloj, donde el top serían las 12, right serían las 3, bottom serían
las 6 y left serían las 9. El agente siempre avanza en la dirección que esté apuntando.
Inicialmente el agente inicia con top (apuntando hacia la casilla 1,2 de la figura 1). Para la toma
de decisión se siguen los siguientes pasos:

Obtiene las celdas adyacentes en el mapa mental (matriz de 4x4)

Si la celda a la cual está apuntando el agente no ha sido visita y es segura (no es E_PIT o
E_WUMPUS), se mueve a esa celda. Si la celda ya ha sido visitada o no es segura, entonces se
pasa a la siguiente dirección posible (en el sentido de las manecillas del reloj) hasta encontrar
una celda que no haya sido visitada.

Si no encuentra una celda a la cual se pueda mover, se regresa a la celda anterior Y repite el
procedimiento.

Una vez que encuetra el oro, inicia el proceso de “backtracking” Debido a que cada movimiento
válido se registra en un stack que indica la “dirección” a la que apuntó el agente al moverse (top,
right, bottom y left) lo que se hace es ir sacando del stack el valor en el tope, y se le invierte la
dirección (top se vuelve bottom, right se vuelve left, etc.). El agente se regresará, casilla por
casilla, por donde vino. Al llegar al lugar inicial, se detiene.
5

BIBLIOGRAFIA

Vous aimerez peut-être aussi