Die Wumpus World oder auch Wumpus Welt ist ein gutes Beispiel um die grundlegenden Funktionen eines Software-Agenten zu beschreiben. Unser Agent hat hier die Aufgabe auf einem Feld mit Hindernissen das Gold zu finden.
Aufgebaut ist das Feld aus leeren Feldern, Löchern bzw. Falltüren (trap) und einem (oder mehreren) Wumpus. Auf den direkt an den Löchern anliegenden Feldern gibt es einen Windhauch (Breeze). Ebenso findet man auf den direkt angrenzenden Feldern eines Wumpus übel riechenden Gestank (smell). Es kann auch auf ein und demselben Feld ein Windhauch UND Gestank vorhanden sein.
Ziel des Spiels ist es, mit dem Agenten (hier der Smiley) das Gold zu erreichen, ohne in eines der Löcher zu fallen oder auf den (bösen bösen ^^) Wumpus zu treffen.
Unser Agent hat nun die Möglichkeiten sich nach oben, unten, rechts und links zu bewegen. An der Wand stößt er natürlich an und kann dort nicht weiter. Der Agent weiß nie was auf den Feldern um sich herum ist. Er weiß nur was sich auf dem Feld befindet, auf dem er gerade steht. Diese Information kann er speichern, sich also merken und wieder verwenden.
Wie soll der Agent nun das Gold finden? Ein Fallbeispiel soll das zeigen:
Wie auf dem Bild zu sehen beginnt er auf Feld A1. Dort spürt er weder einen Luftzug noch riecht er Gestank. Draus weiß er, dass auf keinem der angrenzenden Felder eine Falle oder der Wumpus ist. Die Felder sind sicher. Er kann sich also entscheiden wohin er geht, nach oben oder nach rechts.
In unserem Fall entscheidet sich der Agent für „oben“ und betritt das Feld A2. Hier vernimmt seine Nase Gestank. Auf Feld A3 oder auf Feld B2 muss sich ein Wumpus verstecken.
Um das Spiel nicht zu verlieren gehen wir zurück und begeben uns dieses Mal nach rechts auf B1. Dort spürt der Agent einen Windhauch und weiß somit, dass auf B2 oder C1 eine Falle sein muss. Da er sich aber auch die vorherige Information mit dem Gestank auf A2 gemerkt hat, weiß er jetzt noch mehr. Das Feld B2 überschneidet sich nämlich nun mit Informationen. Dort könnte Wumpus oder Falle sein.
Da aber auf dem besagten Feld A2 NUR Gestank und kein Windhauch war, und da auf dem jetzigen Feld B1 NUR ein Windhauch und kein Gestank zu vernehmen war, kann der Agent die Schlussfolgerung ziehen, dass sich auf der Überschneidung B2 ein sicheres, also leeres Feld befindet. (Außerdem weiß man jetzt, dass auf A3 ein Wumpus auf uns wartet.)
Mit dieser neuen Erkenntnis bewegen wir uns nun nach oben auf das sichere B2. Dort können wir weder Gestank noch Windhauch spüren. Wir wissen aber von vorher noch, dass sich links der Gestank und darüber der Wumpus befinden. Der Agent kann sich jetzt also zwischen oben B3 oder rechts C2 entscheiden.
Wir sind mal so gnädig und lassen ihn nach oben zum Gold gehen. Denn ich denke das Prinzip ist verstanden. Unser Agent hat gewonnen. 🙂
Und jetzt kommt der eigentlich schwierige Teil. Wie setzt man so etwas um? Wie lässt man den Agenten entscheiden, wenn er wie am Anfang mehrere Möglichkeiten hat sich zu bewegen? Fragen über Fragen. Doch damit beschäftigen wir uns ein ander Mal.
Bild: Wikipedia