Wie KI-Agenten funktionieren: Vom Prompt zur autonomen Aktion

Jazmie Jamaludin

Ein KI-Agent kann von außen wie Magie wirken: Man gibt ihm ein vages Ziel vor und Minuten später ist eine mehrstufige Aufgabe erledigt. Aber darunter steckt keine Magie, sondern nur ein genau definierter Zyklus, der sich wiederholt, bis die Arbeit abgeschlossen ist. Diesen Zyklus zu verstehen, ist das Nützlichste, was eine Führungskraft tun kann, bevor sie einen Agenten beauftragt, denn es erklärt sowohl, wofür Agenten gut sind als auch wo sie scheitern.

Dieser Artikel gibt Einblicke hinter die Kulissen. Wir verfolgen Schritt für Schritt den Weg von einer ersten Eingabeaufforderung zur autonomen Aktion: wie ein Agent ein Ziel interpretiert, plant, Werkzeuge auswählt, Ergebnisse beobachtet, sich erinnert, reflektiert und weiß, wann er stoppen oder eskalieren muss. Dabei erfahren Sie, warum jede Komponente wichtig ist und was schiefgeht, wenn eine fehlt.

Die Agentenschleife in einem Satz

Im Kern durchläuft ein KI-Agent eine Schleife: den aktuellen Zustand wahrnehmen, die nächste Aktion entscheiden, handeln, das Ergebnis beobachten und wiederholen, bis das Ziel erreicht oder eine Grenze erreicht ist. Alles andere sind Details, die auf diesen Zyklus aufgesetzt sind. Die Schleife unterscheidet einen Agenten von einem einmaligen generativen Modell, das eine einzelne Ausgabe erzeugt und stoppt. Wenn Sie zuerst den strategischen Rahmen wünschen, bietet unser praktischer Leitfaden zu Agenten-KI die Grundlagen, und die Unterscheidung von passiver Generierung wird in Agenten-KI versus generativer KI behandelt.

Eine einzelne Agentenaufgabe kann Dutzende von Modellaufrufen und Werkzeuginvokationen verketten
Jede Schleifeniteration ist eine Gelegenheit, Richtung Ziel zu korrigieren, anstatt sich auf eine fehlerhafte erste Antwort festzulegen.
Quelle: Stanford HAI

Schritt eins: Das Ziel interpretieren

Alles beginnt mit einer Eingabeaufforderung, aber ein Agent behandelt diese anders als ein Chatbot. Anstatt sie zu beantworten, analysiert der Reasoning-Kern des Agenten, normalerweise ein großes Sprachmodell, das Ziel und die damit verbundenen Einschränkungen. Bei „Wochenbericht erstellen“ identifiziert er, welche Daten benötigt werden, welches Format erwartet wird und was als erledigt gilt. Die Qualität dieser Interpretation hängt stark davon ab, wie klar das Ziel und die Anweisungen des Agenten formuliert sind, weshalb Prompt- und Systemdesign auch in autonomen Systemen Kernkompetenzen bleiben.

Schritt zwei: Planung

Sobald das Ziel verstanden ist, erstellt der Agent einen Plan: eine geordnete Reihe von Unteraufgaben. Für den Verkaufsbericht könnte er entscheiden, Zahlen aus der Datenbank abzurufen, sie mit der Vorwoche zu vergleichen, Trends zusammenzufassen und das Ergebnis zu formatieren. Einige Agenten planen die gesamte Abfolge im Voraus; andere planen Schritt für Schritt und planen neu, wenn sie dazulernen. Die Planungsqualität ist der größte Einzelfaktor für den Erfolg eines Agenten und hängt von der Leistungsfähigkeit des zugrunde liegenden Modells ab, weshalb die Auswahl des richtigen KI-Modells so wichtig ist.

Schritt drei: Werkzeugeinsatz

Ein Plan ist nutzlos, wenn der Agent ihn nicht umsetzen kann. Werkzeuge sind die Hände des Agenten: Funktionen, die er aufrufen kann, um eine Datenbank abzufragen, eine E-Mail zu senden, im Web zu suchen, einen Datensatz zu aktualisieren oder ein anderes System auszulösen. Der Agent entscheidet, welches Werkzeug verwendet werden soll und konstruiert die Argumente, dann empfängt er die Ausgabe des Werkzeugs zurück in seinem Kontext. Dies ist der Moment, in dem ein Agent aufhört, ein Redner zu sein und zum Handelnden wird. Die richtige Integration von Werkzeugen, einschließlich Authentifizierung, Fehlerbehandlung und Ratenbegrenzungen, ist eine eigene Disziplin, die in Integration von KI-Agenten mit Werkzeugen ausführlich behandelt wird.

Die Agentenschleife, Schritt für Schritt
Phase Was passiert Fehlermodus
Interpretieren Ziel und Einschränkungen analysieren Falsche Absicht
Planen In Unteraufgaben zerlegen Schritte überspringen oder wiederholen
Handeln Werkzeuge aufrufen, ausführen Falsches Werkzeug oder Argumente
Beobachten Ergebnisse lesen, Zustand aktualisieren Fehler ignorieren
Reflektieren Fortschritt überprüfen, neu planen Erklärt zu früh für erledigt

Schritt vier: Beobachten und Zustand aktualisieren

Nach jeder Aktion liest der Agent das Ergebnis und aktualisiert sein Verständnis. Wenn die Datenbankabfrage einen Fehler zurückgab, bemerkt ein robuster Agent dies, diagnostiziert und versucht eine Alternative. Wenn die Daten wie erwartet zurückkamen, geht er zum nächsten Schritt über. Dieses Beobachten-und-Anpassen-Verhalten macht Agenten widerstandsfähig gegenüber der Unübersichtlichkeit realer Systeme, wo APIs ablaufen und Daten unvollständig sind. Ein anfälliger Agent, der die Werkzeugausgabe ignoriert, wird auf falschen Annahmen vorpreschen; ein guter Agent behandelt jede Beobachtung als Chance zur Kurskorrektur.

Schritt fünf: Erinnerung

Um über viele Schritte und Sitzungen hinweg zu arbeiten, benötigt ein Agent Gedächtnis. Das Arbeitsgedächtnis hält den aktuellen Aufgabenkontext: den Plan, was getan wurde und die neuesten Beobachtungen. Das Langzeitgedächtnis, oft in einer Vektordatenbank gespeichert, enthält Wissen, das persistent ist, wie z.B. Kundenpräferenzen, Unternehmensrichtlinien oder die Ergebnisse früherer Ausführungen. Wenn ein Kunde zurückkehrt, erinnert sich ein Agent mit gutem Langzeitgedächtnis an seine Historie, anstatt kalt zu starten. Ohne Gedächtnis wiederholen Agenten Arbeit, verlieren bei langen Aufgaben den Faden und können nicht personalisieren.

Reflexion und Selbstprüfung verbessern die Agenten-Zuverlässigkeit messbar
Ein Agent, der seine eigene Arbeit vor dem Abschluss kritisiert, reduziert Fehler bei komplexen mehrstufigen Aufgaben.
Quelle: MIT Sloan

Schritt sechs: Reflexion und wissen, wann man aufhört

Ausgereifte Agenten fügen einen Reflexionsschritt hinzu: Bevor der Agent den Erfolg verkündet, überprüft er seine eigene Ausgabe anhand des ursprünglichen Ziels und fragt, ob die Arbeit wirklich vollständig und korrekt ist. Diese Selbstkritik fängt Fehler ab, die sonst durchrutschen würden. Ebenso wichtig ist es, zu wissen, wann man aufhören muss, sei es, weil das Ziel erreicht ist, ein Schrittbudget erschöpft ist oder der Agent eine Situation erreicht hat, die er eskalieren sollte. Die Definition dieser Abbruchbedingungen ist Teil der Steuerung der Autonomie, ein Gleichgewicht, das in Mensch-in-the-Loop versus autonomen Agenten untersucht wird.

Leitplanken und Orchestrierung

Um die gesamte Schleife herum befindet sich eine Orchestrierungsebene, die Grenzen durchsetzt: wie viele Schritte erlaubt sind, welche Aktionen menschliche Genehmigung erfordern, was der Agent niemals tun darf und wie jede Aktion zur Überprüfung protokolliert wird. Hier wohnt die Sicherheit. Ein gut orchestrierter Agent ist begrenzt und beobachtbar, sodass Sie im Fehlerfall genau sehen können, was er getan hat und warum. Diese Kontrollen sind zentral für die Governance und Compliance von Agenten-KI und für die Verwaltung der Sicherheitsrisiken von KI-Agenten.

Einzelne Agenten und Agententeams

Die bisher beschriebene Schleife steuert einen einzelnen Agenten, aber viele reale Systeme verwenden mehrere, die zusammenarbeiten. Wenn eine Aufgabe zu breit ist, als dass ein Agent sie zuverlässig bearbeiten könnte, wird sie oft in spezialisierte Rollen aufgeteilt, die von einem Supervisor koordiniert werden: Ein Agent sammelt Daten, ein anderer analysiert sie, ein dritter entwirft die Ausgabe, und der Supervisor fügt die Ergebnisse zusammen. Jeder Unteragent durchläuft seine eigene Schleife, und der Supervisor durchläuft eine eigene Schleife, die delegiert und überprüft. Diese Arbeitsteilung spiegelt wider, wie menschliche Teams arbeiten, und neigt dazu, jeden Teil einfacher zu testen, zu debuggen und zu steuern als einen ausgedehnten Agenten, der versucht, alles zu tun. Die damit verbundenen Designentscheidungen werden in Multi-Agenten-Systeme für Unternehmen behandelt.

Ob Sie einen Agenten oder viele verwenden, der zugrunde liegende Zyklus ist identisch. Das Verständnis der Schleife skaliert daher: Sobald Sie den Wahrnehmungs-Plan-Aktions-Rhythmus eines einzelnen Agenten verstehen, können Sie eine ganze Orchestrierung davon verstehen, denn jeder Spieler führt einfach dieselben genau definierten Schritte zu einem engeren Ziel aus.

Wo die Schleife typischerweise unterbrochen wird

Das Wissen um die Schleife verrät Ihnen auch, wo Sie suchen müssen, wenn ein Agent sich falsch verhält, denn fast jeder Fehler lässt sich einer Phase zuordnen. Wenn der Agent das falsche Ziel verfolgt, liegt der Fehler im Interpretationsschritt, meist weil das Ziel oder die Systemanweisungen mehrdeutig waren. Wenn er einen vernünftig aussehenden, aber ineffektiven Weg einschlägt, ist der Planungsschritt schwach, oft ein Zeichen dafür, dass das zugrunde liegende Modell über seine Fähigkeiten hinaus planen muss. Wenn er die falsche Funktion aufruft oder die Argumente durcheinanderbringt, benötigt die Tool-Ebene klarere Definitionen und eine bessere Validierung. Wenn er nach einer fehlgeschlagenen Aktion einfach weiterläuft, speist der Beobachtungsschritt keine Fehler zurück in die Schleife. Und wenn er zu früh oder gar nicht aufhört, müssen die Reflexions- und Stoppbedingungen verschärft werden.

Diese diagnostische Karte ist einer der praktischsten Gründe, die Schleife zu lernen. Anstatt einen fehlerhaften Agenten als eine undurchsichtige Black Box zu behandeln, können Sie fragen, welche Phase das schlechte Verhalten hervorgerufen hat, und dieses spezifische Glied reparieren. Teams, die diese Gewohnheit annehmen, debuggen Agenten viel schneller, weil sie über eine bekannte Struktur nachdenken, anstatt zu raten. Es prägt auch, wie Sie einen Agenten überhaupt instrumentieren: Protokollieren Sie die Ausgabe jeder Phase, und Sie können Fehler genau lokalisieren, anstatt nur zu beobachten, dass das Endergebnis falsch war.

Warum die Schleife wichtig ist, wenn Sie kaufen oder bauen

Für jeden, der einen Agenten beauftragt, anstatt ihn zu programmieren, ist die Schleife mehr als eine technische Kuriosität; sie ist eine Checkliste, um einem Anbieter oder Team gute Fragen zu stellen. Da die Interpretation an erster Stelle steht, können Sie fragen, wie dem System mitgeteilt wird, was "erledigt" bedeutet, und ob die Ziele klar genug ausgedrückt werden, um das selbstbewusste Verfolgen des falschen Ziels zu vermeiden. Da die Planung vom zugrunde liegenden Modell abhängt, können Sie fragen, welches Modell das Reasoning antreibt und wie es mit komplexen Aufgaben umgeht. Da Tools der Ort sind, an dem Aktionen stattfinden, können Sie fragen, welche Systeme der Agent berühren kann, wie diese Verbindungen gesichert sind und was ihn daran hindert, außerhalb seines Zuständigkeitsbereichs zu handeln.

Dieselbe Perspektive schärft Ihre Erwartungen an die Zuverlässigkeit. Da das Gedächtnis bestimmt, ob ein Agent personalisieren und redundante Arbeit vermeiden kann, können Sie fragen, wie der Kontext über eine Aufgabe und über Sitzungen hinweg erhalten bleibt. Da Reflexions- und Stoppbedingungen regeln, ob ein Agent sauber abschließt, können Sie fragen, wie das System entscheidet, dass es fertig ist und wann es einen Menschen einschaltet. Käufer, die ihre Fragen um diese Phasen herum formulieren, beauftragen tendenziell Agenten, die tatsächlich in der Produktion funktionieren, weil sie die Teile hinterfragen, die den Erfolg bestimmen, anstatt von einer polierten Demo geblendet zu werden. Die Schleife ist, mit anderen Worten, am Verhandlungstisch genauso nützlich wie an der Tastatur.

Zusammenführung in einem Geschäftsbeispiel

Stellen Sie sich vor, ein Kunde schreibt einer Support-Hotline und bittet um Änderung einer Lieferadresse. Ein Agent interpretiert die Anfrage, plant die Identitätsprüfung, die Bestellsuche, prüft, ob die Lieferung bereits erfolgt ist, und aktualisiert die Adresse oder erklärt, warum dies nicht möglich ist. Er ruft das Bestellsystem auf, liest den Status, nimmt die Änderung vor, bestätigt dem Kunden und protokolliert die Aktion. Eine Eskalation erfolgt nur, wenn etwas Ungewöhnliches auftritt. Dieselbe Schleife treibt einen KI-Chatbot auf WhatsApp an, der Tausende solcher Anfragen bearbeitet. Um vom Verständnis zum Bau zu gelangen, lesen Sie Ihren ersten KI-Agenten bauen oder sprechen Sie mit einem Spezialisten über Ihren Anwendungsfall. Die entscheidende Erkenntnis ist, dass nichts davon erfordert, dass der Agent im menschlichen Sinne klug ist; es erfordert ein klares Ziel, gute Werkzeuge, zuverlässiges Gedächtnis und disziplinierte Leitplanken, alles um eine Schleife herum, die ihren eigenen Fortschritt überprüft, bis die Aufgabe wirklich erledigt ist.

Häufig gestellte Fragen

Was ist die Agentenschleife?+
Die Agentenschleife ist der sich wiederholende Zyklus des Wahrnehmens des aktuellen Zustands, des Entscheidens der nächsten Aktion, des Handelns über ein Werkzeug, des Beobachtens des Ergebnisses und des Neuplanens. Sie wird fortgesetzt, bis das Ziel erreicht oder eine Grenze erreicht ist, was Agenten befähigt, mehrstufige Aufgaben zu erledigen.
Wie entscheidet ein Agent, welches Werkzeug er verwenden soll?+
Der Kern des Reasoning erhält eine Beschreibung jedes verfügbaren Werkzeugs und seiner Parameter. Basierend auf dem aktuellen Schritt in seinem Plan wählt er das am besten geeignete Werkzeug aus und konstruiert die Argumente, liest dann die Ausgabe zurück, um zu entscheiden, was als Nächstes zu tun ist.
Warum bleiben Agenten manchmal in Schleifen stecken?+
Schleifen treten normalerweise auf, wenn ein Agent nicht erkennen kann, ob ein Schritt erfolgreich war oder fehlgeschlagen ist, sodass er endlos wiederholt. Klare Abbruchbedingungen, Schrittbudgets und eine gute Beobachtung der Tool-Ausgaben verhindern dies, weshalb Orchestrierung und Schutzmechanismen wichtig sind.
Lernen Agenten aus vergangenen Aufgaben?+
Ja, durch Langzeitgedächtnis, das die Ergebnisse früherer Läufe und relevante Kontexte speichert. Dadurch kann ein Agent die Historie eines Kunden abrufen oder einen bewährten Ansatz wiederverwenden, obwohl dies vom erneuten Training des zugrunde liegenden Modells zu unterscheiden ist.

Referenzen

  1. Stanford HAI. „KI-Indexbericht.“ hai.stanford.edu.
  2. MIT Sloan Management Review. „Wie autonome Agenten denken.“ sloanreview.mit.edu.
  3. IBM. „Was sind KI-Agenten?“ ibm.com.
Zurück zum Blog

AUTOMATISIEREN. OPTIMIEREN. DOMINIEREN.

Optimieren Sie Ihre Betriebsabläufe und bieten Sie ein reibungsloses Kundenerlebnis. Unsere Experten implementieren modernste Technologien und optimierte Arbeitsabläufe, damit Sie sich auf Ihre Kernkompetenzen konzentrieren können.