Chain-of-Thought Prompting: KI beim Denken unterstützen

Jazmie Jamaludin

Denken Sie an den Mathematikunterricht in der Schule. Ein Lehrer gibt Ihnen eine Textaufgabe, und es gibt zwei Wege, sie zu beantworten. Sie können die erste Zahl herausplatzen lassen, die Ihnen in den Sinn kommt, oder Sie können Ihre Arbeit Zeile für Zeile aufschreiben und jeden Schritt überprüfen, bevor Sie zu einem Ergebnis kommen. Fast jeder bekommt mit dem zweiten Ansatz mehr Antworten richtig, nicht weil er schlauer ist, sondern weil das Verlangsamen und schrittweise Nachdenken Fehler aufdeckt, die ein schnelles Urteil übersehen würde. Es stellt sich heraus, dass künstliche Intelligenz sich auf frappierend ähnliche Weise verhält, und diese einfache Erkenntnis hat einen Namen.

Dieser Leitfaden erklärt Chain-of-Thought-Prompting, eine der unscheinbarsten, aber mächtigsten Techniken, um bessere Antworten von der KI bei allem zu erhalten, was echtes Denken erfordert. Wir werden die technischen Details gänzlich meiden. Am Ende werden Sie verstehen, was Chain-of-Thought ist, warum das Anstoßen eines Modells, "seine Arbeit zu zeigen", es merklich zuverlässiger macht, wann genau die Technik hilft und wann sie übertrieben ist, und wie Sie sie selbst in einfachen Alltagsanfragen anwenden können. Kein Coding, kein Mathematikstudium, nur eine praktische Fähigkeit, die Sie sofort einsetzen können.

Das Problem, das Chain-of-Thought löst

Moderne KI-Modelle sind bemerkenswert gut darin, flüssige, selbstbewusst klingende Texte zu produzieren. Gerade diese Flüssigkeit ist auch ihre Schwäche. Stellen Sie einem Modell eine Frage, die mehrere Denkschritte erfordert, und wenn es einfach zu einer Antwort springt, wird es oft etwas Falsches mit der gleichen ruhigen Zuversicht behaupten, die es für richtige Dinge verwendet. Die Antwort klingt richtig, was den Fehler geradezu gefährlich macht.

Der Grund dafür liegt in der Art und Weise, wie diese Systeme Text generieren. Sie produzieren einen Teil einer Antwort nach dem anderen und prognostizieren, was als Nächstes kommen sollte, basierend auf allem, was bisher geschrieben wurde. Wenn die endgültige Antwort zuerst kommt, hat sich das Modell keinen Raum gegeben, um zu dieser zu argumentieren. Wenn Sie ein vollständigeres Bild davon möchten, wie dieser Vorhersageprozess funktioniert, legt unser Erklärer zu Was sind große Sprachmodelle die Grundlagen. Die Kurzfassung: Wenn ein Modell sich zu früh auf eine Schlussfolgerung festlegt, rät es im Wesentlichen, und Ratschläge bei mehrstufigen Problemen sind oft falsch.

Lautes Nachdenken schlägt instinktives Antworten
Ein Modell dazu anzuregen, die Schritte durchzugehen, bevor es antwortet, verbessert die Genauigkeit bei mehrstufigen Problemen konstant.
Quelle: Veröffentlichte Forschung zu großen Sprachmodellen

Was Chain-of-Thought-Prompting eigentlich ist

Chain-of-Thought-Prompting ist im Kern nichts anderes, als das Modell zu bitten, seine Argumentation darzulegen, bevor es eine endgültige Antwort gibt. Anstatt "Wie hoch sind die Gesamtkosten?" schreiben Sie "Gehen Sie dies Schritt für Schritt durch und nennen Sie dann die Gesamtkosten." Diese wenigen zusätzlichen Worte ändern das Verhalten des Modells vollständig. Es erzählt nun seine Denkweise, betrachtet jeden Teil des Problems der Reihe nach und legt sich erst dann auf eine Schlussfolgerung fest, genau wie ein Schüler, der seine Rechenschritte zeigt.

Der Satz, den Sie am häufigsten sehen werden, ist eine Version von "Lasst uns Schritt für Schritt denken." Es klingt fast zu einfach, um wichtig zu sein, doch diese kleine Anweisung verbessert zuverlässig die Ergebnisse bei Problemen, die Arithmetik, Logik, Planung oder alles mit mehreren beweglichen Teilen betreffen. Das Modell war schon immer zu dieser Art von Argumentation fähig; die Anweisung gibt ihm einfach die Erlaubnis und den Raum, dies laut zu tun, anstatt zur Ziellinie zu eilen.

Warum das Aufschreiben der Schritte der Maschine hilft

Hier ist der Teil, der sich kontraintuitiv anfühlt. Wenn ein Modell seine Argumentation aufschreibt, wird jeder produzierte Schritt Teil des Kontexts für den nächsten Schritt. Im Grunde baut das Modell ein Gerüst seines eigenen Denkens auf und nutzt es dann, um zur Antwort zu gelangen. Frühe Schritte verankern spätere. Eine halbfertige Rechnung auf dem Blatt macht die nächste Zeile viel einfacher richtig zu bekommen, als die ganze Antwort aus dem Nichts zu ziehen. Die schriftliche Argumentation ist keine Dekoration; sie ist das Arbeitsgedächtnis, das das Modell verwendet, um auf Kurs zu bleiben.

Dies ist auch der Grund, warum Chain-of-Thought gut zu den Techniken in unserem Leitfaden zu fortgeschrittenen Prompting-Techniken passt. Es ist einer der grundlegenden Schritte, auf denen aufwendigere Methoden aufbauen, und es passt besonders gut zum beispielbasierten Ansatz, der in unseren Grundlagen des Prompt-Engineerings behandelt wird.

Wann man es anwendet und wann nicht

Chain-of-Thought ist keine Zauberformel, die man auf jede Aufforderung streuen kann. Es bewährt sich bei Aufgaben, die tatsächlich Denkprozesse erfordern, und fügt anderswo unnötigen Ballast hinzu. Die folgende Tabelle skizziert den Unterschied.

Wo Chain-of-Thought am meisten hilft
Aufgabentyp Chain-of-Thought verwenden? Warum
Mehrstufige Mathematik oder Logik Ja, unbedingt Jeder Schritt reduziert die Fehlerwahrscheinlichkeit
Planung und Entscheidungen Ja Erzwingt offene Abwägung von Kompromissen
Problemdiagnose Ja Legt die Logik offen, damit Sie sie überprüfen können
Einfache Suchanfragen Nein Fügt Worte hinzu, ohne die Antwort zu verbessern
Kreativer Entwurf Meistens nein Argumentation kann den natürlichen Fluss hemmen

Die Faustregel ist einfach: Wenn ein nachdenklicher Mensch innehalten und das Problem durchdenken müsste, wird Chain-of-Thought wahrscheinlich auch der KI helfen. Wenn ein Mensch sofort ohne Nachdenken antworten würde, verlangsamt die zusätzliche Argumentation die Dinge nur und verlängert die Antwort ohne Nutzen.

Wie man es in einfacher Sprache anwendet

Sie benötigen keine spezielle Syntax. Ein paar natürliche Sätze genügen. "Denken Sie dies Schritt für Schritt durch, bevor Sie antworten." "Führen Sie mich durch Ihre Argumentation und geben Sie dann Ihre Empfehlung." "Erklären Sie, wie Sie dazu gekommen sind." All dies signalisiert dem Modell, dass Sie die Arbeit sehen möchten, nicht nur das Urteil.

Eine besonders nützliche Variante ist, nach der Begründung und einer klar getrennten endgültigen Antwort zu fragen. So etwas wie: "Begründen Sie es zuerst, dann geben Sie Ihre endgültige Antwort in einer neuen Zeile, beginnend mit 'Antwort:'." Dies bietet Ihnen das Beste aus beiden Welten: Sie können die Schlussfolgerung schnell überfliegen und haben dennoch die Begründung zur Überprüfung, falls etwas nicht stimmt. Und die Überprüfung ist der eigentliche Gewinn. Wenn das Modell seine Arbeit zeigt, können Sie genau den Schritt erkennen, an dem es falsch lag, anstatt eine falsche Antwort ohne Möglichkeit zu erhalten, den Grund zu sehen.

Ein ausgearbeitetes Beispiel

Angenommen, Sie fragen: „Ein Abonnement kostet eine feste monatliche Gebühr plus eine Gebühr pro Platz. Wenn ein Team von sechs Personen einen bestimmten Betrag zahlt und ein Team von zehn Personen mehr zahlt, wie viel würde ein Team von fünfzehn Personen zahlen?“ Wenn man es unverblümt fragt, könnte ein Modell eine plausibel klingende und stillschweigend falsche Zahl ausgeben. Wenn man es bittet, „Schritt für Schritt durchzuarbeiten“, wird es typischerweise die feste Gebühr von der Gebühr pro Platz trennen, jede berechnen und sie dann kombinieren, wobei es jede Zahl auf dem Weg zeigt. Sie können der Logik viel besser folgen und dem Ergebnis mehr vertrauen, weil Sie sehen können, dass es begründet und nicht geraten wurde.

Angezeigte Arbeit bedeutet auffindbare Fehler
Wenn das Modell laut denkt, können Sie den genauen Schritt identifizieren, der schiefgegangen ist, anstatt einer Black-Box-Antwort zu vertrauen.
Quelle: Gängige Praxis in der KI-Evaluierung

Chain-of-Thought und der Aufstieg von Reasoning-Modellen

Lange Zeit musste man Chain-of-Thought anfordern. Zunehmend wird es direkt in eine neue Klasse von KI integriert. Sogenannte Reasoning-Modelle sind darauf trainiert, dieses interne Schritt-für-Schritt-Denken automatisch durchzuführen, bevor sie antworten, ohne dass Sie darum bitten müssen. Sie führen im Wesentlichen ihre eigene Chain-of-Thought hinter den Kulissen aus, weshalb sie dazu neigen, bei schwierigen Problemen besser abzuschneiden, aber auch länger brauchen und mehr Kosten verursachen.

Dieser Wandel macht die Technik für alltägliche Nutzer von Standardmodellen nicht obsolet. Er bedeutet lediglich, dass die Idee so wertvoll war, dass sie in die Werkzeuge selbst integriert wird. Das Verständnis des Prinzips hilft Ihnen, beide Arten von Modellen klug zu nutzen, und es fließt direkt in die praktische Frage der Wahl des richtigen KI-Modells für eine bestimmte Aufgabe ein. Diese Schritt-für-Schritt-Fähigkeit ist auch wichtig, wenn KI eigenständig echte Arbeit leisten soll, wie beim Erstellen Ihres ersten KI-Agenten, wo fundiertes Denken den Unterschied zwischen einem hilfreichen Assistenten und einer selbstbewussten Belastung ausmacht.

Grenzen und ehrliche Vorbehalte

Chain-of-Thought ist mächtig, aber keine Wahrheitsgarantie. Ein Modell kann eine sauber aussehende Argumentationskette produzieren, die intern konsistent ist, aber auf einer falschen Prämisse beruht und selbstbewusst zu einem falschen Ergebnis kommt. Die sichtbare Argumentation erleichtert das Erkennen von Fehlern, aber nur, wenn man sie tatsächlich liest. Betrachten Sie die Arbeit als etwas zu Überprüfendes, nicht als Beweis dafür, dass die Antwort korrekt sein muss.

Hinzu kommen die Aspekte Kosten und Geschwindigkeit. Das Anfordern von Begründungen führt zu längeren Antworten, was mehr Zeit und bei kostenpflichtigen Tools mehr Geld kostet. Für eine einmalige Frage ist dies trivial; bei Tausenden von automatisierten Anfragen summiert es sich. Wenden Sie die Technik also dort an, wo die Begründung wirklich wichtig ist, und lassen Sie sie weg, wo sie es nicht ist. Die Wahl des richtigen Tools insgesamt ist Teil eines umfassenderen Bewertungsprozesses, und unser Leitfaden zu KI-Tools für Unternehmen kann Ihnen helfen, diese Kompromisse abzuwägen.

Es in die Tat umsetzen

Die Schönheit von Chain-of-Thought liegt darin, wie wenig es von Ihnen verlangt. Es gibt keine Einrichtung, keine Software, keinen Fachjargon zum Auswendiglernen. Sie fügen einfach eine kurze Anweisung hinzu, die das Modell einlädt, nachzudenken, bevor es spricht, und bei der richtigen Art von Problem erhalten Sie eine merklich zuverlässigere, transparentere Antwort. Es ist eine jener seltenen Techniken, bei denen das Verständnis, warum sie funktioniert, dass die Argumentation Raum zur Entfaltung braucht, Sie sofort besser in ihrer Anwendung macht.

Fangen Sie klein an. Wenn Sie das nächste Mal eine KI etwas fragen, das mehr als einen Schritt erfordert, fügen Sie hinzu: "Denken Sie es zuerst Schritt für Schritt durch." Lesen Sie die Argumentation, überprüfen Sie die Schritte und bemerken Sie, wie viel mehr Sie dem Ergebnis vertrauen. Sobald dies zur Gewohnheit wird, werden Sie es automatisch anwenden, wann immer eine Frage etwas Gewicht hat. Wenn Sie Hilfe beim Entwerfen zuverlässiger KI-Workflows für Ihr Team benötigen, können Sie uns gerne kontaktieren.

Häufig gestellte Fragen

Was ist Chain-of-Thought-Prompting in einfachen Worten?+
Es ist einfach die Aufforderung an eine KI, ihre Arbeitsweise zu zeigen, bevor sie eine endgültige Antwort gibt. Anstatt ein schnelles Urteil zu verlangen, fordern Sie das Modell auf, Schritt für Schritt zu argumentieren. Dieser zusätzliche Denkraum verbessert die Genauigkeit bei Problemen, die mehrere Phasen haben, ähnlich wie das Aufschreiben Ihrer Schritte einer Person hilft, Flüchtigkeitsfehler zu vermeiden.
Funktioniert es bei jeder Art von Frage?+
Nein. Es hilft am meisten bei mehrstufigen Denkprozessen, Planung, Logik und Diagnose. Bei einfachen Suchanfragen oder kreativem Schreiben verlängert es die Antwort in der Regel, ohne die Qualität zu verbessern, und kann sogar den natürlichen Fluss stören. Ein guter Test: Wenn eine sorgfältige Person innehalten und nachdenken müsste, hilft die Technik wahrscheinlich.
Garantiert das Zeigen der Begründung eine korrekte Antwort?+
Nein. Ein Modell kann eine kohärent aussehende Argumentation schreiben, die jedoch auf einer falschen Annahme beruht und zu einem selbstbewussten, aber falschen Ergebnis führt. Der Vorteil ist Transparenz: Die sichtbare Arbeitsweise ermöglicht es Ihnen, zu erkennen, wo es schiefgelaufen ist. Lesen Sie die Argumentation immer durch, anstatt sie als Beweis für die Richtigkeit der Antwort zu betrachten.
Worin unterscheidet sich dies von einem Reasoning-Modell?+
Bei einem Standardmodell fordern Sie die Schritt-für-Schritt-Denkweise selbst über Ihren Prompt an. Reasoning-Modelle sind darauf trainiert, diese interne Arbeit automatisch vor der Beantwortung zu leisten. Sie führen im Wesentlichen ihre eigene Chain-of-Thought hinter den Kulissen aus, was die Leistung bei schwierigen Problemen verbessert, aber tendenziell langsamer und kostspieliger ist.

Referenzen

  1. Google Research. "Chain-of-thought prompting in large language models." research.google.
  2. Stanford HAI. "AI Index Report on model reasoning." hai.stanford.edu.
  3. IBM. "What is chain-of-thought prompting?" ibm.com.
Zurück zum Blog

AUTOMATISIEREN. OPTIMIEREN. DOMINIEREN.

Optimieren Sie Ihre Betriebsabläufe und bieten Sie ein reibungsloses Kundenerlebnis. Unsere Experten implementieren modernste Technologien und optimierte Arbeitsabläufe, damit Sie sich auf Ihre Kernkompetenzen konzentrieren können.