Temperatur und Top-P: Steuerung der Kreativität von KI

Jazmie Jamaludin

Stellen Sie sich zwei Musiker vor, denen die gleichen Anfangsnoten gegeben werden. Der eine spielt auf Nummer sicher, wählt jedes Mal die offensichtlichste nächste Note und produziert etwas Korrektes, aber Vorhersehbares. Der andere geht Risiken ein, greift gelegentlich nach einer überraschenden Note, die das Stück zum Klingen bringt, obwohl sie hin und wieder etwas seltsam klingt. Die meisten KI-Tools verfügen über einen versteckten Regler, der entscheidet, welche Art von Musiker Ihre KI ist, und fast niemand außerhalb technischer Kreise weiß, dass er existiert. Wenn Sie das wissen, gewinnen Sie eine überraschende Kontrolle darüber, ob Ihre KI sicher und zuverlässig oder kühn und erfinderisch klingt.

Dieser Leitfaden entmystifiziert zwei Einstellungen, denen Sie begegnen werden, sobald Sie über grundlegende Chat-Tools hinausgehen: Temperatur und Top-p. Sie klingen einschüchternd und sind normalerweise in erweiterten Menüs versteckt, aber die Ideen dahinter sind wirklich einfach und nützlich. Am Ende werden Sie verstehen, was jeder Regler bewirkt, warum das Erhöhen die Ausgabe kreativer macht und das Verringern sie fokussierter macht, wann man die eine Einstellung der anderen vorzieht und wie man sinnvolle Werte ohne technischen Hintergrund auswählt. Keine Formeln, nur Intuition, die Sie tatsächlich anwenden können.

Warum KI überhaupt einen Kreativitätsregler hat

Um diese Einstellungen zu verstehen, hilft es, eine Sache darüber zu wissen, wie KI Text generiert. Wenn ein Modell schreibt, kennt es nicht einfach das nächste Wort. Stattdessen erzeugt es bei jedem Schritt eine Rangliste möglicher nächster Wörter, jedes mit einer zugehörigen Wahrscheinlichkeit. Das Wort "Wetter" könnte nach "heute das" am wahrscheinlichsten sein, aber "Markt", "Treffen" und "Nachrichten" sind ebenfalls Kandidaten. Wenn Sie eine tiefere Version davon wünschen, erklärt unser Beitrag was große Sprachmodelle sind dies gut.

Die entscheidende Frage ist: Wie wählt das Modell aus dieser Rangliste aus? Wenn immer das wahrscheinlichste Wort gewählt würde, wäre die Ausgabe sicher, aber repetitiv und etwas roboterhaft. Gelegentliches Wählen von niedriger eingestuften Wörtern sorgt für Abwechslung und Überraschung, aber wenn man zu weit unten in der Liste greift, erhält man Unsinn. Temperatur und Top-p sind die beiden Methoden, um genau zu steuern, wie abenteuerlich diese Wahl ist. Sie sind im Grunde die Knöpfe, die das Gleichgewicht zwischen Vorhersagbarkeit und Kreativität einstellen.

KI kennt nicht das nächste Wort; sie wägt die Optionen ab

Jedes Wort wird aus einer Rangliste von Kandidaten ausgewählt. Diese Einstellungen entscheiden, wie weit unten in dieser Liste das Modell bereit ist zu greifen.

Quelle: Wie generative Sprachmodelle Text produzieren

Temperatur: der Kühnheitsregler

Die Temperatur ist die berühmtere der beiden und am einfachsten vorstellbar. Stellen Sie sich sie als eine Kühnheitseinstellung vor, die normalerweise von null bis etwa zwei reicht, wobei eins der gängige Standardwert ist. Eine niedrige Temperatur macht das Modell vorsichtig. Es bevorzugt bei jedem Schritt stark das wahrscheinlichste Wort und erzeugt eine fokussierte, konsistente, etwas konservative Ausgabe. Eine hohe Temperatur gleicht die Unterschiede zwischen den Optionen aus, sodass weniger wahrscheinliche Wörter eine fairere Chance erhalten, was zu vielfältigeren, überraschenderen und manchmal wilderen Texten führt.

Ein hilfreiches mentales Bild: Eine niedrige Temperatur ist der sorgfältige Redakteur, der immer die erwartete Formulierung wählt, während eine hohe Temperatur der Brainstorming-Partner ist, der unerwartete Ideen einbringt, einige brillant, einige seltsam. Ganz unten, nahe null, wird das Modell fast deterministisch und liefert Ihnen bei jeder Anfrage nahezu die gleiche Antwort. Dreht man es hoch, kann derselbe Prompt bei jedem Durchlauf wunderbar unterschiedliche Ergebnisse liefern.

Wie sich niedrig und hoch anfühlen

Bei niedriger Temperatur erhalten Sie bei der Anforderung einer Produktbeschreibung etwas Klares, Genaues und etwas Formelhaftes. Führen Sie es dreimal aus, und die drei Versionen werden fast Zwillinge sein. Bei hoher Temperatur könnte dieselbe Anfrage eine spielerische Version, eine poetische Version und eine skurrile Version ergeben, jede für sich einzigartig. Keine ist im Allgemeinen besser; es hängt ganz davon ab, ob Sie Zuverlässigkeit oder Vielfalt wünschen. Dies ist eine der praktischen Überlegungen hinter besseren KI-Antworten im Allgemeinen.

Top-p: Der "Vertraue der Auswahlliste"-Regler

Top-p, manchmal auch als Kernsampling bezeichnet, verfolgt dasselbe Ziel aus einem anderen Blickwinkel. Anstatt anzupassen, wie mutig das Modell die gesamte Liste behandelt, entscheidet Top-p, wie viel von der Liste überhaupt berücksichtigt werden soll. Es funktioniert, indem es nur die wahrscheinlichsten Wörter behält, deren Wahrscheinlichkeiten sich zu einem gewählten Prozentsatz summieren, und dann aus dieser Auswahlliste wählt.

Angenommen, Top-p ist auf neunzig Prozent eingestellt. Das Modell sammelt die Top-Kandidaten, bis deren kombinierte Wahrscheinlichkeit neunzig Prozent erreicht, verwirft den langen Schwanz unwahrscheinlicher Wörter vollständig und wählt aus dem Verbleibenden. Ein niedriges Top-p, zum Beispiel 0,3, behält nur eine winzige, sehr wahrscheinliche Auswahlliste bei, was zu einer sicheren und fokussierten Ausgabe führt. Ein hohes Top-p nahe eins behält fast alles bei und ermöglicht abenteuerlichere Entscheidungen. Das Clevere daran ist, dass sich die Auswahlliste selbst anpasst: Wenn das Modell sehr sicher ist, ist die Liste kurz; wenn es unsicher ist, wächst die Liste. Das macht Top-p zu einer etwas adaptiveren Methode zur Steuerung der Vielfalt.

Einstellungen auf einen Blick: Was zu erwarten ist
Einstellung	Niedriger Wert	Hoher Wert
Temperatur	Fokussiert, konsistent, vorhersagbar	Vielfältig, kreativ, gelegentlich merkwürdig
Top-p	Sichere Auswahlliste wahrscheinlicher Wörter	Größerer Pool, mehr Überraschung
Am besten für niedrig	Fakten, Code, Datenextraktion	Zuverlässige, wiederholbare Antworten
Am besten für hoch	Brainstorming, Marketingtexte	Frische, vielfältige kreative Ergebnisse

Sollte man beide gleichzeitig ändern?

Hier ist der praktische Ratschlag, der viel Verwirrung erspart: Wählen Sie einen Regler aus und lassen Sie den anderen auf seiner Standardeinstellung. Da sowohl Temperatur als auch Top-p die Zufälligkeit steuern, führt das gleichzeitige Erhöhen beider zu einer Verstärkung des Effekts und kann die Ausgabe in Inkohärenz abgleiten lassen. Die meisten erfahrenen Benutzer passen die Temperatur an und lassen Top-p in Ruhe, oder gelegentlich umgekehrt, aber selten beides zusammen. Wenn Sie sich nichts anderes merken, merken Sie sich, jeweils nur eine Einstellung zu ändern und das Ergebnis zu beobachten, bevor Sie etwas anderes anfassen.

Wenn Sie experimentieren, gehen Sie in kleinen Schritten vor. Der Unterschied zwischen einer Temperatur von 0,7 und 0,9 ist bedeutsam; direkt von 0,2 auf 1,8 zu springen, sagt Ihnen wenig, außer dass das eine Extrem langweilig und das andere chaotisch ist. Behandeln Sie es wie Würze: eine Prise nach der anderen, bis der Geschmack stimmt.

Sinnvolle Ausgangspunkte

Sie müssen sich keine Zahlen merken, aber ein paar grobe Richtwerte helfen. Für Aufgaben, bei denen Genauigkeit und Konsistenz am wichtigsten sind, wie das Zusammenfassen eines Dokuments, das Extrahieren von Zahlen, das Beantworten von Sachfragen oder alles, was Sie wiederverwenden werden, neigen Sie zu niedrigen Werten: eine Temperatur um 0,2 bis 0,4. Für ausgewogenes alltägliches Schreiben, wie E-Mails, Erklärungen und allgemeine Entwürfe, funktioniert der Standardwert von etwa 0,7 gut. Für wirklich kreative Arbeiten, wie das Brainstorming von Namen, das Schreiben spielerischer Texte oder das Generieren vieler verschiedener Optionen, gehen Sie höher, vielleicht 0,9 bis 1,2.

Dies sind Ausgangspunkte, keine Regeln. Der richtige Wert hängt von Ihrer Aufgabe und Ihrem Geschmack ab, und die einzige zuverlässige Methode ist, eine Einstellung auszuprobieren, die Ausgabe zu lesen und anzupassen. Die gute Nachricht ist, dass diese Art der Feinabstimmung schnell intuitiv wird. Nach ein paar Experimenten werden Sie instinktiv wissen, ob eine Aufgabe eine ruhige Hand oder ein bisschen Flair erfordert. Es ist auch wichtig zu wissen, welches Modell Sie verwenden, da die Standardwerte und das Verhalten variieren, was Teil der Wahl des richtigen KI-Modells ist.

Stellen Sie jeweils nur einen Regler ein

Temperatur und Top-p steuern beide die Zufälligkeit, daher führt das gleichzeitige Ändern beider zu einer Verstärkung des Effekts und birgt das Risiko einer inkohärenten Ausgabe. Stellen Sie den einen ein, beobachten Sie, und entscheiden Sie dann.

Quelle: Allgemeine Dokumentation von KI-Anbietern

Wo Sie diese Regler tatsächlich finden werden

Wenn Sie nur einen einfachen Chat-Assistenten verwenden, sehen Sie diese Einstellungen möglicherweise nie, und das ist in Ordnung. Sie werden sichtbar, sobald Sie erweiterte Schnittstellen, Entwickler-Playgrounds oder Tools verwenden, die KI mit Ihren eigenen Systemen verbinden. Sie sind auch in automatisierten Workflows von großer Bedeutung, wo Sie eine vorhersehbare statt einer überraschenden Ausgabe wünschen. Wenn Sie in diese Richtung gehen, beleuchten unser Leitfaden zum Aufbau Ihres ersten KI-Agenten und unser Artikel über KI-Tools für Unternehmen, warum Konsistenz oft Kreativität übertrifft, sobald eine Aufgabe ohne menschliche Aufsicht abläuft.

Für anspruchsvollere Prompting-Arbeiten ergänzen diese Regler die Techniken in unserem Leitfaden zu fortgeschrittenen Prompting-Techniken. Ein cleverer Prompt gibt die Richtung vor; Temperatur und Top-p bestimmen die Stimmung. Zusammen geben sie Ihnen eine viel feinere Kontrolle als die Prompt-Formulierung allein.

Ein paar ehrliche Warnungen

Erstens: Höhere Kreativität ist nicht umsonst. Wenn Sie die Regler höher stellen, wird die Ausgabe weniger vorhersehbar, was für Brainstorming wunderbar ist, aber für alles, was genau sein muss, riskant. Eine hohe Einstellung kann dazu führen, dass ein Modell eher zu erfundenen Details neigt, halten Sie die Einstellungen also für sachliche Arbeiten niedrig. Zweitens: Diese Einstellungen beeinflussen die Vielfalt, nicht die Intelligenz. Eine hohe Temperatur macht das Modell nicht intelligenter; es macht es nur weniger repetitiv. Wenn eine Antwort bei niedriger Temperatur falsch ist, wird sie durch Erhöhen nicht richtig, sondern nur bunter falsch.

Denken Sie schließlich daran, dass Standardeinstellungen einen Grund haben. Die Standardeinstellungen der meisten Tools sind so gewählt, dass sie für eine Vielzahl von Alltagsaufgaben geeignet sind, sodass Sie wirklich nicht daran herumspielen müssen, es sei denn, die Ausgabe fühlt sich zu starr oder zu zufällig an. Betrachten Sie diese Regler als Verfeinerung, nicht als lästige Pflicht. Sie sind da, wenn Sie sie wollen, und unaufdringlich sinnvoll, wenn Sie sie nicht brauchen. Wenn Sie Unterstützung bei der Konfiguration von KI-Tools für zuverlässige Ergebnisse in Ihrem Unternehmen wünschen, können Sie uns gerne kontaktieren.

Häufig gestellte Fragen

Was ist der Unterschied zwischen Temperatur und Top-p?+

Beide steuern, wie vielfältig die KI-Ausgabe ist, aber auf unterschiedliche Weise. Die Temperatur passt an, wie mutig das Modell seine Rangliste der Optionen für das nächste Wort behandelt. Top-p hingegen kürzt diese Liste auf die wahrscheinlichsten Wörter, die zusammen eine gewählte Wahrscheinlichkeit erreichen, und wählt dann aus der Auswahlliste. In der Praxis haben sie eine ähnliche Wirkung, sodass die meisten Leute nur eine anpassen.

Soll ich Temperatur oder Top-p ändern?+

Wählen Sie eine aus und lassen Sie die andere auf ihrer Standardeinstellung. Da beide die Zufälligkeit steuern, kann das gleichzeitige Erhöhen beider zu einer inkohärenten Ausgabe führen. Die meisten Benutzer passen die Temperatur an und lassen Top-p in Ruhe. Gehen Sie in kleinen Schritten vor und lesen Sie die Ergebnisse, bevor Sie etwas anderes ändern.

Welche Temperatur sollte ich verwenden?+

Als grober Anhaltspunkt: Verwenden Sie einen niedrigen Wert von etwa 0,2 bis 0,4 für sachliche oder wiederholbare Aufgaben, den Standardwert von etwa 0,7 für alltägliche Texte und einen höheren Wert von etwa 0,9 bis 1,2 für kreatives Brainstorming. Dies sind Ausgangspunkte; der beste Ansatz ist, einen auszuprobieren und nach Belieben anzupassen.

Macht eine höhere Temperatur die KI intelligenter?+

Nein. Sie verändert die Vielfalt, nicht die Intelligenz. Eine höhere Einstellung macht die Antworten weniger repetitiv und abenteuerlicher, aber sie korrigiert keine falsche Antwort, sondern macht sie nur bunter falsch. Sie kann auch die Wahrscheinlichkeit von erfundenen Details erhöhen, halten Sie die Einstellungen also niedrig, wann immer es auf Genauigkeit ankommt.

Referenzen

OpenAI. "Dokumentation zu Temperatur und Top-p-Sampling." platform.openai.com.
Google Cloud. "Kontrolle der Modellausgabe und der Sampling-Parameter." cloud.google.com.
IBM. "Was ist Nucleus Sampling (Top-p)?" ibm.com.

Zurück zum Blog

Artikel wurde in den Warenkorb gelegt

Temperatur und Top-P: Steuerung der Kreativität von KI

Warum KI überhaupt einen Kreativitätsregler hat

Temperatur: der Kühnheitsregler

Wie sich niedrig und hoch anfühlen

Top-p: Der "Vertraue der Auswahlliste"-Regler

Sollte man beide gleichzeitig ändern?

Sinnvolle Ausgangspunkte

Wo Sie diese Regler tatsächlich finden werden

Ein paar ehrliche Warnungen

Häufig gestellte Fragen

Referenzen

AUTOMATISIEREN. OPTIMIEREN. DOMINIEREN.

Land/Region

Sprache

Warum KI überhaupt einen Kreativitätsregler hat

Temperatur: der Kühnheitsregler

Wie sich niedrig und hoch anfühlen

Top-p: Der "Vertraue der Auswahlliste"-Regler

Sollte man beide gleichzeitig ändern?

Sinnvolle Ausgangspunkte

Wo Sie diese Regler tatsächlich finden werden

Ein paar ehrliche Warnungen

Häufig gestellte Fragen

Referenzen

AUTOMATISIEREN. OPTIMIEREN. DOMINIEREN.