Warum KI-Modelle „halluzinieren“ (und wie man es reduzieren kann)

Jazmie Jamaludin

Eines der verwirrendsten Dinge an modernen KI-Assistenten ist, wie selbstbewusst sie falsch liegen können. Fragt man ein Modell nach einer Tatsache, wird es oft flüssig und autoritär antworten, mit Details, die sich genau richtig anhören, selbst wenn die Antwort einfach erfunden ist. Dieses Verhalten hat in der Branche einen Namen: Halluzination. Für ein Unternehmen, das sich auf diese Tools verlässt, ist das Verständnis, warum dies geschieht, keine akademische Übung. Es ist der Unterschied zwischen einer sicheren Nutzung von KI und der Überraschung durch eine selbstbewusste Falschaussage im denkbar ungünstigsten Moment.

Die gute Nachricht ist, dass Halluzinationen keine zufälligen Gremlins oder Anzeichen dafür sind, dass ein bestimmtes Tool defekt ist. Sie sind eine vorhersagbare Nebenwirkung der Funktionsweise dieser Systeme, und sobald man den Mechanismus verstanden hat, kann man sinnvolle Schutzmaßnahmen ergreifen. Dieser Artikel erklärt in verständlicher Sprache, was eine Halluzination ist, warum selbst die besten Modelle sie produzieren, wo das Risiko für Unternehmen am höchsten ist und welche praktischen Schritte unternommen werden können, um Schäden zu vermeiden.

Was eine Halluzination tatsächlich ist

Im Alltag ist eine KI-Halluzination, wenn ein Modell Informationen erzeugt, die falsch, erfunden oder unbegründet sind, aber so präsentiert werden, als wären sie wahr. Es könnte eine Statistik erfinden, eine Studie zitieren, die nicht existiert, eine Produktfunktion beschreiben, die nie gebaut wurde, oder ein Datum oder einen Namen selbstbewusst falsch angeben. Das entscheidende Merkmal ist nicht nur, dass die Antwort falsch ist, sondern dass das Modell keinerlei Unsicherheit signalisiert. Es klingt bei einer Erfindung genauso sicher wie bei einer bekannten Tatsache.

Es ist hilfreich zu wissen, dass diese Systeme, die großen Sprachmodelle hinter den meisten KI-Assistenten, nicht dazu gebaut wurden, Fakten aus einer Datenbank abzurufen. Sie wurden dazu gebaut, plausible Texte vorherzusagen. Für weitere Informationen zur Funktionsweise haben wir einen erklärenden Artikel über große Sprachmodelle. Kurz gesagt, das Modell hat aus riesigen Textmengen gelernt, welche Wörter auf überzeugende Weise anderen Wörtern folgen. Meistens führt die Erstellung überzeugender Texte auch zu genauen Texten, da die Wahrheit in seinen Trainingsdaten gut repräsentiert ist. Aber die Kernkompetenz des Modells ist die Plausibilität, nicht die Wahrheit, und wenn diese beiden Dinge auseinandergehen, entsteht eine Halluzination.

Selbstbewusst, nicht korrekt
Der Ton der Sicherheit eines Modells spiegelt wider, wie flüssig die Formulierung ist, nicht wie wahr die Behauptung ist.
Quelle: Stanford HAI

Warum selbst die besten Modelle dies tun

Es ist verlockend anzunehmen, dass Halluzinationen lediglich ein Fehler schwächerer Tools sind und die fortschrittlichsten Modelle das Problem gelöst haben. Sie haben es erheblich reduziert, aber nicht eliminiert, und die Gründe liegen im Ansatz selbst. Mehrere Faktoren wirken zusammen, um erfundene Antworten zu erzeugen.

Das Modell füllt Lücken

Wenn Sie nach etwas fragen, zu dem das Modell kaum oder keine zuverlässigen Informationen hat, sagt es standardmäßig nicht „Ich weiß es nicht“. Sein Training drängt es dazu, eine flüssige, vollständig klingende Antwort zu geben. Angesichts einer Lücke füllt es diese Lücke mit dem, was angesichts des Fragenmusters am plausibelsten ist. Eine Anfrage nach einer obskuren Statistik oder einem Nischendetail ist daher ein Hauptkandidat für eine Erfindung, da das Modell lieber überzeugend rät, als Unwissenheit zuzugeben, es sei denn, es wurde ausdrücklich dazu ermutigt.

Trainingsdaten haben einen Stichtag und können falsch sein

Jedes Modell wird mit Daten bis zu einem bestimmten Zeitpunkt trainiert, danach weiß es nichts Neues mehr, es sei denn, es erhält neue Informationen. Fragen Sie nach Ereignissen nach diesem Stichtag, und es kann selbstbewusst eine Antwort erfinden. Seine Trainingsdaten können auch Fehler, veraltete Fakten und Widersprüche enthalten, und das Modell hat keine eingebaute Möglichkeit zu wissen, welche Quellen zuverlässig waren. Es hat das Gute und das Schlechte zusammen aufgenommen.

Details sind schwieriger als Allgemeinheiten

Modelle sind im Allgemeinen zuverlässiger bei breitem, etabliertem Wissen als bei präzisen Details wie genauen Zahlen, Zitaten, Daten, Namen und Quellenangaben. Ein präzises Detail hat nur einen korrekten Wert und unzählige plausible, aber falsche Alternativen, so dass die Fehlerwahrscheinlichkeit stark ansteigt. Aus diesem Grund gehören erfundene Referenzen und erfundene Zahlen zu den häufigsten und gefährlichsten Formen der Halluzination.

Wo das Halluzinationsrisiko höher vs. niedriger ist
Höheres Risiko Niedrigeres Risiko
Genaue Statistiken und Zitate Erklärung eines bekannten Konzepts
Aktuelle Ereignisse nach dem Stichtag Zusammenfassung des von Ihnen bereitgestellten Textes
Nischen- oder obskure Details Inhalt umschreiben oder neu formatieren
Fragen mit einer falschen Prämisse Brainstorming und Ideenentwicklung

Wo dies für Ihr Unternehmen wichtig ist

Nicht jede Halluzination ist eine Krise. Wenn ein Modell ein kleines Detail erfindet, während es Ihnen beim Brainstorming von Slogans hilft, sind die Kosten im Wesentlichen Null, da Sie die Ausgabe ohnehin auswählen und bearbeiten werden. Das Risiko skaliert mit der direkten Reichweite der Ausgabe zu einem Kunden oder einer Entscheidung ohne menschliche Überprüfung und mit dem Ausmaß des Schadens, den eine falsche Antwort verursachen könnte.

Die Gefahrenzonen sind klar. Ein kundenorientierter Chatbot, der eine Rückerstattungsrichtlinie, eine Produktfunktion oder ein Lieferversprechen erfindet, kann eine echte Haftung schaffen und das Vertrauen untergraben. Ein KI-Assistent, der rechtliche, finanzielle oder medizinisch verwandte Inhalte entwirft, kann selbstbewusste Fehler mit schwerwiegenden Folgen produzieren. Eine Forschungszusammenfassung, die eine Statistik erfindet, kann eine strategische Entscheidung leise vergiften. In jedem Fall ist das Problem dasselbe: Eine Ausgabe, die autoritär klingt, wird ohne Überprüfung vertraut.

Überprüfen Sie die hochriskanten 5 %
Die meisten KI-Outputs sind risikoarm, aber der geringe Anteil, der Kunden erreicht oder Entscheidungen beeinflusst, verdient eine menschliche Überprüfung.
Quelle: Anthropic

Praktische Wege zur Reduzierung von Halluzinationen

Sie können Halluzinationen nicht unmöglich machen, aber Sie können sie weitaus seltener und weitaus weniger schädlich machen. Die folgenden Maßnahmen sind für jedes Unternehmen gut umsetzbar, und die meisten erfordern keinerlei technische Entwicklung.

Das Modell in Ihren eigenen Informationen verankern

Die effektivste Technik ist, dem Modell das relevante Ausgangsmaterial zu geben und es zu bitten, nur aus diesem zu antworten. Wenn ein Modell ein von Ihnen bereitgestelltes Dokument zusammenfasst, sinkt das Risiko von Erfindungen drastisch, da es mit echtem Text und nicht aus seinem Gedächtnis arbeitet. Es gibt eine formale Version dieses Ansatzes, oft als Retrieval-Augmented Generation bezeichnet, bei der ein System Ihre vertrauenswürdigen Dokumente automatisch abruft, bevor es antwortet. Unser Leitfaden zu Fine-Tuning versus RAG erklärt, wie dies funktioniert und wann sich die Implementierung lohnt.

Nach Quellen und Unsicherheiten fragen

Sie können ein Modell anweisen, anzugeben, woher seine Informationen stammen, und klar zu sagen, wann es unsicher ist oder keine Informationen zur Beantwortung hat. Dies garantiert keine Ehrlichkeit, da ein Modell auch eine Quelle erfinden kann, aber es verändert das Verhalten auf nützliche Weise. Ein Modell, das angewiesen ist, Unsicherheiten zu kennzeichnen, wird eher eine Lücke zugeben, als sie zu vertuschen, und das Anfordern von Quellen gibt Ihnen etwas Konkretes zur Überprüfung.

Einen Menschen bei wichtigen Dingen einbeziehen

Jede Ausgabe, die einen Kunden erreicht oder eine reale Entscheidung beeinflusst, sollte von einer Person überprüft werden, bevor sie veröffentlicht wird. Dies ist kein Zeichen dafür, dass die Technologie versagt hat. Es ist einfach gute Praxis, genauso wie Sie eine wichtige E-Mail, die ein Junior-Mitarbeiter entworfen hat, Korrektur lesen würden. Ziel ist es, die KI die Hauptarbeit leisten zu lassen, während ein Mensch den seltenen, aber kostspieligen Fehler abfängt.

Details eigenständig verifizieren

Behandeln Sie jede präzise Zahl, jedes Zitat, jedes Datum oder jede Referenz, die ein Modell erstellt, als eine zu überprüfende Behauptung und nicht als eine zu vertrauende Tatsache. Wenn Ihnen ein Modell eine Statistik für einen Bericht liefert, suchen Sie selbst die Originalquelle. Wenn es eine Studie zitiert, bestätigen Sie, dass die Studie existiert. Allein diese Gewohnheit verhindert, dass die meisten schädlichen Halluzinationen Ihr Unternehmen jemals verlassen.

Tools und Einstellungen wählen, die helfen

Das von Ihnen gewählte Modell und dessen Konfiguration beeinflussen, wie oft Sie auf erfundene Antworten stoßen. Leistungsfähigere Modelle und Modi, die darauf ausgelegt sind, sorgfältig zu argumentieren oder nach aktuellen Informationen zu suchen, bevor sie antworten, neigen dazu, bei sachlichen Fragen weniger zu halluzinieren. Viele Anbieter bieten inzwischen die Möglichkeit, dass der Assistent aktuelle Informationen nachschlägt, anstatt sich ausschließlich auf sein Training zu verlassen, was das Abschneideproblem direkt angeht. Wenn Sie sich entscheiden müssen, welches Modell Sie standardisieren möchten, behandelt unser Leitfaden zur Auswahl des richtigen KI-Modells, wie Zuverlässigkeit in diese Entscheidung einfließt.

Es ist auch erwähnenswert, dass unabhängige Evaluierungen die sachliche Genauigkeit und das logische Denken über Modelle hinweg verfolgen, und diese werden offen auf Bestenlisten wie Artificial Analysis und LMArena veröffentlicht. Diese können Ihnen ein Gefühl dafür vermitteln, welche Systeme bei Aufgaben, bei denen Genauigkeit von größter Bedeutung ist, besser abschneiden, obwohl Sie immer gegen Ihre eigenen Anwendungsfälle validieren sollten, anstatt sich allein auf einen Benchmark-Score zu verlassen.

Eine ausgewogene Betrachtungsweise

Halluzinationen sind real, aber sie sind kein Grund, KI zu vermeiden. Sie sind ein Grund, sie so zu nutzen, wie man jeden fähigen, aber fehlbaren Assistenten nutzen würde: großzügig delegieren, die wichtigen Dinge überprüfen und niemals zulassen, dass selbstbewusste Formulierungen eine überprüfbare Tatsache ersetzen. Die Unternehmen, die den größten Nutzen aus diesen Tools ziehen, sind nicht die, die ihnen blind vertrauen, noch die, die sich weigern, sie zu nutzen. Es sind diejenigen, die genau verstehen, wo die Technologie stark ist und wo sie Aufsicht benötigt, und ihre Prozesse entsprechend gestalten.

Wenn Sie eine breitere Grundlage dafür wünschen, wie diese Systeme funktionieren und wo sie passen, beginnen Sie mit unserem Leitfaden zu Was ist künstliche Intelligenz. Und wenn Ihre Sorge speziell der kundenorientierten Automatisierung gilt, wo die Kosten eines selbstbewussten Fehlers am höchsten sind, erläutert unser WhatsApp AI Chatbot Guide, wie automatisierte Gespräche sowohl hilfreich als auch fundiert bleiben.

Häufig gestellte Fragen

Werden neuere KI-Modelle irgendwann aufhören zu halluzinieren?+
Sie werden stetig besser, aber Halluzinationen sind mit der Funktionsweise dieser Systeme verbunden, so dass sie unwahrscheinlich bald ganz verschwinden werden. Die praktische Annahme für jedes Unternehmen sollte sein, dass eine gewisse Fehlerrate bestehen bleibt und dass wichtige Ausgaben weiterhin überprüft werden müssen.
Hilft es wirklich, dem Modell meine eigenen Dokumente zu geben?+
Ja, erheblich. Wenn ein Modell auf der Grundlage von Quellenmaterial antwortet, das Sie bereitstellen, anstatt aus dem Gedächtnis, nimmt die Fabrikation stark ab, da es mit echtem Text arbeitet. Das Zusammenfassen und Beantworten von bereitgestellten Dokumenten ist eine der zuverlässigsten Möglichkeiten, diese Tools zu nutzen.
Warum klingt das Modell so sicher, wenn es falsch liegt?+
Weil die sprachliche Sicherheit nichts mit der Wahrheit zu tun hat. Das Modell produziert flüssigen Text, unabhängig davon, ob die zugrunde liegende Behauptung korrekt ist. Eine Fälschung kann daher genauso autoritativ klingen wie eine Tatsache. Der Ton ist niemals ein zuverlässiges Signal für Richtigkeit.
Ist es sicher, KI für kundenorientierte Antworten zu verwenden?+
Mit dem richtigen Design kann dies der Fall sein. Verankern Sie den Assistenten in Ihren genehmigten Richtlinien und Inhalten, beschränken Sie ihn auf Themen, die Sie vorbereitet haben, und leiten Sie alles außerhalb seines Anwendungsbereichs an einen Menschen weiter. Ziel ist es, zu verhindern, dass er Antworten zu Themen wie Rückerstattungen oder Produktansprüchen erfindet.

Referenzen

  1. Stanford Institute for Human-Centered AI (HAI), AI Index Report. hai.stanford.edu
  2. Anthropic, Forschung und Leitlinien zu zuverlässigen KI-Systemen. anthropic.com

Möchten Sie einen automatisierten Assistenten, der sich an Ihre tatsächlichen Richtlinien hält? Sehen Sie sich unseren WhatsApp AI Chatbot an oder kontaktieren Sie uns, um Sicherheitsvorkehrungen für Ihren Anwendungsfall zu besprechen.

Zurück zum Blog

AUTOMATISIEREN. OPTIMIEREN. DOMINIEREN.

Optimieren Sie Ihre Betriebsabläufe und bieten Sie ein reibungsloses Kundenerlebnis. Unsere Experten implementieren modernste Technologien und optimierte Arbeitsabläufe, damit Sie sich auf Ihre Kernkompetenzen konzentrieren können.