Was sind KI-Halluzinationen?

Wer KI-Tools wie ChatGPT Plus oder Claude länger nutzt, stößt früher oder später auf ein überraschendes Phänomen: Die KI beantwortet eine Frage überzeugend und detailliert — und liegt dabei komplett falsch. Zitate, die nie existierten. Gerichtsurteile, die erfunden sind. Zahlen, die keiner Quelle entsprechen. Dieses Phänomen heißt Halluzination.

Kurze Antwort

KI-Halluzination bezeichnet das Verhalten eines Sprachmodells, sachlich falsche Informationen zu generieren, die plausibel und korrekt klingen. Das Modell “erfindet” Fakten, Quellen oder Details — nicht absichtlich, sondern weil es statistisch wahrscheinliche Textfortsetzungen berechnet, nicht Fakten abruft. Für KMU ist das relevant, weil KI-generierte Inhalte immer geprüft werden müssen, bevor sie verwendet werden.

Halluzinations-Typ	Beispiel
Falsche Zitate	”Laut einer Studie der Uni München aus 2023…” (existiert nicht)
Erfundene Gesetze	Gesetzesparagraphen, die es nicht gibt
Falsche Zahlen	Umsatzdaten, Statistiken ohne reale Grundlage
Falsche Personen	Biographische Details, die nicht stimmen
Falsche URLs	Links, die ins Leere führen

Definition

Halluzination (im KI-Kontext) bezeichnet die Ausgabe eines Large Language Models, die sachlich falsch oder nicht belegbar ist, aber grammatikalisch korrekt und inhaltlich plausibel formuliert ist.

Der Begriff kommt aus der Kognitionswissenschaft — analoge menschliche Halluzinationen sind Wahrnehmungen ohne realen Auslöser. Bei KI bedeutet er: Das Modell gibt Informationen aus, die in seinen Trainingsdaten nicht (so) vorhanden waren oder die es falsch kombiniert.

Warum passiert das? LLMs berechnen nicht “was ist wahr”, sondern “welche Textfortsetzung ist wahrscheinlich”. Das funktioniert für Sprache und Struktur hervorragend — bei konkreten Fakten wie Zahlen, Daten, Namen oder Zitaten kann das Modell jedoch plausibel klingende, aber falsche Werte generieren.

Faktoren, die Halluzinationen begünstigen: Themen außerhalb des Trainingsdatums, sehr spezifische Faktenfragen (Zahlen, Daten, Namen), unklare oder widersprüchliche Prompts, und Themen mit wenig Trainingsbedeckung (Nischenfächer, regionale Informationen).

Beispiel aus der Praxis

Ein selbstständiger Unternehmensberater nutzt ChatGPT, um Referenzen für ein Beratungsangebot zu recherchieren. Er fragt: “Welche Studien belegen den ROI von digitalen Transformationsprojekten in deutschen KMU?”

ChatGPT nennt drei Studien mit Titeln, Erscheinungsjahren und Autorennamen — präzise und überzeugend formuliert. Der Berater baut seine Präsentation darauf auf. Beim Abgabetermin fragt der Kunde nach den Original-Quellen. Zwei der drei Studien existieren nicht.

Hätte der Berater die Quellen vor der Verwendung geprüft (Google Scholar, Verlagswebsites), wäre das nicht passiert. KI-generierte Quellen immer verifizieren — das ist heute ein Grundsatz im professionellen Umgang mit LLM-Tools.

Typische Anwendungsfälle mit Halluzinationsrisiko

Rechtliche Recherche: Paragraphen, Urteile und Gesetze können erfunden sein — immer in amtlichen Quellen prüfen.
Medizinische Informationen: Studien, Dosierungen, Diagnosen können falsch sein.
Zitate und Quellenangaben: Fast immer unzuverlässig — nur verifizierte Quellen verwenden.
Finanzdaten und Statistiken: Zahlen wirken präzise, können aber komplett fiktiv sein.
Personenbeschreibungen: Biographische Angaben zu realen Personen können falsch oder veraltert sein.
Lokale Informationen: Adressen, Öffnungszeiten, regionale Gegebenheiten — häufig unzuverlässig.
Branchenspezifisches Nischenwissen: Je spezieller, desto höher das Halluzinationsrisiko.

DSGVO-Relevanz

Halluzinationen haben eine DSGVO-Dimension, die KMU oft übersehen:

Falsche Informationen über Personen. Ein LLM kann sachlich falsche Angaben über reale Personen generieren — falsche Berufsbezeichnungen, erfundene Verbindungen, falsche biographische Details. Wenn KMU solche Informationen ungeprüft veröffentlichen (z. B. in Artikeln, Kundenpräsentationen), drohen Ansprüche auf Berichtigung oder Unterlassung nach DSGVO und allgemeinem Persönlichkeitsrecht.

Automatisierte Entscheidungen. Wenn KMU KI-Systeme nutzen, die automatisiert Entscheidungen über Personen treffen (z. B. Kreditwürdigkeitsprüfung, Bewerbungsscreening), und das System halluziniert — also falsche Daten nutzt — können Betroffene nach Art. 22 DSGVO das Recht auf menschliche Überprüfung geltend machen.

Haftung für KI-Inhalte. Wer KI-generierte Inhalte veröffentlicht — Texte, Berichte, rechtliche Einschätzungen — übernimmt die Verantwortung für deren Richtigkeit. Das gilt auch dann, wenn die KI die Fehler produziert hat. Kein Haftungsausschluss gegenüber Dritten durch “die KI hat das geschrieben”.

Empfehlung: Interne Richtlinien definieren, welche KI-Inhalte vor der Verwendung geprüft werden müssen — und durch wen. Besonders bei Faktenaussagen, Quellen und Personenangaben ist menschliche Verifikation Pflicht.

Häufige Missverständnisse

“Neuere KI-Modelle halluzinieren nicht mehr.” Halluzinationen sind ein inhärentes Merkmal von LLMs — auch aktuelle Modelle (GPT-4, Claude, Gemini) halluzinieren, wenn auch seltener als ältere Versionen. Vollständig vermieden werden sie bisher bei keinem Modell.
“Wenn die KI sicher klingt, stimmt es.” LLMs klingen immer sicher und überzeugend — das ist eine Stärke der Spracherzeugung und kein Hinweis auf Korrektheit. Selbstbewusstsein im Text korreliert nicht mit Faktentreue.
“Halluzinationen sind selten.” Bei Routineaufgaben (Texte formulieren, zusammenfassen, übersetzen) sind sie selten auffällig. Bei Faktenfragen, Quellenangaben und spezifischen Zahlen passieren sie regelmäßig. Es kommt auf den Anwendungsfall an.
“RAG löst das Problem vollständig.” RAG reduziert Halluzinationen erheblich, eliminiert sie aber nicht. Das Modell kann trotzdem falsch interpolieren oder Passagen aus den bereitgestellten Dokumenten falsch anwenden.

Häufig gestellte Fragen

Wie erkenne ich eine Halluzination? Durch Prüfung gegen externe Quellen — bei Zahlen, Daten, Gesetzen, Zitaten und Personenangaben immer in Primärquellen nachschlagen. Auffällig: sehr spezifische Angaben (Seitenzahl, Erscheinungsjahr, Gesetzesparagraph), die sich nicht verifizieren lassen.

Kann ich die KI bitten, keine Halluzinationen zu produzieren? Bis zu einem gewissen Grad: Prompts wie “Wenn du dir nicht sicher bist, sag das explizit” oder “Antworte nur auf Basis gesicherter Informationen” reduzieren Halluzinationen. Vollständig vermeiden lässt sich das Risiko so aber nicht.

Welche Aufgaben sind besonders halluzinationsanfällig? Quellenangaben, Zitate, Gesetzesparagraphen, biographische Details, Statistiken, lokale Informationen und sehr spezifische Nischenthemen. Bei Routineaufgaben wie Textumformulierung oder Strukturierung ist das Risiko deutlich geringer.

Haftet der KI-Anbieter, wenn halluzinierte Inhalte Schäden verursachen? Nein — die Nutzungsbedingungen aller großen Anbieter schließen Haftung für die inhaltliche Richtigkeit von Ausgaben aus. Die Verantwortung liegt bei den Nutzern, die KI-Inhalte prüfen und verantworten müssen.

Gibt es Tools, die Halluzinationen automatisch erkennen? Es gibt erste Ansätze (sogenannte “Grounding”-Tools), die KI-Ausgaben gegen Quellen abgleichen. Zuverlässige Automatisierung ist noch im Entwicklungsstadium — menschliches Fact-Checking bleibt für kritische Inhalte unersetzlich.

“Halluzination und KI-Fehler sind dasselbe.” Nein — der Unterschied ist wichtig. Eine Halluzination bedeutet, das Modell erfindet etwas, das nicht existiert (eine Quelle, ein Gesetz, eine Person). Ein normaler KI-Fehler ist eine falsche Berechnung oder Übersetzung bei real existierenden Eingaben. Halluzinationen sind schwerer zu erkennen, weil die Ausgabe korrekt klingt — ein Rechenfehler fällt sofort auf.

Fazit

Halluzinationen sind kein Fehler im System — sie sind eine Eigenschaft, die aus dem Funktionsprinzip von LLMs folgt. Für KMU bedeutet das: KI-Tools sind wertvolle Werkzeuge für Routineaufgaben, aber keine verlässlichen Faktenquellen. Wer KI-Inhalte nutzt, trägt die Verantwortung für deren Richtigkeit. Eine einfache Regel genügt für den Einstieg: Alles, was zitiert, belegt oder rechtlich bindend sein soll, muss vor der Verwendung gegen Primärquellen geprüft werden. Wie stark einzelne Tools in der Praxis halluzinieren, zeigen unsere Tooltests — das Halluzinationsverhalten ist dort Teil der Bewertung.

Passende Tooltests

Weiterführende Begriffe

🔧 Tools auf ai-finden zum Thema „Halluzination"

ChatGPT Plus

DSGVO 5/10

ChatGPT Plus: leistungsstärkster KI-Assistent von OpenAI – stark in der Qualität, sch…

Zum Test →

Claude (Anthropic)

DSGVO 6/10

Vielseitiger KI-Assistent von Anthropic - starker Sicherheitsfokus, US-Anbieter mit S…

Zum Test →

DeepSeek

DSGVO 1/10

Chinesischer KI-Assistent mit kostenlosem Chat und sehr günstiger API – datenschutzre…

Zum Test →

Kurze Antwort

Definition

Beispiel aus der Praxis

Typische Anwendungsfälle mit Halluzinationsrisiko

DSGVO-Relevanz

Verwandte Begriffe

Häufige Missverständnisse

Häufig gestellte Fragen

Fazit

🔧 Tools auf ai-finden zum Thema „Halluzination"

Welches Tool passt zu dir?