Was ist ein Kontextfenster?

Wer bei ChatGPT schon gefragt hat, warum ältere Nachrichten plötzlich vergessen werden, oder wer eine KI-Chat-Sitzung aus der Vergangenheit geöffnet und festgestellt hat, dass das Modell sich an frühere Aussagen nicht mehr erinnert, hat das Kontextfenster gespürt. Es bestimmt, wie viel Information ein KI-Modell gleichzeitig im Blick hat. Für KMU ist das entscheidend: Nur was im Kontextfenster liegt, kann das Modell berücksichtigen.

Kurze Antwort

Das Kontextfenster (englisch: context window) ist die maximale Menge an Text, die ein KI-Modell in einer einzelnen Anfrage verarbeiten kann — sowohl die Eingabe (Prompt, Dokumente, Gesprächsverlauf) als auch die eigene Antwort zählen dazu. Es wird in Tokens gemessen. Was außerhalb des Kontextfensters liegt, existiert für das Modell in diesem Moment nicht.

Definition

Sprachmodelle verarbeiten Text nicht kontinuierlich wie ein Mensch beim Lesen — sie nehmen immer genau einen begrenzten Textblock auf einmal auf. Dieser Block ist das Kontextfenster. Alles darin: bekannt. Alles davor oder danach: unsichtbar.

Womit das Kontextfenster gefüllt wird:

Der System-Prompt (Konfiguration des Assistenten)
Die bisherige Gesprächshistorie
Hochgeladene Dokumente oder Texte
Die aktuelle Nutzeranfrage (Prompt)
Die Antwort des Modells

Die Größe wird in Tokens angegeben. Je nach Sprache und Schreibweise entsprechen 1.000 Tokens grob 700–800 deutschen Wörtern. Claude und Gemini bieten derzeit einige der größten verfügbaren Kontextfenster für den kommerziellen Einsatz.

Kontextfenster	Entspricht ungefähr
8.000 Tokens	10–12 Seiten
32.000 Tokens	45 Seiten
128.000 Tokens	180 Seiten
1 Mio. Tokens	ca. 1.400 Seiten

Beispiel aus der Praxis

Eine Rechtsanwaltskanzlei möchte ein 60-seitiges Vertragswerk (ca. 30.000 Wörter, rund 40.000 Tokens) von einer KI zusammenfassen lassen. Mit einem kleinen Kontextfenster (8.000 Tokens) ist das unmöglich — die KI sieht nur den Anfang des Dokuments. Das gesamte Dokument muss manuell in Abschnitte zerlegt werden, was Zeit kostet und die Übersicht erschwert.

Mit einem großen Kontextfenster (128.000 Tokens oder mehr) wird der gesamte Vertrag in einem Schritt übergeben, die KI analysiert ihn vollständig und liefert eine strukturierte Zusammenfassung. Der Zeitunterschied: statt 2 Stunden manueller Zerlegung und Zusammenführung — 5 Minuten.

Typische Anwendungsfälle

Lange Dokumente analysieren: Verträge, Gutachten, Berichte auf einmal verarbeiten
Gesprächshistorie erhalten: Lange Beratungsgespräche ohne Kontextverlauf führen
Code-Reviews: Ganze Dateien einspeisen statt einzelner Snippets
Meeting-Protokolle: Stundenlange Transkripte auf einmal zusammenfassen
E-Mail-Threads: Lange Kommunikationsverläufe auf einen Blick auswerten
Forschungsberichte: Wissenschaftliche Publikationen vollständig einlesen lassen

Wann ist die Kontextfenster-Größe entscheidend?

✅ Großes Kontextfenster nötig wenn:

Dokumente mit mehr als 10 Seiten auf einmal verarbeitet werden sollen
Lange Gesprächsverläufe ohne Gedächtnisbruch geführt werden
Mehrere Dokumente gleichzeitig verglichen werden sollen
Umfangreiche Codebasen analysiert werden

❌ Kleines Kontextfenster reicht wenn:

Kurze Texte verfasst oder überarbeitet werden (E-Mails, Beiträge)
Einzelfragen ohne Dokumentenkontext beantwortet werden
Die Kosten niedrig gehalten werden sollen (größeres Fenster = höhere Kosten)

Faustregel: Als Orientierung gilt: 1 DIN-A4-Seite entspricht etwa 700 Tokens. Wer Dokumente mit mehr als 20 Seiten analysieren möchte, braucht mindestens 100.000 Tokens.

DSGVO-Relevanz

Das Kontextfenster ist datenschutzrechtlich relevant, weil es bestimmt, welche Daten an das KI-Modell übermittelt werden. Je mehr Text eingegeben wird, desto mehr personenbezogene Daten landen potenziell beim Anbieter.

Was KMU beachten sollten:

Umfang der Übermittlung: Wer ein ganzes 60-seitiges Kundendokument in ChatGPT Plus eingibt, überträgt alle darin enthaltenen personenbezogenen Daten an den Anbieter. Ein gültiger AVV ist dabei Pflicht — sofern der Anbieter als Auftragsverarbeiter tätig wird.
Datensparsamkeit: Nicht immer muss das gesamte Dokument übergeben werden. Oft reicht ein relevanter Ausschnitt — weniger Datenübertragung, geringeres Risiko.
Speicherung beim Anbieter: Prüfen, wie lange Inhalte aus dem Kontextfenster serverseitig gespeichert bleiben.
Sensible Inhalte: Personaldaten, Patientendaten oder Mandantendaten sollten vor der Übergabe anonymisiert oder pseudonymisiert werden, wenn das Analyseziel das zulässt.

Handlungsempfehlung: Für jedes KI-Tool, in das längere Dokumente eingegeben werden, den AVV prüfen und klären, ob der Anbieter Inhalte für Modell-Training nutzt.

Kontextfenster vs. Gedächtnis / Memory

Viele Nutzer verwechseln das Kontextfenster mit dem dauerhaften Gedächtnis eines KI-Tools. Der Unterschied ist grundlegend.

Das Kontextfenster beschreibt nur, was das Modell gerade jetzt sieht — die aktuelle Sitzung, den aktuellen Text, die aktuelle Anfrage. Es ist keine Erinnerung. Wenn das Gespräch endet, ist alles weg.

Persistentes Memory (z. B. ChatGPTs „Memory”-Funktion oder externe Wissensdatenbanken) speichert ausgewählte Informationen dauerhaft und lädt sie beim nächsten Gespräch neu ins Kontextfenster. Das Kontextfenster selbst bleibt dabei begrenzt — Memory verlängert es nicht, sondern liefert komprimierte Inhalte hinein.

Chatverlauf ist das, was die Anwendung aus vergangenen Nachrichten in das aktuelle Kontextfenster lädt. Er belegt Platz im Fenster und reduziert den Raum für neue Informationen.

Begriff	Was es ist
Kontextfenster	Arbeitsbereich: was das Modell gerade sieht
Memory	Dauerhafter Speicher, der ins Kontextfenster geladen wird
Chatverlauf	Vergangene Nachrichten, die ins aktuelle Fenster passen müssen

Häufige Missverständnisse

„Ein größeres Kontextfenster ist immer besser.” Stimmt nicht unbedingt. Größere Fenster erzeugen höhere Kosten pro API-Aufruf. Und manche Modelle verlieren bei sehr langen Kontexten an Qualität — Informationen in der Mitte eines langen Kontexts werden teils schlechter verarbeitet als am Anfang oder Ende.
„Das Modell erinnert sich zwischen Sitzungen.” Nein. Das Kontextfenster gilt nur für die aktuelle Sitzung. Nach Sitzungsende ist die Geschichte weg — es sei denn, die Anwendung speichert sie und lädt sie beim nächsten Start neu.
„Ich muss mir keine Gedanken ums Kontextfenster machen, solange das Tool nicht abstürzt.” Doch — wenn wichtige Informationen aus dem Fenster fallen, antwortet das Modell, als ob diese Information nie existiert hätte, ohne eine Fehlermeldung auszugeben.

Häufig gestellte Fragen

Welches Modell hat das größte Kontextfenster? Stand 2026 bieten Gemini und Claude sehr große Kontextfenster. Aktuelle Vergleichswerte direkt beim Anbieter prüfen — die Spezifikationen ändern sich regelmäßig.

Was passiert, wenn ich die Kontextgrenze überschreite? Das Modell verarbeitet nur den Teil, der ins Fenster passt — ältere Teile der Konversation oder des Dokuments werden abgeschnitten. Manche Anwendungen komprimieren die Geschichte automatisch, was zu Informationsverlust führen kann.

Wie teuer sind große Kontextfenster? Mehr Tokens in einer Anfrage führen zu höheren Kosten pro API-Aufruf. Als Nutzer fertig integrierter Tools (ChatGPT, Claude) spürt man das meist nicht direkt, bei eigenen API-Integrationen dagegen schon. Aktuelle Preise direkt beim Anbieter prüfen.

Warum vergisst ChatGPT ältere Nachrichten? Wenn die gesamte Unterhaltung — alle bisherigen Nachrichten plus die aktuelle Anfrage — größer wird als das verfügbare Kontextfenster, werden ältere Inhalte automatisch gekürzt oder zusammengefasst. Das Modell gibt dabei keine Fehlermeldung aus; es antwortet einfach, als ob die früheren Inhalte nie existiert hätten. Wer sehr lange Gespräche führt, sollte regelmäßig eine neue Sitzung starten oder ein Tool mit persistentem Memory nutzen.

Hilft RAG, das Kontextfenster-Problem zu umgehen? Ja. RAG lädt nur die relevantesten Textabschnitte ins Kontextfenster, statt das gesamte Dokument — ideal für Wissensdatenbanken oder große Dokumentensammlungen, die das Kontextfenster einzelner Modelle übersteigen würden.

Wie viele Seiten passen in ein 128.000-Token-Fenster? Ungefähr 180 DIN-A4-Seiten — genug für die meisten Geschäftsdokumente. Ein Fenster mit 1 Million Tokens fasst entsprechend rund 1.400 Seiten.

Fazit

Das Kontextfenster ist eine der wichtigsten technischen Kenngrößen beim Kauf oder Einsatz eines KI-Tools. Wer lange Dokumente analysiert, viele Informationen gleichzeitig verarbeitet oder lange Gespräche führt, sollte die Tokengröße beim Vergleich von Angeboten bewusst berücksichtigen. Für kurze Alltagsaufgaben reicht ein kleines Fenster problemlos. Wie gut Modelle mit ihrem Kontextfenster in der Praxis umgehen, zeigen unsere Tooltests.

Passende Tooltests

Weiterführende Begriffe