[Boris Cherny (Erfinder von Claude Code bei Anthropic) twitterte](https://x.com/bcherny/status/2017824286489383315), dass Claude Code von RAG plus lokaler Vektor-DB auf die Agentensuche umgestiegen ist. Es funktioniert besser, sagte er, ist einfacher und mit weniger Problemen in Bezug auf Sicherheit und Datenschutz verbunden. Andere Tools gehen einen anderen Weg. Cursor verwendet beispielsweise cloudbasierte Einbettungen, um die Codebasis zu indizieren und nach semantischer Ähnlichkeit zu suchen.

Wir haben also mindestens zwei Retrieval-Paradigmen: einbettungsbasierte Suche (vorindiziert, Vektorähnlichkeit) und agentische Suche (Nutzung von Tools auf Abruf). Sie sind nicht gleich. Jeder hat unterschiedliche Kompromisse. Beides sind Retrieval-Strategien. Eine Wahrheitsschicht ist etwas anderes. Es behält kanonische Entitäten bei, behält die Herkunft bei und unterstützt deterministische Abfragen. Es geht um den Zustand, nicht um den Abruf. In diesem Beitrag wird eine Wahrheitsschicht mit beiden Abrufmodellen verglichen. Es knüpft auch an die Grenzen an, an die ich gestoßen bin, als ich mich allein auf das Abrufen verlassen habe.

## Wo ich an Grenzen gestoßen bin

Ich verwende Cursor als zentrale Schnittstelle für alle meine digitalen Arbeitsabläufe, nicht nur für die Programmierung. E-Mail-Triage, Aufgabenverwaltung, Finanzanfragen, Inhaltsplanung, Transaktionen, Kontakte. Sie laufen alle über denselben Agenten mit Zugriff auf dasselbe Repo. Die dateiübergreifende Agentensuche funktioniert oft gut. Der Agent findet Kontext, leitet Zusammenhänge ab und erledigt Aufgaben.

Aber ich bin an Grenzen gestoßen. Der Agent schließt daraus; es garantiert nicht. So sieht das aus:

- **Große Datensätze, unvollständiger Abruf.** Bei der On-Demand-Suche werden Dinge übersehen oder bei Tausenden von Transaktionen oder Hunderten von Kontakten abgeschnitten. Der Abruf wird jedes Mal neu abgeleitet. Es gibt keinen strukturierten Speicher, in dem vollständige Ergebnisse abgefragt werden können.
- **Unwiederbringliche Überschreibungen.** Ein Agent überschreibt einen Kontakt oder eine Aufgabe und der vorherige Status ist verloren. Kein Rollback. Schreibvorgänge sind vorhanden. Es gibt keine Versionierung oder einen Nur-Anhänge-Trail zum Nachverfolgen und Zurücksetzen.
- **Kein werkzeugübergreifender Zugriff.** Ich kann nicht dieselben Datensätze von Claude.ai oder ChatGPT verwenden. Der Abruf erfolgt anbietergebunden.
- **Nicht reproduzierbare Antworten.** Gleiche Frage, andere Antwort. Ich kann ein Ergebnis zur Überprüfung oder zum Debuggen nicht reproduzieren. Der Abruf ist nicht deterministisch.
- **Keine Rückverfolgbarkeit.** Wenn der Agent eine falsche Nummer oder einen falschen Anspruch angibt, kann ich dies nicht auf Quelldateien oder -aufzeichnungen zurückführen. Der Abruf hat keine Herkunft.
- **Instabile kanonische Identität.** Der Agent kann „Acme Corp“ und „ACME CORP“ ​​in einer Sitzung als gleich und in der nächsten als unterschiedlich behandeln. Der Abruf erfolgt jedes Mal neu. Es gibt keine dauerhaften kanonischen IDs oder Zusammenführungsregeln.

## Zwei Retrieval-Paradigmen, ein Zustandsparadigma

Sowohl die einbettungsbasierte Suche als auch die Agentensuche liefern Informationen an einen Agenten. Sie sind nicht gleich. Die einbettungsbasierte Suche (z. B. Cursor) indiziert einen Korpus vor und antwortet über Vektorähnlichkeit. Der Index kann in der Cloud gehostet und aktualisiert werden. Die Agentensuche (z. B. Claude Code) überspringt einen persistenten Index und verwendet Tools zum Suchen und Lesen bei Bedarf. Unterschiedliche Implementierungen, unterschiedliche Kompromisse: Datenschutz, veraltet, Einfachheit.

Was sie gemeinsam haben, ist das Abrufen. Der Agent findet Dinge zum Zeitpunkt der Abfrage. Eine Wahrheitsschicht ist kein Abruf. Es handelt sich um einen dauerhaften, strukturierten Zustand: kanonische Entitäten, Herkunft, deterministische Abfragen.

Wir vergleichen ein Zustandsparadigma (Wahrheitsschicht) mit zwei Abrufparadigmen (einbettungsbasiert und agentenbasiert). Die folgende Tabelle listet alle drei auf. Wenn beide Abrufspalten eine gemeinsame Grenze haben (z. B. keine Herkunft), handelt es sich um eine Ähnlichkeit zwischen ihnen in Bezug auf eine Wahrheitsschicht. Es ist keine Gleichung aus beidem.

| Domäne | Einbettungsbasierte Suche | Agentensuche | Wahrheitsschicht |
|--------|----------|----------------|-------------|
| Dokumentenabruf | Vorindizierte Ähnlichkeit, semantische Übereinstimmung | On-Demand-Suche, Inferenz | Entitätsauflösung, Dedup, Herkunft |
| Aggregation aus mehreren Quellen | Umfang und Aktualität des Index hängen vom Build | ab Live-Suche über Quellen hinweg | Einheitlicher Graph, deterministische Zusammenführung |
| Entitätssuche | Ähnlichkeit über Einbettungen; keine kanonische ID | Inferenz pro Sitzung | Kanonische IDs, regelbasierte Zusammenführung |
| Timeline-Abfragen | Nur wenn indiziert; kein natives Zeitmodell | Montage nach Bedarf | Vorberechnet, schemagesteuert |
| Provenienz und Prüfung | Keine | Keine | Unveränderlicher Prüfpfad |
| Plattformübergreifend | An Anbieter/Index gebunden | Anbieterspezifische Tools | Gleiche Daten für alle Tools |

Beide Abrufansätze optimieren Komfort und Flexibilität. Eine Wahrheitsschicht sorgt für Konsistenz und Überprüfbarkeit.

## Was eine Wahrheitsschicht bietet

Eine strukturierte Speicherschicht ist um verschiedene Grundelemente herum aufgebaut:

1. **Persistente kanonische Identität.** Stabile Entitäts-IDs über Sitzungen und Tools hinweg.
2. **Deterministische Zusammenführungslogik.** Regelbasierte Kombination von Beobachtungen, keine LLM-Inferenz pro Sitzung.
3. **Herkunft und Prüfung.** Nachverfolgbare Abstammung von der Quelle bis zur Antwort.
4. **Idempotenz.** Gleiche Eingaben führen zu gleichen Ausgaben.
5. **Plattformübergreifende Wahrheit.** Gleicher Speicher für ChatGPT, Claude, Cursor.
6. **Klares Datenschutzmodell.** Benutzerkontrolle, kein Einsatz von Anbieterschulungen, klare Datengrenzen.

Dabei handelt es sich nicht um inkrementelle Verbesserungen gegenüber der Agentensuche. Sie haben ein anderes Design. Best-Effort-Abruf und Orchestrierung im Vergleich zu überprüfbarem, wiederholbarem Zustand. Die Wahl hängt davon ab, was Sie benötigen.

## Was der Abruf annähern kann (agentisch oder einbettungsbasiert)

Drei Beispiele zeigen einen Abruf (agenten- oder einbettungsbasiert), der den oben genannten Fähigkeiten nahe kommt. In jedem Beispiel erhält der Agent etwas, das im Moment richtig aussieht. In jedem Fall treten die gleichen Grenzen auf: keine dauerhafte kanonische Identität, keine Herkunft, keine Garantie dafür, dass „gleiche Abfrage“ über Sitzungen oder Indexneuerstellungen hinweg „gleiches Ergebnis“ liefert. In den folgenden Beispielen werden Agentenbegriffe verwendet (Tools, On-Demand-Suche). Der einbettungsbasierte Abruf kann die gleichen Verhaltensweisen über eine semantische Suche über einen Index annähern und stößt auf die gleichen Grenzen.

**Beispiel 1: Sitzungsbezogene Entitätsauflösung.** Der Agent verfügt über Tools zum Durchsuchen von Dateien, E-Mails und der Cloud. Es enthält Anweisungen, Erwähnungen derselben Entität als eine zu behandeln. Sie fragen: „Wie hoch sind meine Gesamtausgaben bei Acme Corp.“ Der Agent durchsucht Bankausfuhren, Quittungen und Rechnungen. Es werden „Acme Corp“, „ACME CORP“, „Acme Corporation“ gefunden, auf dasselbe Unternehmen geschlossen und Beträge summiert. Das sieht nach einer Entitätsauflösung für diese Abfrage und Sitzung aus. Was schief geht: Fragen Sie morgen noch einmal nach, dann kann die Zahl abweichen. Der Agent übersieht möglicherweise eine Datei (abgeschnittene Suche, falscher Pfad) und zählt zu wenig. Oder es behandelt möglicherweise „Acme Corp“ und „Acme Industries“ als gleich und überzählt. Keine Möglichkeit zur Überprüfung. Kein Prüfpfad, keine stabilen IDs. Verschiedene Sitzungen können unterschiedlicher Meinung sein.

**Beispiel 2: On-Demand-Zeitleistenmontage.** Der Agent verfügt über umfassenden Datei- und Datumszugriff. Sie fragen: „Was waren meine größten Ausgaben im dritten Quartal 2024?“ Der Agent sucht, analysiert Daten, stellt eine chronologische Liste zusammen und filtert nach „Schwerpunkt“. Sie erhalten eine zeitleistenartige Antwort ohne ein spezielles Zeitleistensystem. Was schief geht: Es wird jedes Mal auf „Major“ geschlossen. Eine Sitzung beinhaltet keinen Artikel im Wert von 500 €. Der nächste enthält es. Dokumente mit nicht standardmäßigen Datumsformaten werden gelöscht oder falsch angeordnet. Der Agent schneidet möglicherweise ab („Hier sind die Top 10“), wenn es 15 waren. Dieselbe Abfrage, jedes Mal unterschiedliche Ergebnisse.

**Beispiel 3: Hybride Speicherschicht.** Ein Anbieter bietet eine Agentensuche plus leichtgewichtigen Speicher. Der Agent extrahiert strukturierte Snippets, speichert sie und ruft sie später ab. Es verarbeitet einen Beleg und speichert „{vendor: „Acme Corp“, amount: 150, date: „2024-07-15“}“. Eine spätere Sitzung ruft dies ab und führt es mit Live-Suchergebnissen zusammen. Das sieht nach strukturiertem Gedächtnis aus. Was schief geht: Eine spätere Extraktion überschreibt das Snippet. Keine Versionierung, kein Rollback. Derselbe Anbieter erscheint im gespeicherten Speicher als „Acme Corp“ und bei einer neuen Suche als „ACME CORP“. Es häufen sich Duplikate. Der Anbieter ändert die Funktion oder das Schema und Ihre gespeicherten Snippets verschwinden. Es gibt keine Möglichkeit, eine falsche Zahl auf ihre Quelle zurückzuführen.

In jedem Beispiel nähert sich das Verhalten dem an, was eine Wahrheitsschicht bereitstellt. Die Grenzen sind dem Retrieval inhärent. Unabhängig davon, ob der Agent die eingebettete Suche oder die Agentensuche verwendet, erhalten Sie weiterhin Sitzungsbereich und inferenzbasierte Zusammenführung. Sie erhalten weiterhin keine Herkunfts- und keine plattformübergreifende Garantie. Eine Wahrheitsschicht geht diese an, indem sie den Zustand beibehält, anstatt ihn erneut abzurufen.

## Wenn der Abruf überragend ist (agentisch oder einbettungsbasiert)

**Explorative Entdeckung.** „Finden Sie in meinen Downloads oder Notizen alles über die Wohnung in Barcelona.“ Sie wissen nicht, wo es lebt oder wie es heißt. Die Agentensuche über Dateien, Ordner und Formate hinweg zeigt relevante Snippets an. Kein Schema erforderlich. Der Agent leitet ab und montiert.

**Schnelle quellenübergreifende Zusammenfassung.** „Was haben wir in den letzten drei E-Mails mit dem Auftragnehmer entschieden?“ Posteingang durchsuchen, Thread extrahieren, zusammenfassen. Eine Sitzung, eine Antwort. Es ist nicht erforderlich, dass diese Zusammenfassung beim nächsten Mal bestehen bleibt oder genau übereinstimmt.

**Ad-hoc-Code- und Dokumentendurchquerung.** „Wo gehen wir mit Stripe-Webhooks um?“ Durchsuchen Sie die Codebasis, die README-Datei und interne Dokumente. Das Layout variiert je nach Repo. Die Agentensuche passt sich an. Kein einheitliches Diagramm erforderlich.

**Einzeldokument- oder Einzelthread-Triage.** „Dieses PDF zusammenfassen“ oder „Was ist die Frage in dieser E-Mail?“ Der Kontext ist begrenzt. Schlussfolgerung ist ausreichend. Keine Entitätsauflösung oder sitzungsübergreifender Status.

## Wenn eine Wahrheitsschicht herausragend ist

**Vollständiger Rückruf bei großen Datensätzen.** „Listen Sie jede Transaktion mit Anbieter X in den letzten zwei Jahren auf.“ Bei Tausenden von Zeilen kann die Agentensuche Datensätze übersehen, Aggregate abschneiden oder halluzinieren. Eine Wahrheitsschicht fragt einen strukturierten Speicher ab. Sie erhalten alle passenden Datensätze oder eine genaue Zählung.

**Sitzungsübergreifende Konsistenz.** Der Agent erstellt in der ersten Sitzung eine Folgeaufgabe. Sie eröffnen morgen eine neue Sitzung. Die Aufgabe muss vorhanden sein und mit dem richtigen Kontakt und der richtigen E-Mail-Adresse verknüpft sein. Die Agentensuche verfügt über kein persistentes Diagramm. Eine Wahrheitsschicht tut es.

**Prüfung und Herkunft.** „Woher kommt diese Nummer?“ Verfolgen Sie es auf Quelldatensätze, Importdaten und Ableitungsregeln. Die Agentensuche gibt abgeleitete Antworten zurück. Eine Wahrheitsschicht gibt Antworten mit Abstammung zurück.

**Entitätsauflösung im großen Maßstab.** Hunderte von Kontakten, einige Duplikate (Namensvariationen, fusionierte Unternehmen). Tausende Transaktionen beziehen sich auf denselben Anbieter in unterschiedlichen Schreibweisen. Eine Wahrheitsschicht verwaltet kanonische IDs und Zusammenführungsregeln. Die Agentensuche leitet jede Sitzung neu ab und stimmt möglicherweise nicht überein.

**Deterministische Wiedergabe.** Immer dieselbe Abfrage, dasselbe Ergebnis. Kritisch für Berichterstellung, Compliance oder Debugging. Die Agentensuche ist nicht deterministisch. Eine Wahrheitsschicht ist idempotent.

**Wiederherstellbarkeit nach fehlerhaften Schreibvorgängen.** Ein Agent überschreibt einen Kontakt, führt zwei Aufgaben zu einer zusammen oder „korrigiert“ eine Transaktion aufgrund falscher Schlussfolgerungen. Bei der Agentensuche und direkten Dateischreibvorgängen ist der vorherige Zustand verschwunden. Kein Rückgängigmachen. Eine Wahrheitsschicht verwendet reine Anhänge- oder versionierte Schreibvorgänge. Sie können nachverfolgen, was sich geändert hat, und ein Rollback durchführen. Mutationen sind explizite Vorgänge, keine stillen Überschreibungen.

## Warum die Unterscheidung wichtig ist

Der Abruf (einbettungsbasiert oder agentenbasiert) ist sitzungsgebunden. Es allein gibt Ihnen keine dauerhafte Identität, Herkunft oder sitzungsübergreifende Konsistenz. Sein Wert ist der flexible On-Demand-Zugriff. Der Wert einer Wahrheitsschicht ist die beständige, sitzungsübergreifende Wahrheit. Eine deterministische, überprüfbare Entitätsauflösung ist schwierig. Weder die Einbettung von Ähnlichkeit noch die Ad-hoc-Agentensuche sind gleichwertig. Vom Anbieter gehostete Agenten sind mit Anreizen konfrontiert, die im Widerspruch zum benutzergesteuerten, datenschutzorientierten Speicher stehen. Ihr Gedächtnis und ihre Werkzeuge sind in der Regel produktspezifisch.

Der Cherny-Tweet spiegelt einen echten Wandel wider. RAG plus Vektor-DB war komplex und hatte Auswirkungen auf den Datenschutz. Vereinfachte Suche nach Agenten für Claude Code. Cursor und andere nehmen einen anderen Abrufpfad (Cloud-Einbettungen). Beide Retrieval-Paradigmen lösen die Frage: „Wie findet der Agent Dinge?“ Keines von beiden löst die Frage: „Wie erhalten wir eine stabile Identität, Herkunft und Verifizierung?“ Eine Wahrheitsschicht zielt auf Letzteres ab. Abruf- und Statusebene werden nebeneinander existieren. Sie lösen unterschiedliche Probleme.

## Was ich baue

Ich baue [Neotoma](https://github.com/markmhendrickson/neotoma), eine strukturierte Speicherschicht, die den Wahrheitsschicht-Ansatz verfolgt: Entitätsauflösung, Zeitlinien, Herkunft, Determinismus, plattformübergreifend über MCP. Ich füttere es mit meinem eigenen Agentenstapel, um zu sehen, welche Rolle diese Primitiven in der Praxis spielen. Einbettungsbasierte Suche und Agentensuche sind zwei Abrufstrategien. Beides gibt Ihnen keine dauerhafte Identität oder einen überprüfbaren Status. Eine Wahrheitsschicht tut es. Ich baue Letzteres.