Das Neotoma ist eine strukturierte Speicherschicht für KI-Agenten. Es behandelt personenbezogene Daten so, wie Produktionssysteme den Status behandeln: typisierte Entitäten, stabile IDs, vollständige Herkunft, deterministische Abfragen. Diese Entwicklerversion ist jetzt verfügbar. Installieren Sie es über npm, verbinden Sie Ihre KI-Tools über MCP und führen Sie es auf Ihrem Computer aus.

Dokumente und Einrichtung: [neotoma.io](https://neotoma.io). Repo: [github.com/markmhendrickson/neotoma](https://github.com/markmhendrickson/neotoma).

## Das Problem

Ich habe das letzte Jahr damit verbracht, Arbeitsabläufe über KI-Agenten zu steuern: E-Mail, Aufgaben, Finanzen, Kontakte, Inhalte. Die Agenten sind kompetent. Das Problem ist Vertrauen.

Das Gedächtnis verändert sich implizit. Kontextabweichungen. Der Agent gibt in einer neuen Sitzung eine andere Antwort auf dieselbe Frage. Es wird ein Kontakt überschrieben und der vorherige Zustand ist verloren. Ich kann eine falsche Zahl nicht auf ihre Quelle zurückführen. Ich kann nicht dieselben Datensätze aus einem anderen Tool verwenden.

Dies sind keine Randfälle. Sie werden angezeigt, sobald Agenten den aktuellen Status bearbeiten: Aufgaben, Transaktionen, Verpflichtungen, Beziehungen. Je mehr ich delegiere, desto schärfer werden die Grenzen.

Was immer wieder kaputt geht, ist nicht die Intelligenz. Es ist Vertrauen. Darüber habe ich zum ersten Mal in [Aufbau einer Wahrheitsschicht für den persistenten Agentenspeicher](/posts/truth-layer-agent-memory) geschrieben.

## Wo der aktuelle Speicher nicht ausreicht

Heutzutage ist der größte Teil des Agentenspeichers ein Abruf: RAG, Agentensuche, Einbettungsähnlichkeit, anbietergesteuerter Speicher. Der Abruf funktioniert für Erkundungs- und einmalige Fragen. Es fällt für den laufenden Zustand auseinander.

[RAG füllt sich mit redundanten Ergebnissen](/posts/why-agent-memory-needs-more-than-rag), wenn der Agentenspeicher ein begrenzter, kohärenter Strom ist. Top-k gibt Wiederholungen zurück, anstatt das, was Sie brauchen. Beschneiden von Fragmenten, Beweisketten. Ähnlichkeit ignoriert Struktur.

Der Anbieterspeicher (ChatGPT Memory, Claude Projects) ist nur für Konversationen und plattformgebunden. Es ist undurchsichtig, hat keinen Ursprung oder Rollback und funktioniert nicht mit allen Tools. Sie können es nicht deterministisch abfragen oder eine Tatsache auf ihre Quelle zurückführen.

[Agentische Suche](/posts/agentic-search-and-the-truth-layer) leitet jede Sitzung erneut ab. Keine dauerhafte kanonische Identität, keine Garantie, dass dieselbe Frage zum selben Ergebnis führt. Es funktioniert zum Codieren und Erkunden. Für Aufgaben, Kontakte, Transaktionen und Ereignisse benötigen Sie nächste Woche die gleiche Antwort, vollständige Sätze und Prüfprotokolle. Retrieval liefert das nicht.

Die [nützliche Aufteilung](/posts/agent-memory-truth-problem) ist Abruf versus strukturierter Zustand, nicht Grafik versus Markdown. Der Abruf optimiert Relevanz und Entdeckung. Der strukturierte Zustand optimiert Konsistenz, Vollständigkeit und Herkunft. Die großen Projekte (Zep, Mem0, Letta, LangMem) fügen Struktur hinzu, aber die vollständige Konvergenz stößt auf architektonische Hindernisse. Wenn Agenten in Ihrem Namen handeln, benötigen Sie Letzteres.

Ich habe separat über die [sechs strukturellen Trends](/posts/six-agentic-trends-betting-on) geschrieben, die diese Kluft mit der Zeit größer machen: Agenten werden zustandsbehaftet, Fehler werden bepreist, Plattformen bleiben undurchsichtig, Tools bleiben fragmentiert.

## Was Neotoma ist

Neotoma ist eine Wahrheitsschicht: das Erinnerungssubstrat, das sich unter Ihren Agenten befindet. Agenten machen weiterhin das, was sie tun (Surfen, Schreiben, Aufrufen von Tools). Neotoma besitzt den Staat, in dem sie lesen und schreiben.

Sie laden Dokumente hoch oder teilen Informationen in Agentengesprächen. Neotoma löst Entitäten quellenübergreifend auf. Personen, Firmen, Aufgaben, Rechnungen, Ereignisse erhalten stabile IDs. Jede Tatsache hat ihren Ursprung. Zeitleisten stammen aus Datumsfeldern. Korrekturen bewahren den Verlauf, anstatt ihn zu überschreiben.

Der Graph ist ausführungsunabhängig. Es modelliert, was existiert, und nicht, wie Arbeit erledigt wird. Die gleichen Daten sind von Cursor, ChatGPT, Claude oder einem beliebigen MCP-Client verfügbar. Wenn Sie [das Tool wechseln](/posts/openclaw-and-the-truth-layer), verschiebt sich der Speicher nicht.

Es handelt sich nicht um eine Notiz-App oder ein „zweites Gehirn“. Nicht vom Anbieter kontrollierter Speicher. Kein Vektorspeicher oder RAG-Layer. Kein autonomer Agent. Es handelt sich um den Schema-First-Strukturzustand, den Sie steuern.

## Was diese Version enthält

Diese Entwicklerversion legt den Kernvertrag offen:

- **CLI** für Menschen.
- **MCP** für Agenten (ChatGPT, Claude, Cursor, Claude Code); Agenten verwenden MCP als Backup.
- **OpenAPI** als einzige Quelle der Wahrheit.

Konkrete Funktionalität:

- **Dual-Path-Speicherung.** Laden Sie Dateien hoch oder schreiben Sie strukturierte Daten aus Agentengesprächen in ein Diagramm.
- **Entitätsauflösung.** Hash-basierte kanonische IDs vereinheitlichen dieselbe Entität über alle Quellen hinweg.
- **Schema-Registrierung.** Typisierte Entitäten und typisierte Beziehungen. Schemata entwickeln sich mit den Daten weiter.
- **Zeitleisten.** Automatische Zeitleistengenerierung aus entitätsübergreifenden Datumsfeldern.
- **Vollständige Herkunft.** Jede Aufzeichnung weist auf ihre Quelle hin. Korrekturen führen zu neuen Beobachtungen, nicht zu Überschreibungen.
- **Struktureller Abruf.** Abfrage nach Entitätstyp, ID, Beziehung oder Zeitbereich. Graphennachbarschaft für entitätsübergreifendes Denken.

Es gibt keine Web-App. Dies ist eine Infrastruktur, kein Produkt. Die Schnittstellen sind CLI, MCP und API.

## Prinzipien und warum Local-First

Drei Grundlagen prägen das Design:

**Privatsphäre geht vor.** Ihre Daten bleiben auf Ihrem Computer. Nur lokaler Speicher: SQLite und lokale Dateien. Keine Cloud-Abhängigkeit. Nie zum Training verwendet. Sie bestimmen, was reinkommt und was bleibt.

**Deterministisch.** Gleiche Eingabe, gleiche Ausgabe. Hash-basierte Entitäts-IDs. Schema-First-Extraktion. Kein LLM im kritischen Pfad für die Speicherung oder den Abruf. Vollständige Provenienz auf jeder Platte.

**Plattformübergreifend.** Eine Speicherebene für alle Tools. ChatGPT, Claude, Cursor und Claude Code verbinden sich über MCP. Keine Anbieterbindung. Wechseln Sie die Tools und der Speicher bleibt gleich.

Diese Version ist von Natur aus nur lokal. Vertrauen beginnt mit Kontrolle. Bevor eine Remote-Infrastruktur hinzugefügt wird, müssen der Vertrag und die Garantien solide sein. „Nur lokal“ bedeutet, dass Sie alles überprüfen können, was das System tut. Das ist der richtige Ausgangspunkt für eine Schicht, die den Anspruch erhebt, vertrauenswürdig zu sein.

## Für wen das ist

Entwickler und Agentenentwickler sind mit CLI-First-Workflows vertraut. Personen, die Agentensysteme erstellen oder betreiben und über Sitzungen und Tools hinweg persistenten Speicher benötigen. Jeder, der personenbezogene Daten wie Produktionsinfrastruktur behandelt.

(Noch) nicht für: UI-First-Benutzer, gelegentliches Notizenmachen oder alle, die heute Stabilitätsgarantien erwarten. Es ist mit bahnbrechenden Änderungen zu rechnen. Diese Freigabe dient der Druckprüfung der Fundamente.

## Installieren und verbinden

„Bash
npm install -g neotoma # install
neotoma init # initialisieren
neotoma # interaktive Sitzung starten
„

Vollständige Einrichtung, API-Dokumente, MCP-Konfiguration und Schemareferenz: [neotoma.io](https://neotoma.io).

Repo: [github.com/markmhendrickson/neotoma](https://github.com/markmhendrickson/neotoma).

## Imbissbuden

- **Datenschutz geht vor.** Ihre Daten auf Ihrem Computer; Nur lokal, keine Cloud, nie für Schulungen verwendet.
- **CLI, MCP, OpenAPI.** Ein Vertrag für Menschen und Agenten.
- **Schema-erster strukturierter Zustand.** Typisierte Entitäten, vollständige Herkunft, deterministische Abfragen.

## Probieren Sie es aus, brechen Sie es, sagen Sie es mir

Ich würde mich über Ihre Hilfe freuen, dies zu verschärfen. Führen Sie es aus. Hit-Edge-Fälle. Melden Sie Fehler, verwirrendes Verhalten oder fehlende Teile.

Feedback schätze ich am meisten: dort, wo die Garantien versagen, wo der Vertrag im Weg steht, wo das Design den falschen Kompromiss eingeht. Öffnen Sie Probleme auf GitHub, reichen Sie Patches ein oder starten Sie eine Diskussion.

Diese Veröffentlichung ist absichtlich grob. Zuverlässigkeit entsteht durch echte Nutzung und echtes Feedback, nicht durch isoliertes Polieren.