Per a la memòria d'agent local i oberta, la recuperació és l'opció predeterminada: les canalitzacions RAG, la cerca agència, les botigues incrustades i el recorregut de gràfics són el que la majoria dels constructors aconsegueixen primer. Una [enquesta de 2026](https://arxiv.org/abs/2602.19320) conclou que el disseny de memòria, no la capacitat del model, és ara el factor limitant per als agents de llarga vida.

La recuperació funciona bé per a la codificació i l'exploració, però es trenca quan els agents gestionen l'estat en curs. Els projectes principals ([Zep](https://www.getzep.com/), [Mem0](https://mem0.ai/), [Letta](https://www.letta.com/), [LangMem](https://langchain-ai.github.io/langmem/)) estan afegint resolució d'entitats, persistència i estructura de gràfics que s'enfronten a barreres que s'enfronten a una estructura estructurada de gràfics. modificació: consultes primer esquema, identitat determinista, procedència només adjunta i control local primer.

## Per què domina la recuperació

La recuperació s'adapta al cas d'ús que posa els agents al mapa: la codificació. Les bases de codi són exploratòries, sovint no saps on viuen les coses i vols "on manegem X?" en lloc de "enumerar totes les funcions amb procedència". La cerca semàntica i el recorregut ad hoc s'adapten bé a això.

La majoria de la gent forma la seva intuïció sobre la memòria de l'agent a partir de la codificació, on la recuperació és suficient. El problema es generalitza a partir d'això. Per a l'estat operatiu com ara tasques, contactes, transaccions i compromisos, necessiteu la mateixa resposta la setmana que ve, conjunts complets i pistes d'auditoria.

La recuperació també és barat d'afegir. Podeu incrustar els vostres documents, connectar una botiga de vectors i tenir memòria de treball en una tarda, sense disseny d'esquemes, sense resolució d'entitats i sense seguiment de procedència. Això és un autèntic avantatge, no només inèrcia.

## On es trenca la recuperació

Les ruptures apareixen quan depèn de la memòria de l'agent per a la veritat.

**Respostes inconsistents.** Si es demana "llista totes les tasques del projecte X" es retorna set resultats un dia i quatre l'endemà. La recuperació es torna a inferir cada vegada. [La investigació confirma](https://arxiv.org/abs/2512.12818) que els agents combinen informació entre sessions i produeixen respostes temporalment inconsistents a mesura que la memòria creix.

**Record incomplet.** Els sistemes RAG amb record de recuperació per sota del 80% mostren [taxes d'al·lucinació del 34%, en comparació amb el 20% dels sistemes per sobre del 90% de record](https://www.ijmsrt.com/storages/download-paper/IJMSRT25SEP018). La recuperació basada en incrustacions descarta l'estructura temporal i relacional, i com més entitats tinguis, pitjor serà la recuperació.

**Sense procedència.** Quan preguntes "d'on prové aquest número?" la recuperació us ofereix una resposta inferida a partir dels fragments que han aparegut. No hi ha cap llinatge des de la resposta fins als registres d'origen.

**Escriptures irrecuperables.** Quan un agent sobreescriu un contacte o fusiona tasques, l'estat anterior desapareixerà. No hi ha versions ni rollback.

**Deriva entre eines.** Una tasca creada a ChatGPT no es pot consultar de manera fiable al Cursor. La memòria del proveïdor és [incoherent de manera impredictible](https://www.datastudios.org/post/can-chatgpt-remember-previous-conversations-memory-behavior-session-limits-and-persistence) i les configuracions de recuperació oberta tampoc són entre eines per defecte.

## Què proporciona l'estat estructurat

L'estat estructurat significa una botiga amb entitats escrites, identificadors estables, relacions i línies de temps. La mateixa consulta retorna el mateix resultat cada vegada i obtindreu la procedència i la recuperació.

| Necessitat | Botiga estructurada | Recuperació |
|------|--------------------------------|
| Conjunt complet ("totes les tasques del projecte X") | Sí, per esquema i relacions | Parcial o inferida |
| Mateixa resposta la setmana vinent | Sí | No |
| Traça fins a la font | Sí, cadena de procedència | No |
| Recuperar-se d'una mala escriptura | Sí, si només s'afegeix | Normalment no |
| Coherència entre eines | Sí, si és multiplataforma | Només si totes les eines comparteixen el mateix backend |
| Explora el desconegut | Possible però no la seva força | Sí, aquí és on sobresurt la recuperació |
| Resum puntual | Excés | Sí |

Una botiga estructurada pot tenir forma de gràfic, i la que estic construint, [Neotoma](https://neotoma.io), és: una capa de memòria local compatible amb MCP que ofereix als agents una única font de veritat per a entitats, relacions i llinatge. El que el separa de les "configuracions de gràfics" habituals en la recuperació és la persistència, els identificadors canònics i la procedència. He escrit més sobre [per què la memòria de l'agent necessita una capa de veritat](/posts/truth-layer-agent-memory) en altres llocs.

## On es mou el camp

Els grans projectes estan convergint cap a l'estat estructurat des del costat de la recuperació.

**[Zep](https://www.getzep.com/)/[Graphiti](https://www.getzep.com/)** crea un [gràfic de coneixement temporal](https://arxiv.org/abs/2501.13956) que aconsegueix un guany de precisió del 18,5% sobre MemGPT i una reducció del 90% de MCP i servidor. És l'estat més proper a l'estructurat de l'ecosistema actual.

**Mem0** utilitza un [canal d'extracció i consolidació en dues fases](https://mem0.ai/research) que informa d'una precisió un 26% més alta que la memòria d'OpenAI, amb una variant de gràfic per a les relacions d'entitats. Encara és principalment la recuperació primer, i la capa estructurada és additiva.

**[Letta](https://www.letta.com/)** (abans [MemGPT](https://docs.letta.com/guides/legacy/memgpt-agents-legacy)) [persisteix tot l'estat en una base de dades](https://docs.letta.com/guides/agents/context-engineering) amb blocs de memòria editables. És l'"estat estructurat" més explícit dels projectes de recuperació-origen.

**[LangMem](https://langchain-ai.github.io/langmem/)/[LangGraph](https://langchain-ai.github.io/langgraph/)** ofereix un [SDK de memòria persistent](https://blog.langchain.com/langmem-sdk-launch/) amb tipus de memòria episòdica i semàntica de consolidació i procediments. La capa de persistència és real, però el patró d'accés principal encara està incorporant la cerca.

**[Hindsight](https://arxiv.org/abs/2512.12818)** ([recerca de 2025](https://arxiv.org/abs/2512.12818)) organitza la memòria en quatre xarxes lògiques i aconsegueix un 83-91% de precisió en els punts de referència d'horitzó llarg. Mostra la direcció: la memòria estructurada amb xarxes d'entitats explícites supera la recuperació plana.

## Els sistemes de recuperació poden convergir completament?

Algunes coses convergeixen de manera natural, però d'altres són estructuralment difícils de modificar.

**El que ja està convergent.** L'extracció d'entitats i l'estructura del gràfic són reals a Zep i [Mem0g](https://mem0.ai/). La persistència de la base de dades és real a Letta i LangGraph. El seguiment temporal és real a Graphiti. Aquests estan tancant la bretxa.

**Similitud-primer versus esquema-primer.** El patró d'accés predeterminat de Retrieval és "trobar coses semblants". El valor predeterminat d'una botiga estructurada és "consulta per tipus, identificador, relació o hora". Fer un esquema de sistema de recuperació primer significa canviar la superfície de l'API i les expectatives dels usuaris, no només afegir una funció.

**Identitat implícita versus explícita.** La recuperació tracta dos fragments com la mateixa entitat si les seves incrustacions són properes. L'estat estructurat tracta dos registres com la mateixa entitat si comparteixen un identificador canònic. Readaptar la identitat determinista significa canviar cada camí d'ingestió.

**Upsert versus append-only.** Els sistemes de recuperació normalment sobreescriuen, mentre que l'emmagatzematge només adjunt conserva l'historial. Letta utilitza blocs de memòria mutables i Zep fa un seguiment de l'evolució temporal, que és més propera. La majoria dels sistemes de recuperació no tenen cap concepte d'historial d'escriptura.

**Procedència mitjançant la consolidació.** Quan Mem0 consolida fets o LangMem fusiona memòries relacionades, normalment es perd la procedència de les fonts originals. La procedència que sobreviu a la fusió requereix que el model d'emmagatzematge el doni suport des del principi.

**Determinisme.** La recuperació implica classificació i els resultats varien d'una carrera a una altra. Les consultes estructurades són deterministes: la mateixa consulta retorna el mateix resultat. L'eliminació de la funció de classificació soscava el que fa que la recuperació sigui útil. Es tracta de contractes de consulta fonamentalment diferents.

**El primer control local.** Fer un sistema realment local, sense dependència del núvol i sense telemetria, entra en conflicte amb el model de negoci de la majoria d'empreses de memòria. Això no és una barrera tècnica; és un problema d'incentius estructural.

Els sistemes de recuperació poden arribar a una botiga estructurada, però l'última milla requereix consultes d'esquema primer, identitat determinista, procedència només adjunta, resultats deterministes i valors per defecte locals. Aquestes opcions van en contra de l'arquitectura de la recuperació.

## Quina recuperació encara funciona millor

**Exploració.** Quan vols trobar alguna cosa a les teves notes sobre l'apartament de Barcelona, no saps l'esquema ni el tipus d'entitat. Recuperació de superfícies rellevants sense modelatge inicial.

**Resum.** Quan pregunteu què heu decidit amb el contractista, la recuperació pot cercar, extreure i resumir en una sessió. No necessiteu que aquesta resposta persisteixi o coincideixi exactament la propera vegada.

**Travessa ad hoc.** ​​Quan us pregunteu on es gestionen els webhooks de Stripe, la disposició varia segons les bases de codi i els documents. La recuperació s'adapta sense un gràfic unificat.

**Cost inicial baix.** Podeu tenir memòria de treball en una tarda. Per a qualsevol cosa que no requereixi exhaustivitat, consistència o procedència, la recuperació és suficient i més barata.

## Buits en estat estructurat i com Neotoma els aborda

**Esquema general.** Neotoma utilitza un registre d'esquemes en evolució on l'extracció assistida per LLM proposa tipus i relacions durant la ingestió. Això redueix el cost inicial però no l'elimina. A la pràctica, l'agent revisa i corregeix els resultats de l'extracció al llarg del temps a mesura que troba inconsistències.

**Complexitat de la ingestió.** Neotoma calcula els identificadors canònics basats en hash a partir de propietats identificatives, de manera que la mateixa entitat obté el mateix identificador independentment de la font. Això és més previsible que la similitud basada en incrustacions, però depèn de la qualitat de l'extracció: "Mark" i "Mark Hendrickson" hash de manera diferent fins que els fusioneu.

**Arrencada en fred.** Neotoma admet la ingestió de doble camí: podeu pujar fitxers per a l'extracció per lots o acumular l'estat de manera incremental mitjançant converses d'agent. Això no és instantani, però és més ràpid que esperar prou converses per construir un gràfic útil.

**Cost només d'afegir.** L'emmagatzematge creix amb cada correcció, que és el que fa possible la recuperació i la procedència. A escala personal i operativa, això és manejable, però és una veritable compensació: les consultes per resoldre l'estat actual són més complexes.

**No és un substitut per a la recuperació.** Neotoma ofereix recuperació estructural per tipus, identificador, relació, interval de temps i barri de gràfics, i espera que eines de recuperació com la cerca agètica i la cerca incrustada per gestionar l'exploració. És un complement, no un substitut.

## Per què estic construint Neotoma

A la pràctica, he arribat als límits de recuperació. Les tasques, els contactes i les transaccions necessiten identificadors canònics, llinatge i accés entre eines. Les opcions de disseny responen directament a les barreres de convergència descrites anteriorment.

**Primer l'esquema.** Les consultes són per tipus d'entitat, identificador, relació o interval de temps. No hi ha cap similitud d'inserció en el camí de consulta i els resultats són deterministes.

**Identitat basada en hash.** La mateixa entitat obté el mateix identificador independentment de quina font o sessió l'hagi introduït.

**Només per afegir.** Cada fet es remunta a la seva font. Les correccions creen registres nous i és possible la recuperació.

**Eina transversal mitjançant MCP.** Es pot accedir a una capa de memòria des de qualsevol client MCP: Cursor, ChatGPT, Claude o Claude Code. Les mateixes dades i els mateixos identificadors estan disponibles a tot arreu.

**Local-primer.** Totes les dades es troben en fitxers SQLite i locals. No hi ha dependència del núvol ni telemetria. Podeu comprovar tot el que fa el sistema.

[Neotoma](https://neotoma.io) és aviat. És una [versió per a desenvolupadors](/posts/neotoma-developer-release): només local, primer CLI, amb resolució d'entitats heurístiques, evolució manual d'esquemes i sense interfície d'usuari web. El que proporciona és el contracte, i l'argument és que aquest contracte és necessari per als agents que gestionen l'estat en curs, i que la recuperació per si sola no el pot proporcionar.

El camp convergeix en la memòria estructurada. La pregunta és qui construeix la capa en la qual confieu amb les vostres dades i quines garanties ofereixen. Vull que aquesta capa s'estructuri des del principi, no es fixi després del fet. Local-primer, obert, inspeccionable i sota el control de l'usuari.