[Boris Cherny (creador de Claude Code a Anthropic) va tuitejar](https://x.com/bcherny/status/2017824286489383315) que Claude Code va traslladar de RAG més la base de dades de vectors locals a la cerca agentica. Funciona millor, va dir, i és més senzill, amb menys problemes de seguretat i privadesa. Altres eines prenen un camí diferent. El cursor, per exemple, utilitza incrustacions basades en núvol per indexar la base de codi i cercar per similitud semàntica.

Així doncs, tenim almenys dos paradigmes de recuperació: la cerca basada en incrustació (preindexada, semblança de vectors) i la cerca agentica (ús d'eines sota demanda). No són els mateixos. Cadascun té diferents compensacions. Totes dues són estratègies de recuperació. Una capa de veritat és una altra cosa. Persisteix les entitats canòniques, manté la procedència i admet consultes deterministes. Es tracta d'estat, no de recuperació. Aquesta publicació compara una capa de veritat amb els dos models de recuperació. També lliga als límits que he tocat quan confio només en la recuperació.

## On he arribat als límits

Utilitzo Cursor com a interfície central per a tots els meus fluxos de treball digitals, no només per a la codificació. Triatge de correu electrònic, gestió de tasques, consultes financeres, planificació de continguts, transaccions, contactes. Tots funcionen a través del mateix agent amb accés al mateix dipòsit. La cerca d'agent entre fitxers sovint funciona bé. L'agent troba context, infereix connexions i fa les coses.

Però he arribat als límits. L'agent dedueix; no garanteix. Aquí teniu el que sembla:

- **Conjunts de dades grans, record incomplet.** La cerca sota demanda perd coses o trunca milers de transaccions o centenars de contactes. La recuperació torna a derivar cada vegada. No hi ha cap botiga estructurada per consultar resultats complets.
- **Sobreescriure irrecuperables.** Un agent sobreescriu un contacte o una tasca i l'estat anterior ha desaparegut. Cap retrocés. Les escriptures estan al seu lloc. No hi ha cap rastre de versions ni només per afegir-hi per rastrejar i retrocedir.
- **No hi ha accés entre eines.** No puc utilitzar els mateixos registres de Claude.ai o ChatGPT. La recuperació està vinculada al proveïdor.
- **Respostes no reproduïbles.** Mateixa pregunta, resposta diferent. No puc reproduir un resultat per a verificació o depuració. La recuperació és no determinista.
- **No hi ha traçabilitat.** Quan l'agent dóna un número o una reclamació incorrectes, no puc rastrejar-lo fins als fitxers o registres d'origen. La recuperació no té cap procedència.
- **Identitat canònica inestable.** L'agent pot tractar "Acme Corp" i "ACME CORP" com a iguals en una sessió i diferents en la següent. La recuperació es torna a inferir cada vegada. No hi ha identificadors canònics persistents ni regles de combinació.

## Dos paradigmes de recuperació, un paradigma d'estat

La cerca basada en incrustació i la cerca agentica reben informació a un agent. No són els mateixos. La cerca basada en incrustacions (p. ex. Cursor) preindexa un corpus i respon mitjançant la similitud vectorial. L'índex es pot allotjar i actualitzar al núvol. La cerca d'agent (per exemple, Claude Code) omet un índex persistent i utilitza eines per cercar i llegir sota demanda. Diferents implementacions, diferents compromisos: privadesa, obsolet, senzillesa.

El que comparteixen és la recuperació. L'agent troba coses en el moment de la consulta. Una capa de veritat no és la recuperació. És un estat persistent i estructurat: entitats canòniques, procedència, consultes deterministes.

Estem comparant un paradigma d'estat (capa de veritat) amb dos paradigmes de recuperació (basat en incrustació i agentic). La taula següent els alinea els tres. Quan ambdues columnes de recuperació comparteixen un límit (per exemple, sense procedència), això és una similitud entre elles en relació amb una capa de veritat. No és una equació dels dos.

| Domini | Cerca basada en incrustacions | Cerca agent | Capa de la veritat |
|--------|-------------------------|----------------|--------------|
| Recuperació de documents | Similitud preindexada, concordança semàntica | Cerca sota demanda, inferència | Resolució d'entitats, deduplicació, procedència |
| Agregació multifont | L'abast i la frescor de l'índex depenen de la construcció | Cerca en directe entre fonts | Gràfic unificat, fusió determinista |
| Cerca d'entitats | Similitud sobre les incrustacions; sense identificació canònica | Inferència per sessió | Identificadors canònics, fusió basada en regles |
| Consultes de cronologia | Només si està indexat; cap model d'hora nativa | Muntatge sota demanda | Precalculat, controlat per esquemes |
| Procedència i auditoria | Cap | Cap | Pista d'auditoria immutable |
| Multiplataforma | Vinculat al proveïdor/índex | Eines específiques del proveïdor | Les mateixes dades a totes les eines |

Tots dos enfocaments de recuperació optimitzen per a la comoditat i la flexibilitat. Una capa de veritat optimitza la coherència i la verificabilitat.

## El que proporciona una capa de veritat

Una capa de memòria estructurada es construeix al voltant de diferents primitives:

1. **Identitat canònica persistent.** Identificadors d'entitat estables en sessions i eines.
2. **Lògica de fusió determinista.** Combinació d'observacions basada en regles, no inferència de LLM per sessió.
3. **Procedència i auditoria.** Llinatge traçable des de la font fins a la resposta.
4. **Idempotència.** Les mateixes entrades donen les mateixes sortides.
5. **La veritat multiplataforma.** La mateixa memòria a ChatGPT, Claude, Cursor.
6. **Model de privadesa clar.** Control d'usuari, sense ús de formació del proveïdor, límits clars de dades.

Aquestes no són millores incrementals respecte a la cerca agentica. Són un disseny diferent. Recuperació i orquestració del millor esforç versus estat verificable i reproduïble. L'elecció depèn del que necessiteu.

## Què pot aproximar la recuperació (agent o basat en incrustacions)

Tres exemples mostren la recuperació (agent o basat en incrustació) aproximant les capacitats anteriors. En cada exemple, l'agent obté alguna cosa que sembla correcte per al moment. En cadascun, apareixen els mateixos límits: no hi ha identitat canònica persistent, ni procedència, ni garantia que la "mateixa consulta" produeixi "el mateix resultat" entre sessions o reconstruccions d'índex. Els exemples següents utilitzen termes agents (eines, cerca sota demanda). La recuperació basada en incrustació pot aproximar els mateixos comportaments mitjançant la cerca semàntica sobre un índex i arriba als mateixos límits.

**Exemple 1: resolució d'entitats amb àmbit de sessió.** L'agent té eines per cercar fitxers, correu electrònic i núvol. Té instruccions per tractar les mencions de la mateixa entitat com una sola. Pregunteu: "Quina és la meva despesa total amb Acme Corp?" L'agent cerca exportacions bancàries, rebuts, factures. Troba que "Acme Corp", "ACME CORP", "Acme Corporation", dedueix quantitats de la mateixa entitat. Sembla una resolució d'entitats per a aquesta consulta i sessió. Què va malament: torna a preguntar demà i el número pot variar. L'agent pot perdre un fitxer (cerca truncada, camí incorrecte) i un recompte insuficient. O pot tractar "Acme Corp" i "Acme Industries" com el mateix i sobrecomptar. No hi ha manera de verificar. Sense rastre d'auditoria, sense identificacions estables. Les diferents sessions poden estar en desacord.

**Exemple 2: muntatge de la línia de temps sota demanda.** L'agent té accés ampli per a fitxers i dates. Pregunteu: "Quines van ser les meves despeses principals el 3T 2024?" L'agent cerca, analitza les dates, fa una llista cronològica, filtra per "majors". Obteniu una resposta semblant a una línia de temps sense un sistema de línia de temps dedicat. Què va malament: "Major" es dedueix cada vegada. Una sessió exclou un article de 500 €. El següent l'inclou. Els documents amb formats de data no estàndard es deixen caure o s'ordenen malament. L'agent pot truncar ("aquí estan els 10 primers") quan n'hi ha 15. La mateixa consulta, resultats diferents, cada vegada.

**Exemple 3: capa de memòria híbrida.** Un proveïdor envia cerca agent i memòria lleugera. L'agent extreu fragments estructurats, els emmagatzema i els recupera més tard. Processa un rebut, emmagatzema `{vendor: "Acme Corp", import: 150, data: "2024-07-15"}`. Una sessió posterior el recupera i es combina amb els resultats de la cerca en directe. Això sembla memòria estructurada. Què va malament: una extracció posterior sobreescriu el fragment. Sense versions, sense rollback. El mateix venedor apareix com "Acme Corp" a la memòria emmagatzemada i "ACME CORP" en una nova cerca. Els duplicats s'acumulen. El proveïdor canvia la funció o l'esquema i els fragments emmagatzemats desapareixen. No hi ha manera de rastrejar un número equivocat fins a la seva font.

En cada exemple, el comportament s'aproxima al que proporciona una capa de veritat. Els límits són inherents a la recuperació. Tant si l'agent utilitza la cerca incrustada com la cerca agentica, encara obteniu l'abast de la sessió i la combinació basada en inferències. Encara no obteniu cap procedència ni garantia multiplataforma. Una capa de veritat s'adreça a aquests per l'estat persistent en lloc de tornar-lo a recuperar.

## Quan la recuperació excel·leix (àntica o basada en incrustació)

**Descobriment exploratori.** "Troba qualsevol cosa a les meves descàrregues o notes sobre l'apartament de Barcelona." No saps on viu ni com es diu. La cerca d'agent entre fitxers, carpetes i formats mostra fragments rellevants. No cal esquema. L'agent dedueix i reuneix.

**Resum ràpid entre fonts.** "Què vam decidir en els tres últims correus electrònics amb el contractista?" Cerca a la safata d'entrada, extreu el fil, resumeix. Una sessió, una resposta. No necessiteu que aquest resum persisteixi o coincideixi exactament la propera vegada.

**Codi ad hoc i recorregut de documents.** "On gestionem els webhooks de Stripe?" Cerca codebase, README, documents interns. La disposició varia segons el repo. La cerca d'agents s'adapta. No cal un gràfic unificat.

**Triatge d'un sol document o d'un sol fil.** "Resumeix aquest PDF" o "Què es pregunta en aquest correu electrònic?" El context està limitat. La inferència és suficient. No hi ha resolució d'entitat ni estat de sessió creuada.

## Quan una capa de veritat sobresurt

**Recuperació completa de grans conjunts de dades.** "Enumereu totes les transaccions amb el proveïdor X dels darrers dos anys". Amb milers de files, la cerca d'agent pot perdre registres, truncar o al·lucinar agregats. Una capa de veritat consulta una botiga estructurada. Obteniu tots els registres coincidents o un recompte precís.

**Coherència entre sessions.** L'agent crea una tasca de seguiment a la primera sessió. Demà obriu una nova sessió. La tasca ha d'estar allà, enllaçada amb el contacte i el correu electrònic adequats. La cerca d'agent no té cap gràfic persistent. Una capa de veritat sí.

**Auditoria i procedència.** "D'on prové aquest número?" Seguiu-lo fins a registres d'origen, dates d'importació i regles de derivació. La cerca agètica retorna respostes inferides. Una capa de veritat retorna respostes amb llinatge.

**Resolució d'entitats a escala.** Centenars de contactes, alguns duplicats (variacions de nom, empreses fusionades). Milers de transaccions que fan referència al mateix proveïdor amb diferents grafies. Una capa de veritat manté identificadors canònics i regles de fusió. La cerca d'agent torna a inferir cada sessió i pot estar en desacord.

**Reproducció determinista.** La mateixa consulta, el mateix resultat, cada vegada. És crític per a la presentació d'informes, el compliment o la depuració. La cerca agentica és no determinista. Una capa de veritat és idempotent.

**Recuperació d'escriptures incorrectes.** Un agent sobreescriu un contacte, fusiona dues tasques en una o "corregeix" una transacció basant-se en una inferència incorrecta. Amb la cerca agentica i les escriptures directes de fitxers, l'estat anterior ha desaparegut. Sense desfer. Una capa de veritat utilitza escriptures només per apèndix o versionades. Podeu rastrejar el que ha canviat i retrocedir. Les mutacions són operacions explícites, no sobreescritures silencioses.

## Per què importa la distinció

La recuperació (basada en incrustació o agentic) està vinculada a la sessió. Per si mateix, no us proporciona una identitat persistent, una procedència o una consistència entre sessions. El seu valor és l'accés flexible i sota demanda. El valor d'una capa de veritat és una veritat persistent, entre sessions. La resolució determinista i auditable d'entitats és difícil. Ni la similitud incrustada ni la cerca agentica ad hoc són equivalents. Els agents allotjats pel proveïdor s'enfronten a incentius que entren en conflicte amb la memòria controlada per l'usuari i la privadesa primer. La seva memòria i les seves eines solen ser específiques del producte.

El tuit de Cherny reflecteix un canvi real. RAG més vector DB era complex i tenia implicacions de privadesa. Recuperació simplificada de la cerca agentica per a Claude Code. El cursor i altres prenen un camí de recuperació diferent (incrustacions de núvol). Tots dos paradigmes de recuperació resolen "com troba l'agent les coses?" Cap dels dos soluciona "com aconseguim una identitat, procedència i verificació estables?" Una capa de veritat s'adreça a aquest últim. Les capes de recuperació i d'estat coexistiran. Solucionen diferents problemes.

## El que estic construint

Estic construint [Neotoma](https://github.com/markmhendrickson/neotoma), una capa de memòria estructurada que adopta l'enfocament de la capa de veritat: resolució d'entitats, línies de temps, procedència, determinisme, multiplataforma mitjançant MCP. L'estic provant a la meva pròpia pila d'agents per veure on són importants aquests primitius a la pràctica. La cerca basada en incrustació i la cerca agentica són dues estratègies de recuperació. Tampoc us proporciona una identitat persistent o un estat verificable. Una capa de veritat sí. Estic construint aquest últim.