[Boris Cherny (creador de Claude Code en Anthropic) tuiteó](https://x.com/bcherny/status/2017824286489383315) que Claude Code pasó de RAG más base de datos vectorial local a búsqueda agente. Funciona mejor, dijo, y es más simple, con menos problemas relacionados con la seguridad y la privacidad. Otras herramientas toman un camino diferente. Cursor, por ejemplo, utiliza incrustaciones basadas en la nube para indexar el código base y buscar por similitud semántica.

Así que tenemos al menos dos paradigmas de recuperación: búsqueda basada en incrustaciones (preindexada, similitud de vectores) y búsqueda agente (uso de herramientas bajo demanda). No son lo mismo. Cada uno tiene diferentes compensaciones. Ambas son estrategias de recuperación. Una capa de verdad es otra cosa. Mantiene entidades canónicas, mantiene la procedencia y admite consultas deterministas. Se trata de estado, no de recuperación. Esta publicación compara una capa de verdad con ambos modelos de recuperación. También se relaciona con los límites que he alcanzado cuando dependo únicamente de la recuperación.

## Dónde he alcanzado los límites

Utilizo Cursor como mi interfaz central para todos mis flujos de trabajo digitales, no solo para codificación. Clasificación de correo electrónico, gestión de tareas, consultas financieras, planificación de contenidos, transacciones, contactos. Todos corren a través del mismo agente con acceso al mismo repositorio. La búsqueda agente entre archivos suele funcionar bien. El agente encuentra contexto, infiere conexiones y hace las cosas.

Pero he llegado a límites. El agente infiere; no garantiza. Así es como se ve:

- **Grandes conjuntos de datos, recuperación incompleta.** La búsqueda bajo demanda omite elementos o se trunca en miles de transacciones o cientos de contactos. La recuperación se vuelve a derivar cada vez. No existe una tienda estructurada para consultar los resultados completos.
- **Sobrescrituras irrecuperables.** Un agente sobrescribe un contacto o tarea y el estado anterior desaparece. Sin retroceso. Las escrituras están en su lugar. No hay control de versiones ni seguimiento de solo anexos para rastrear y revertir.
- **Sin acceso a varias herramientas.** No puedo usar los mismos registros de Claude.ai o ChatGPT. La recuperación está vinculada al proveedor.
- **Respuestas no reproducibles.** Misma pregunta, diferente respuesta. No puedo reproducir un resultado para verificación o depuración. La recuperación no es determinista.
- **Sin trazabilidad.** Cuando el agente proporciona un número o reclamo incorrecto, no puedo rastrearlo hasta los archivos o registros de origen. La recuperación no tiene procedencia.
- **Identidad canónica inestable.** El agente puede tratar a "Acme Corp" y "ACME CORP" como iguales en una sesión y diferentes en la siguiente. La recuperación vuelve a inferir cada vez. No hay identificaciones canónicas persistentes ni reglas de fusión.

## Dos paradigmas de recuperación, un paradigma de estado

La búsqueda basada en incrustaciones y la búsqueda de agentes brindan información a un agente. No son lo mismo. La búsqueda basada en incrustaciones (por ejemplo, Cursor) preindexa un corpus y responde mediante similitud de vectores. El índice puede alojarse en la nube y actualizarse. La búsqueda agente (por ejemplo, Claude Code) omite un índice persistente y utiliza herramientas para buscar y leer bajo demanda. Diferentes implementaciones, diferentes compensaciones: privacidad, obsolescencia, simplicidad.

Lo que comparten es la recuperación. El agente encuentra cosas en el momento de la consulta. Una capa de verdad no es recuperación. Es un estado persistente y estructurado: entidades canónicas, procedencia, consultas deterministas.

Estamos comparando un paradigma de estado (capa de verdad) con dos paradigmas de recuperación (basado en incrustación y agente). La siguiente tabla alinea los tres. Cuando ambas columnas de recuperación comparten un límite (por ejemplo, sin procedencia), se trata de una similitud entre ellas en relación con una capa de verdad. No es una ecuación de los dos.

| Dominio | Búsqueda basada en incrustaciones | Búsqueda agente | Capa de verdad |
|--------|------------------------|----------------|-------------|
| Recuperación de documentos | Similitud preindexada, coincidencia semántica | Búsqueda bajo demanda, inferencia | Resolución de entidades, deduplicación, procedencia |
| Agregación de fuentes múltiples | El alcance y la frescura del índice dependen de su construcción | Búsqueda en vivo entre fuentes | Gráfico unificado, fusión determinista |
| Búsqueda de entidades | Similitud sobre incrustaciones; sin identificación canónica | Inferencia por sesión | ID canónicos, fusión basada en reglas |
| Consultas de línea de tiempo | Sólo si está indexado; sin modelo de tiempo nativo | Montaje bajo demanda | Precalculado, basado en esquemas |
| Procedencia y auditoría | Ninguno | Ninguno | Pista de auditoría inmutable |
| Multiplataforma | Vinculado al proveedor/índice | Herramientas específicas del proveedor | Mismos datos en todas las herramientas |

Ambos enfoques de recuperación optimizan la conveniencia y la flexibilidad. Una capa de verdad optimiza la coherencia y la verificabilidad.

## Qué proporciona una capa de verdad

Una capa de memoria estructurada se construye alrededor de diferentes primitivas:

1. **Identidad canónica persistente.** ID de entidad estables en todas las sesiones y herramientas.
2. **Lógica de fusión determinista.** Combinación de observaciones basada en reglas, no inferencia LLM por sesión.
3. **Procedencia y auditoría.** Linaje rastreable desde la fuente hasta la respuesta.
4. **Idempotencia.** Las mismas entradas producen los mismos resultados.
5. **Verdad multiplataforma.** Misma memoria en ChatGPT, Claude, Cursor.
6. **Modelo de privacidad claro.** Control de usuario, sin uso de capacitación de proveedores, límites de datos claros.

Estas no son mejoras incrementales con respecto a la búsqueda agente. Son un diseño diferente. Recuperación y orquestación con el mejor esfuerzo versus estado verificable y reproducible. La elección depende de lo que necesites.

## ¿Qué recuperación puede aproximarse (agente o basada en incrustación)?

Tres ejemplos muestran una recuperación (agente o basada en incrustación) que se aproxima a las capacidades anteriores. En cada ejemplo, el agente obtiene algo que parece adecuado para el momento. En cada uno, aparecen los mismos límites: no hay identidad canónica persistente, no hay procedencia, no hay garantía de que "la misma consulta" produzca el "mismo resultado" entre sesiones o reconstrucciones de índice. Los ejemplos siguientes utilizan términos agentes (herramientas, búsqueda bajo demanda). La recuperación basada en incrustaciones puede aproximarse a los mismos comportamientos mediante la búsqueda semántica en un índice y alcanza los mismos límites.

**Ejemplo 1: resolución de entidades en el ámbito de la sesión.** El agente tiene herramientas para buscar archivos, correo electrónico y la nube. Tiene instrucciones para tratar las menciones de la misma entidad como una sola. Usted pregunta: "¿Cuál es mi gasto total en Acme Corp?" El agente busca exportaciones bancarias, recibos, facturas. Encuentra "Acme Corp", "ACME CORP", "Acme Corporation", infiere la misma entidad, suma los montos. Parece una resolución de entidad para esta consulta y sesión. Qué sale mal: vuelve a preguntar mañana y el número puede diferir. Es posible que el agente pierda un archivo (búsqueda truncada, ruta incorrecta) y no cuente correctamente. O puede tratar a "Acme Corp" y "Acme Industries" como lo mismo y contar en exceso. No hay forma de verificarlo. Sin seguimiento de auditoría ni identificaciones estables. Diferentes sesiones pueden no estar de acuerdo.

**Ejemplo 2: ensamblaje del cronograma bajo demanda.** El agente tiene amplio acceso a archivos y fechas. Usted pregunta: "¿Cuáles fueron mis principales gastos en el tercer trimestre de 2024?" El agente busca, analiza fechas, elabora una lista cronológica y filtra por "principal". Obtiene una respuesta similar a una línea de tiempo sin un sistema de línea de tiempo dedicado. Qué sale mal: "Mayor" se infiere cada vez. Una sesión excluye un artículo de 500 €. El siguiente lo incluye. Los documentos con formatos de fecha no estándar se caen o se desordenan. El agente puede truncar ("aquí están los 10 primeros") cuando eran 15. La misma consulta, resultados diferentes, cada vez.

**Ejemplo 3: capa de memoria híbrida.** Un proveedor incluye búsqueda agente además de memoria liviana. El agente extrae fragmentos estructurados, los almacena y los recupera más tarde. Procesa un recibo, almacena `{proveedor: "Acme Corp", monto: 150, fecha: "2024-07-15"}`. Una sesión posterior recupera esto y lo combina con los resultados de búsqueda en vivo. Eso parece memoria estructurada. Qué sale mal: una extracción posterior sobrescribe el fragmento. Sin versiones, sin reversión. El mismo proveedor aparece como "Acme Corp" en la memoria almacenada y "ACME CORP" en una nueva búsqueda. Se acumulan duplicados. El proveedor cambia la función o el esquema y los fragmentos almacenados desaparecen. No hay forma de rastrear un número incorrecto hasta su origen.

En cada ejemplo, el comportamiento se aproxima a lo que proporciona una capa de verdad. Los límites son inherentes a la recuperación. Ya sea que el agente utilice búsqueda incrustada o búsqueda agencial, aún obtendrá el alcance de la sesión y la fusión basada en inferencias. Aún no obtienes procedencia ni garantía multiplataforma. Una capa de verdad los aborda mediante un estado persistente en lugar de volver a recuperarlo.

## Cuando la recuperación sobresale (agente o basada en incrustación)

**Descubrimiento exploratorio.** "Encuentra cualquier cosa en mis descargas o notas sobre el apartamento en Barcelona". No sabes dónde vive ni cómo se llama. La búsqueda agente en archivos, carpetas y formatos muestra fragmentos relevantes. No se requiere esquema. El agente infiere y ensambla.

**Resumen rápido entre fuentes.** "¿Qué decidimos en los últimos tres correos electrónicos con el contratista?" Buscar en la bandeja de entrada, extraer hilo, resumir. Una sesión, una respuesta. No es necesario que ese resumen persista o coincida exactamente la próxima vez.

**Recorrido de documentos y códigos ad hoc.** ​​"¿Dónde manejamos los webhooks de Stripe?" Buscar código base, README, documentos internos. El diseño varía según el repositorio. La búsqueda agente se adapta. No se necesita un gráfico unificado.

**Clasificación de un solo documento o de un solo subproceso.** "Resumir este PDF" o "¿Cuál es la pregunta en este correo electrónico?" El contexto está limitado. La inferencia es suficiente. Sin resolución de entidad ni estado de sesiones cruzadas.

## Cuando una capa de verdad sobresale

**Retirada completa de grandes conjuntos de datos.** "Enumere todas las transacciones con el proveedor X en los últimos dos años". Con miles de filas, la búsqueda agente puede omitir registros, truncar o alucinar agregados. Una capa de verdad consulta una tienda estructurada. Obtiene todos los registros coincidentes o un recuento preciso.

**Coherencia entre sesiones.** El agente crea una tarea de seguimiento en la sesión uno. Abres una nueva sesión mañana. La tarea debe estar ahí, vinculada al contacto y al correo electrónico correctos. La búsqueda agente no tiene un gráfico persistente. Una capa de verdad sí lo hace.

**Auditoría y procedencia.** "¿De dónde viene este número?" Rastreelo hasta registros de origen, fechas de importación y reglas de derivación. La búsqueda agente devuelve respuestas inferidas. Una capa de verdad devuelve respuestas con linaje.

**Resolución de entidades a escala.** Cientos de contactos, algunos duplicados (variaciones de nombres, empresas fusionadas). Miles de transacciones que hacen referencia al mismo proveedor con diferentes grafías. Una capa de verdad mantiene identificaciones canónicas y reglas de fusión. La búsqueda agente vuelve a inferir cada sesión y puede no estar de acuerdo.

**Repetición determinista.** La misma consulta, el mismo resultado, siempre. Es fundamental para la generación de informes, el cumplimiento o la depuración. La búsqueda agente no es determinista. Una capa de verdad es idempotente.

**Recuperabilidad de malas escrituras.** Un agente sobrescribe un contacto, fusiona dos tareas en una o "corrige" una transacción basándose en una inferencia incorrecta. Con la búsqueda agente y la escritura directa de archivos, el estado anterior desaparece. Sin deshacer. Una capa de verdad utiliza escrituras versionadas o de solo anexo. Puede rastrear lo que cambió y retroceder. Las mutaciones son operaciones explícitas, no sobrescrituras silenciosas.

## Por qué es importante la distinción

La recuperación (basada en incrustación o agente) está vinculada a la sesión. Por sí solo no proporciona una identidad persistente, procedencia o coherencia entre sesiones. Su valor es el acceso flexible y bajo demanda. El valor de una capa de verdad es la verdad persistente entre sesiones. La resolución de entidades determinista y auditable es difícil. Ni la inclusión de similitud ni la búsqueda agencial ad hoc son equivalentes. Los agentes alojados por proveedores enfrentan incentivos que entran en conflicto con la memoria controlada por el usuario y que prioriza la privacidad. Su memoria y herramientas tienden a ser específicas del producto.

El tuit de Cherny refleja un cambio real. RAG plus vector DB era complejo y tenía implicaciones para la privacidad. Búsqueda agente de recuperación simplificada de Claude Code. El cursor y otros toman una ruta de recuperación diferente (incrustaciones en la nube). Ambos paradigmas de recuperación resuelven "¿cómo encuentra las cosas el agente?" Ninguno de los dos resuelve "¿cómo conseguimos una identidad, procedencia y verificación estables?" Una capa de verdad apunta a esto último. Las capas de recuperación y de estado coexistirán. Resuelven diferentes problemas.

## Lo que estoy construyendo

Estoy construyendo [Neotoma](https://github.com/markmhendrickson/neotoma), una capa de memoria estructurada que adopta el enfoque de la capa de verdad: resolución de entidades, cronogramas, procedencia, determinismo, multiplataforma a través de MCP. Lo estoy probando en mi propia pila de agentes para ver dónde importan estas primitivas en la práctica. La búsqueda basada en incrustaciones y la búsqueda agencial son dos estrategias de recuperación. Ninguno de los dos le brinda una identidad persistente o un estado verificable. Una capa de verdad sí lo hace. Estoy construyendo este último.