[Boris Cherny (criador do Claude Code na Anthropic) tuitou](https://x.com/bcherny/status/2017824286489383315) que Claude Code mudou do RAG mais o banco de dados de vetor local para a pesquisa de agente. Funciona melhor, disse ele, e é mais simples, com menos problemas de segurança e privacidade. Outras ferramentas seguem um caminho diferente. O Cursor, por exemplo, usa embeddings baseados em nuvem para indexar a base de código e pesquisar por similaridade semântica.

Portanto, temos pelo menos dois paradigmas de recuperação: pesquisa baseada em incorporação (pré-indexada, similaridade vetorial) e pesquisa agente (uso de ferramenta sob demanda). Eles não são iguais. Cada um tem compensações diferentes. Ambas são estratégias de recuperação. Uma camada de verdade é outra coisa. Ele persiste entidades canônicas, mantém a proveniência e oferece suporte a consultas determinísticas. É uma questão de estado, não de recuperação. Esta postagem compara uma camada de verdade com ambos os modelos de recuperação. Também vincula os limites que atingi ao confiar apenas na recuperação.

## Onde atingi limites

Eu uso o Cursor como minha interface central para todos os meus fluxos de trabalho digitais, não apenas para codificação. Triagem de e-mail, gerenciamento de tarefas, consultas financeiras, planejamento de conteúdo, transações, contatos. Todos eles são executados pelo mesmo agente com acesso ao mesmo repositório. A pesquisa agente em arquivos geralmente funciona bem. O agente encontra contexto, infere conexões e realiza tarefas.

Mas eu atingi limites. O agente infere; isso não garante. Aqui está o que parece:

- **Grandes conjuntos de dados, recuperação incompleta.** A pesquisa sob demanda perde itens ou trunca milhares de transações ou centenas de contatos. A recuperação é derivada novamente a cada vez. Não há armazenamento estruturado para consultar resultados completos.
- **Substituições irrecuperáveis.** Um agente substitui um contato ou tarefa e o estado anterior desaparece. Sem reversão. As gravações estão no local. Não há controle de versão ou trilha apenas de acréscimo para rastrear e reverter.
- **Sem acesso entre ferramentas.** Não posso usar os mesmos registros de Claude.ai ou ChatGPT. A recuperação é vinculada ao provedor.
- **Respostas não reproduzíveis.** Mesma pergunta, resposta diferente. Não consigo reproduzir um resultado para verificação ou depuração. A recuperação não é determinística.
- **Sem rastreabilidade.** Quando o agente fornece um número ou reclamação errada, não consigo rastreá-la até os arquivos ou registros de origem. A recuperação não tem proveniência.
- **Identidade canônica instável.** O agente pode tratar "Acme Corp" e "ACME CORP" como iguais em uma sessão e diferentes na próxima. A recuperação é reinferida a cada vez. Não há IDs canônicos persistentes ou regras de mesclagem.

## Dois paradigmas de recuperação, um paradigma de estado

A pesquisa baseada em incorporação e a pesquisa de agente fornecem informações a um agente. Eles não são iguais. A pesquisa baseada em incorporação (por exemplo, Cursor) pré-indexa um corpus e responde por meio de similaridade vetorial. O índice pode ser hospedado na nuvem e atualizado. A pesquisa agente (por exemplo, Claude Code) ignora um índice persistente e usa ferramentas para pesquisar e ler sob demanda. Diferentes implementações, diferentes compensações: privacidade, desatualização, simplicidade.

O que eles compartilham é a recuperação. O agente encontra coisas no momento da consulta. Uma camada de verdade não é recuperação. É um estado persistente e estruturado: entidades canônicas, proveniência, consultas determinísticas.

Estamos comparando um paradigma de estado (camada de verdade) a dois paradigmas de recuperação (baseado em incorporação e agente). A tabela abaixo alinha todos os três. Onde ambas as colunas de recuperação compartilham um limite (por exemplo, sem proveniência), há uma semelhança entre elas em relação a uma camada de verdade. Não é uma equação dos dois.

| Domínio | Pesquisa baseada em incorporação | Pesquisa agente | Camada de verdade |
|--------|-------------|----------------|-------------|
| Recuperação de documentos | Similaridade pré-indexada, correspondência semântica | Pesquisa sob demanda, inferência | Resolução de entidade, desduplicação, proveniência |
| Agregação multifonte | O escopo e a atualização do índice dependem da construção | Pesquisa ao vivo entre fontes | Gráfico unificado, mesclagem determinística |
| Pesquisa de entidade | Semelhança sobre incorporações; sem ID canônico | Inferência por sessão | IDs canônicos, mesclagem baseada em regras |
| Consultas de linha do tempo | Somente se indexado; nenhum modelo de tempo nativo | Montagem sob demanda | Pré-computado, orientado por esquema |
| Proveniência e auditoria | Nenhum | Nenhum | Trilha de auditoria imutável |
| Plataforma cruzada | Vinculado ao provedor/índice | Ferramentas específicas do provedor | Os mesmos dados em todas as ferramentas |

Ambas as abordagens de recuperação otimizam a conveniência e a flexibilidade. Uma camada verdadeira otimiza a consistência e a verificabilidade.

## O que uma camada de verdade fornece

Uma camada de memória estruturada é construída em torno de diferentes primitivos:

1. **Identidade canônica persistente.** IDs de entidade estáveis em sessões e ferramentas.
2. **Lógica de mesclagem determinística.** Combinação de observações baseada em regras, não inferência LLM por sessão.
3. **Proveniência e auditoria.** Linhagem rastreável da fonte até a resposta.
4. **Idempotência.** Mesmas entradas produzem as mesmas saídas.
5. **Verdade entre plataformas.** Mesma memória no ChatGPT, Claude, Cursor.
6. **Modelo de privacidade claro.** Controle do usuário, sem uso de treinamento do provedor, limites de dados claros.

Estas não são melhorias incrementais em relação à pesquisa de agente. Eles são um design diferente. Recuperação e orquestração de melhor esforço versus estado verificável e reproduzível. A escolha depende do que você precisa.

## O que a recuperação pode aproximar (baseada em agente ou incorporação)

Três exemplos mostram a recuperação (baseada em agente ou incorporação) aproximando-se dos recursos acima. Em cada exemplo, o agente obtém algo que parece adequado para o momento. Em cada um deles, os mesmos limites aparecem: nenhuma identidade canônica persistente, nenhuma procedência, nenhuma garantia de que a “mesma consulta” produza o “mesmo resultado” em sessões ou reconstruções de índice. Os exemplos abaixo usam termos de agente (ferramentas, pesquisa sob demanda). A recuperação baseada em incorporação pode aproximar os mesmos comportamentos por meio de pesquisa semântica em um índice e atingir os mesmos limites.

**Exemplo 1: resolução de entidade no escopo da sessão.** O agente tem ferramentas para pesquisar arquivos, email e nuvem. Possui instruções para tratar menções à mesma entidade como uma só. Você pergunta: “Qual é o meu gasto total com a Acme Corp?” O agente pesquisa exportações bancárias, recibos, faturas. Encontra "Acme Corp", "ACME CORP", "Acme Corporation", infere a mesma entidade, soma os valores. Parece uma resolução de entidade para esta consulta e sessão. O que dá errado: pergunte novamente amanhã e o número pode ser diferente. O agente pode perder um arquivo (pesquisa truncada, caminho errado) e contagem insuficiente. Ou pode tratar "Acme Corp" e "Acme Industries" como iguais e exagerar. Não há como verificar. Sem trilha de auditoria, sem IDs estáveis. Sessões diferentes podem discordar.

**Exemplo 2: montagem de cronograma sob demanda.** O agente tem amplo acesso a arquivos e datas. Você pergunta: “Quais foram minhas principais despesas no terceiro trimestre de 2024?” O agente pesquisa, analisa datas, monta uma lista cronológica, filtra por “maior”. Você obtém uma resposta semelhante a uma linha do tempo, sem um sistema de linha do tempo dedicado. O que dá errado: "Major" é inferido a cada vez. Uma sessão exclui um item de 500€. O próximo inclui isso. Documentos com formatos de data fora do padrão são descartados ou mal ordenados. O agente pode truncar ("aqui estão os 10 primeiros") quando havia 15. A mesma consulta, resultados diferentes, sempre.

**Exemplo 3: Camada de memória híbrida.** Um provedor fornece pesquisa de agente mais memória leve. O agente extrai fragmentos estruturados, armazena-os e recupera-os posteriormente. Ele processa um recibo, armazena `{fornecedor: "Acme Corp", valor: 150, data: "2024-07-15"}`. Uma sessão posterior recupera isso e mescla com os resultados da pesquisa em tempo real. Isso parece memória estruturada. O que dá errado: uma extração posterior substitui o trecho. Sem controle de versão, sem reversão. O mesmo fornecedor aparece como “Acme Corp” na memória armazenada e “ACME CORP” em uma nova pesquisa. As duplicatas se acumulam. O provedor altera o recurso ou esquema e seus snippets armazenados desaparecem. Não há como rastrear um número errado até sua origem.

Em cada exemplo, o comportamento se aproxima do que uma camada de verdade fornece. Os limites são inerentes à recuperação. Independentemente de o agente usar pesquisa incorporada ou pesquisa de agente, você ainda terá escopo de sessão e mesclagem baseada em inferência. Você ainda não obtém procedência nem garantia de plataforma cruzada. Uma camada de verdade aborda isso persistindo o estado em vez de recuperá-lo novamente.

## Quando a recuperação é excelente (baseada em agente ou incorporação)

**Descoberta exploratória.** "Encontre qualquer coisa em meus downloads ou notas sobre o apartamento em Barcelona." Você não sabe onde ele mora ou como se chama. A pesquisa agente em arquivos, pastas e formatos revela trechos relevantes. Nenhum esquema é necessário. O agente infere e monta.

**Resumo rápido entre fontes.** "O que decidimos nos últimos três e-mails com o contratante?" Pesquise na caixa de entrada, extraia o tópico, resuma. Uma sessão, uma resposta. Você não precisa que esse resumo persista ou corresponda exatamente na próxima vez.

**Código ad hoc e travessia de documentos.** "Onde lidamos com webhooks Stripe?" Pesquise codebase, README, documentos internos. O layout varia de acordo com o repositório. A pesquisa Agentic se adapta. Nenhum gráfico unificado é necessário.

**Triagem de documento único ou thread único.** "Resuma este PDF" ou "Qual é a pergunta neste e-mail?" O contexto é limitado. A inferência é suficiente. Nenhuma resolução de entidade ou estado de sessão cruzada.

## Quando uma camada de verdade se destaca

**Recall completo em grandes conjuntos de dados.** "Liste todas as transações com o fornecedor X nos últimos dois anos." Com milhares de linhas, a pesquisa de agente pode perder registros, truncar ou alucinar agregados. Uma camada de verdade consulta uma loja estruturada. Você obtém todos os registros correspondentes ou uma contagem precisa.

**Consistência entre sessões.** O agente cria uma tarefa de acompanhamento na primeira sessão. Você abre uma nova sessão amanhã. A tarefa deve estar lá, vinculada ao contato e e-mail corretos. A pesquisa Agentic não possui gráfico persistente. Uma camada de verdade sim.

**Auditoria e procedência.** "De onde veio esse número?" Rastreie-o até registros de origem, datas de importação e regras de derivação. A pesquisa agente retorna respostas inferidas. Uma camada de verdade retorna respostas com linhagem.

**Resolução de entidades em escala.** Centenas de contatos, algumas duplicatas (variações de nome, empresas fundidas). Milhares de transações referenciando o mesmo fornecedor com grafias diferentes. Uma camada verdadeira mantém IDs canônicos e regras de mesclagem. A pesquisa agente re-infere cada sessão e pode discordar.

**Reprodução determinística.** Mesma consulta, mesmo resultado, sempre. Crítico para relatórios, conformidade ou depuração. A pesquisa agente é não determinística. Uma camada de verdade é idempotente.

**Recuperabilidade de gravações incorretas.** Um agente substitui um contato, mescla duas tarefas em uma ou "corrige" uma transação com base em inferências erradas. Com a pesquisa de agente e gravações diretas de arquivos, o estado anterior desaparece. Não desfazer. Uma camada de verdade usa gravações somente anexadas ou versionadas. Você pode rastrear o que mudou e reverter. As mutações são operações explícitas, não substituições silenciosas.

## Por que a distinção é importante

A recuperação (baseada em incorporação ou agente) é vinculada à sessão. Por si só, ele não fornece identidade persistente, procedência ou consistência entre sessões. Seu valor é o acesso flexível e sob demanda. O valor de uma camada de verdade é a verdade persistente entre sessões. A resolução determinística e auditável da entidade é difícil. Nem a incorporação de similaridade nem a pesquisa agente ad hoc são equivalentes. Os agentes hospedados pelo provedor enfrentam incentivos que entram em conflito com a memória controlada pelo usuário e que prioriza a privacidade. Sua memória e ferramentas tendem a ser específicas do produto.

O tweet de Cherny reflete uma mudança real. O RAG mais o banco de dados vetorial era complexo e tinha implicações de privacidade. Busca simplificada de recuperação simplificada para Claude Code. O cursor e outros seguem um caminho de recuperação diferente (incorporação na nuvem). Ambos os paradigmas de recuperação resolvem "como o agente encontra as coisas?" Nenhum dos dois resolve "como podemos obter identidade, proveniência e verificação estáveis?" Uma camada de verdade visa o último. As camadas de recuperação e de estado coexistirão. Eles resolvem problemas diferentes.

## O que estou construindo

Estou construindo [Neotoma](https://github.com/markmhendrickson/neotoma), uma camada de memória estruturada que adota a abordagem da camada de verdade: resolução de entidade, cronogramas, proveniência, determinismo, plataforma cruzada via MCP. Estou fazendo dogfood em minha própria pilha de agentes para ver onde esses primitivos são importantes na prática. A pesquisa baseada em incorporação e a pesquisa agente são duas estratégias de recuperação. Nenhum deles fornece identidade persistente ou estado verificável. Uma camada de verdade sim. Estou construindo o último.