O Neotoma é uma camada de memória estruturada para agentes de IA. Ele trata os dados pessoais da mesma forma que os sistemas de produção tratam o estado: entidades digitadas, IDs estáveis, proveniência completa, consultas determinísticas. Esta versão do desenvolvedor já está disponível. Instale via npm, conecte suas ferramentas de IA via MCP e execute-as em sua máquina.

Documentos e configuração: [neotoma.io](https://neotoma.io). Repositório: [github.com/markmhendrickson/neotoma](https://github.com/markmhendrickson/neotoma).

## O problema

Passei o ano passado executando fluxos de trabalho por meio de agentes de IA: e-mail, tarefas, finanças, contatos, conteúdo. Os agentes são capazes. O problema é a confiança.

A memória muda implicitamente. Desvios de contexto. O agente dá uma resposta diferente para a mesma pergunta em uma nova sessão. Ele substitui um contato e o estado anterior desaparece. Não consigo rastrear um número errado até sua origem. Não posso usar os mesmos registros de uma ferramenta diferente.

Estes não são casos extremos. Eles aparecem assim que os agentes lidam com o estado contínuo: tarefas, transações, compromissos, relacionamentos. Quanto mais delego, mais nítidos ficam os limites.

O que continua quebrando não é a inteligência. É confiança. Escrevi sobre isso pela primeira vez em [Construindo uma camada de verdade para memória de agente persistente](/posts/truth-layer-agent-memory).

## Onde a memória atual é insuficiente

A maior parte da memória do agente hoje é de recuperação: RAG, pesquisa de agente, similaridade de incorporação, memória controlada pelo provedor. A recuperação funciona para exploração e perguntas pontuais. Ele desmorona devido ao estado contínuo.

[RAG é preenchido com resultados redundantes](/posts/why-agent-memory-needs-more-than-rag) quando a memória do agente é um fluxo coerente e limitado. Top-k retorna repetição em vez do que você precisa. Poda de cadeias de evidências de fragmentos. A similaridade ignora a estrutura.

A memória do provedor (ChatGPT Memory, Claude Projects) é apenas para conversação e vinculada à plataforma. É opaco, não tem origem ou reversão e não funciona em várias ferramentas. Você não pode consultá-lo de forma determinística ou rastrear um fato até sua origem.

[Agentic search](/posts/agentic-search-and-the-truth-layer) re-infere cada sessão. Nenhuma identidade canônica persistente, nenhuma garantia de que a mesma pergunta produza o mesmo resultado. Funciona para codificação e exploração. Para tarefas, contatos, transações e eventos, você precisa da mesma resposta na próxima semana, conjuntos completos e trilhas de auditoria. A recuperação não oferece isso.

A [divisão útil](/posts/agent-memory-truth-problem) é recuperação versus estado estruturado, não gráfico versus remarcação. A recuperação otimiza a relevância e a descoberta. O estado estruturado otimiza a consistência, integridade e procedência. Os principais projectos (Zep, Mem0, Letta, LangMem) estão a adicionar estrutura, mas a convergência total enfrenta barreiras arquitectónicas. Quando os agentes agem em seu nome, você precisa do último.

Escrevi separadamente sobre as [seis tendências estruturais](/posts/six-agentic-trends-betting-on) que tornam essa lacuna ainda maior ao longo do tempo: agentes se tornando stateful, erros sendo precificados, plataformas permanecendo opacas, ferramentas permanecendo fragmentadas.

## O que é Neotoma

Neotoma é uma camada de verdade: o substrato de memória que fica sob seus agentes. Os agentes continuam fazendo o que fazem (navegar, escrever, chamar ferramentas). Neotoma é dono do estado que lê e escreve.

Você carrega documentos ou compartilha informações em conversas com agentes. Neotoma resolve entidades entre fontes. Pessoas, empresas, tarefas, faturas, eventos obtêm IDs estáveis. Todo fato remonta à sua origem. Os cronogramas vêm de campos de data. As correções preservam o histórico em vez de substituí-lo.

O gráfico é independente de execução. Modela o que existe, não como o trabalho é realizado. Os mesmos dados estão disponíveis no Cursor, ChatGPT, Claude ou qualquer cliente MCP. Quando você [troca de ferramenta](/posts/openclaw-and-the-truth-layer), a memória não flutua.

Não é um aplicativo de anotações ou um “segundo cérebro”. Memória não controlada pelo provedor. Não é um armazenamento de vetores ou camada RAG. Não é um agente autônomo. É o primeiro estado estruturado do esquema que você controla.

## O que esta versão inclui

Esta versão do desenvolvedor expõe o contrato principal:

- **CLI** para humanos.
- **MCP** para agentes (ChatGPT, Claude, Cursor, Claude Code); os agentes usam o MCP como backup.
- **OpenAPI** como a única fonte da verdade.

Funcionalidade concreta:

- **Armazenamento de caminho duplo.** Faça upload de arquivos ou grave dados estruturados de conversas de agentes em um gráfico.
- **Resolução de entidade.** IDs canônicos baseados em hash unificam a mesma entidade em todas as fontes.
- **Registro de esquema.** Entidades digitadas e relacionamentos digitados. Os esquemas evoluem à medida que os dados evoluem.
- **Cronogramas.** Geração automática de cronograma a partir de campos de data em entidades.
- **Proveniência completa.** Cada registro remonta à sua origem. As correções criam novas observações, não sobrescrevem.
- **Recuperação estrutural.** Consulta por tipo de entidade, ID, relacionamento ou intervalo de tempo. Vizinhança gráfica para raciocínio entre entidades.

Não há aplicativo da web. Isto é infraestrutura, não um produto. As interfaces são CLI, MCP e API.

## Princípios e por que priorizar o local

Três fundações moldam o design:

**Privacidade em primeiro lugar.** Seus dados permanecem em sua máquina. Somente armazenamento local: SQLite e arquivos locais. Sem dependência de nuvem. Nunca usado para treinamento. Você controla o que entra e o que fica.

**Determinístico.** Mesma entrada, mesma saída. IDs de entidade baseados em hash. Extração do primeiro esquema. Nenhum LLM no caminho crítico para armazenamento ou recuperação. Proveniência completa em cada registro.

**Plataforma cruzada.** Uma camada de memória entre ferramentas. ChatGPT, Claude, Cursor e Claude Code se conectam via MCP. Sem dependência de provedor. Troque de ferramenta e a memória permanece a mesma.

Esta versão é apenas local por design. A confiança começa com controle. Antes de adicionar infraestrutura remota, o contrato e as garantias precisam ser sólidos. Somente local significa que você pode verificar tudo o que o sistema faz. Esse é o ponto de partida certo para uma camada que afirma ser confiável.

## Para quem é isso

Desenvolvedores e criadores de agentes confortáveis com os fluxos de trabalho CLI-first. Pessoas que constroem ou operam sistemas agentes que precisam de memória persistente entre sessões e ferramentas. Qualquer pessoa que trate dados pessoais como infraestrutura de produção.

Não para (ainda): usuários que priorizam a interface do usuário, anotações casuais ou qualquer pessoa que espera garantias de estabilidade hoje. Mudanças significativas devem ser esperadas. Esta versão existe para testar a pressão das fundações.

## Instale e conecte

```bash
npm instalar -g neotoma # instalar
neotoma init # inicializa
neotoma # inicia sessão interativa
```

Configuração completa, documentação da API, configuração do MCP e referência de esquema: [neotoma.io](https://neotoma.io).

Repositório: [github.com/markmhendrickson/neotoma](https://github.com/markmhendrickson/neotoma).

## Conclusões

- **Privacidade em primeiro lugar.** Seus dados em sua máquina; somente local, sem nuvem, nunca usado para treinamento.
- **CLI, MCP, OpenAPI.** Um contrato para humanos e agentes.
- **Estado estruturado com esquema primeiro.** Entidades digitadas, proveniência completa, consultas determinísticas.

## Experimente, quebre, me diga

Gostaria da sua ajuda para endurecer isso. Execute-o. Acerte casos extremos. Relate bugs, comportamento confuso ou peças faltantes.

O feedback que mais valorizo: onde as garantias falham, onde o contrato atrapalha, onde o design faz a troca errada. Abra problemas no GitHub, envie patches ou inicie uma discussão.

Esta versão é difícil de propósito. A confiabilidade vem do uso real e do feedback real, não do polimento isolado.