El Neotoma es una capa de memoria estructurada para agentes de IA. Trata los datos personales de la misma manera que los sistemas de producción tratan el estado: entidades tipificadas, identificaciones estables, procedencia completa, consultas deterministas. Esta versión para desarrolladores ya está disponible. Instálelo a través de npm, conecte sus herramientas de inteligencia artificial a través de MCP y ejecútelo en su máquina.

Documentos y configuración: [neotoma.io](https://neotoma.io). Repositorio: [github.com/markmhendrickson/neotoma](https://github.com/markmhendrickson/neotoma).

## El problema

Pasé el año pasado ejecutando flujos de trabajo a través de agentes de IA: correo electrónico, tareas, finanzas, contactos, contenido. Los agentes son capaces. El problema es la confianza.

La memoria cambia implícitamente. El contexto se desplaza. El agente da una respuesta diferente a la misma pregunta en una nueva sesión. Sobrescribe un contacto y el estado anterior desaparece. No puedo rastrear un número incorrecto hasta su origen. No puedo usar los mismos registros de una herramienta diferente.

Estos no son casos extremos. Aparecen tan pronto como los agentes manejan el estado en curso: tareas, transacciones, compromisos, relaciones. Cuanto más delego, más agudos se vuelven los límites.

Lo que sigue rompiéndose no es la inteligencia. Es confianza. La primera vez que escribí sobre esto en [Construyendo una capa de verdad para la memoria persistente del agente](/posts/truth-layer-agent-memory).

## Donde la memoria actual se queda corta

La mayor parte de la memoria de los agentes hoy en día es recuperación: RAG, búsqueda de agentes, incrustación de similitud, memoria controlada por el proveedor. Trabajos de recuperación para exploración y preguntas puntuales. Se desmorona por el estado actual.

[RAG se llena de resultados redundantes](/posts/why-agent-memory-needs-more-than-rag) cuando la memoria del agente es un flujo coherente y limitado. Top-k devuelve repetición en lugar de lo que necesitas. Fragmentos de poda evidencian cadenas. La similitud ignora la estructura.

La memoria del proveedor (ChatGPT Memory, Claude Projects) es solo para conversaciones y está vinculada a la plataforma. Es opaco, no tiene procedencia ni reversión y no funciona con todas las herramientas. No se puede consultar de forma determinista ni rastrear un hecho hasta su origen.

[Búsqueda agente](/posts/agentic-search-and-the-truth-layer) vuelve a inferir cada sesión. Ninguna identidad canónica persistente, ninguna garantía de que la misma pregunta produzca el mismo resultado. Funciona para codificación y exploración. Para tareas, contactos, transacciones y eventos, necesitará la misma respuesta la próxima semana, conjuntos completos y pistas de auditoría. La recuperación no ofrece eso.

La [división útil](/posts/agent-memory-truth-problem) es recuperación versus estado estructurado, no gráfico versus rebajas. La recuperación optimiza la relevancia y el descubrimiento. El estado estructurado optimiza la coherencia, la integridad y la procedencia. Los proyectos más importantes (Zep, Mem0, Letta, LangMem) están añadiendo estructura, pero la convergencia total enfrenta barreras arquitectónicas. Cuando los agentes actúan en su nombre, necesita esto último.

He escrito por separado sobre las [seis tendencias estructurales](/posts/six-agentic-trends-betting-on) que hacen que esta brecha se amplíe con el tiempo: los agentes se vuelven con estado, los errores reciben un precio, las plataformas permanecen opacas, las herramientas permanecen fragmentadas.

## ¿Qué es el neotoma?

Neotoma es una capa de verdad: el sustrato de la memoria que se encuentra debajo de tus agentes. Los agentes siguen haciendo lo que hacen (navegar, escribir, llamar a herramientas). Neotoma es dueño del estado donde leen y escriben.

Sube documentos o comparte información en conversaciones con agentes. Neotoma resuelve entidades a través de fuentes. Personas, empresas, tareas, facturas y eventos obtienen identificaciones estables. Cada hecho tiene su origen. Las líneas de tiempo provienen de campos de fecha. Las correcciones preservan el historial en lugar de sobrescribirlo.

El gráfico es independiente de la ejecución. Modela lo que existe, no cómo se realiza el trabajo. Los mismos datos están disponibles en Cursor, ChatGPT, Claude o cualquier cliente MCP. Cuando [cambias de herramienta](/posts/openclaw-and-the-truth-layer), la memoria no se desvanece.

No es una aplicación para tomar notas ni un "segundo cerebro". Memoria no controlada por el proveedor. No es una tienda de vectores ni una capa RAG. No es un agente autónomo. Es el estado estructurado de esquema primero el que usted controla.

## Qué incluye esta versión

Esta versión para desarrolladores expone el contrato principal:

- **CLI** para humanos.
- **MCP** para agentes (ChatGPT, Claude, Cursor, Claude Code); Los agentes utilizan MCP como respaldo.
- **OpenAPI** como única fuente de verdad.

Funcionalidad concreta:

- **Almacenamiento de doble ruta.** Cargue archivos o escriba datos estructurados de conversaciones de agentes en un solo gráfico.
- **Resolución de entidad.** Los ID canónicos basados ​​en hash unifican la misma entidad en todas las fuentes.
- **Registro de esquemas.** Entidades tipificadas y relaciones tipificadas. Los esquemas evolucionan a medida que lo hacen los datos.
- **Líneas de tiempo.** Generación automática de líneas de tiempo a partir de campos de fecha entre entidades.
- **Procedencia completa.** Cada registro se remonta a su fuente. Las correcciones crean nuevas observaciones, no sobrescriben.
- **Recuperación estructural.** Consulta por tipo de entidad, ID, relación o rango de tiempo. Vecindad gráfica para razonamiento entre entidades.

No hay ninguna aplicación web. Esto es infraestructura, no un producto. Las interfaces son CLI, MCP y API.

## Principios y por qué lo local es primero

Tres fundamentos dan forma al diseño:

**Privacidad primero.** Sus datos permanecen en su máquina. Solo almacenamiento local: SQLite y archivos locales. Sin dependencia de la nube. Nunca usado para entrenamiento. Tú controlas lo que entra y lo que queda.

**Determinista.** Misma entrada, misma salida. ID de entidad basados ​​en hash. Extracción de esquema primero. No hay LLM en la ruta crítica para almacenamiento o recuperación. Procedencia completa en cada registro.

**Multiplataforma.** Una capa de memoria para todas las herramientas. ChatGPT, Claude, Cursor y Claude Code se conectan a través de MCP. Sin dependencia del proveedor. Cambie de herramienta y la memoria seguirá siendo la misma.

Esta versión es solo local por diseño. La confianza comienza con el control. Antes de añadir infraestructura remota, el contrato y las garantías deben ser sólidos. Solo local significa que puede verificar todo lo que hace el sistema. Ese es el punto de partida correcto para una capa que dice ser confiable.

## ¿Para quién es esto?

Los desarrolladores y creadores de agentes se sienten cómodos con los flujos de trabajo basados en CLI. Personas que crean u operan sistemas agentes que necesitan memoria persistente entre sesiones y herramientas. Cualquiera que trate datos personales como infraestructura de producción.

No para (todavía): usuarios de UI, tomadores de notas ocasionales o cualquiera que espere garantías de estabilidad hoy en día. Se deben esperar cambios radicales. Esta versión existe para probar la presión de los cimientos.

## Instalar y conectar

```golpecito
npm install -g neotoma #instalar
inicio de neotoma # inicializar
neotoma # iniciar sesión interactiva
```

Configuración completa, documentos API, configuración de MCP y referencia de esquema: [neotoma.io](https://neotoma.io).

Repositorio: [github.com/markmhendrickson/neotoma](https://github.com/markmhendrickson/neotoma).

## Comidas para llevar

- **Privacidad primero.** Sus datos en su máquina; Solo local, sin nube, nunca usado para capacitación.
- **CLI, MCP, OpenAPI.** Un contrato para humanos y agentes.
- **Estado estructurado primero en el esquema.** Entidades tipificadas, procedencia completa, consultas deterministas.

## Pruébalo, rómpelo, dime

Me gustaría tu ayuda para endurecer esto. Ejecútelo. Golpea los casos extremos. Informar errores, comportamientos confusos o piezas faltantes.

La retroalimentación que más valoro: cuando fallan las garantías, cuando el contrato se interpone en el camino, cuando el diseño hace una compensación equivocada. Abra problemas en GitHub, envíe parches o inicie una discusión.

Esta versión es brusca a propósito. La confiabilidad proviene del uso real y de la retroalimentación real, no del pulido aislado.