He estat treballant en una cosa que es diu **[Neotoma](/posts/truth-layer-agent-memory)**.[^1]

Encara no hi ha res per provar. Aquesta no és una publicació de llançament i no estic anunciant cap producte ni demanant inscripcions. El problema fa temps que em molesta i, el que és més important, s'ha interposat activament en el camí de la feina que he estat intentant fer.

Durant l'últim any, he passat molt de temps experimentant amb sistemes agents: automatitzar fluxos de treball, delegar tasques als agents, deixar que els sistemes funcionin entre sessions en lloc de començar des de zero cada vegada. Una i altra vegada, m'he topat amb la mateixa paret. Els sistemes eren capaços, sovint de manera impressionant, però no els podia confiar amb un estat real i en curs.

Aquesta limitació no ha estat només teòrica. Ha estat un pràctic bloquejador de l'automatització.

## Els sistemes d'IA estan canviant els rols en silenci

Abans eren una cosa que acabes de consultar: feies una pregunta, obtenies una resposta i seguies endavant. Cada cop actuen més. Escriuen fitxers i documents, truquen eines i API, fan referència a converses anteriors entre sessions i encadenen decisions al llarg del temps sense que se'ls demani explícitament cada pas.

En aquest moment, les dades personals deixen de ser material de referència i comencen a convertir-se en *estat*.

I l'estat té requisits diferents.

## El que es trenca no és la intel·ligència, sinó la confiança

Els sistemes de memòria d'IA actuals es basen en la comoditat. S'optimitzen per a la memòria, la velocitat i la fluïdesa, i per saber si el sistema *sembla* que us recorda. Cap es construeix al voltant de la procedència, la inspeccionabilitat, la reproducció o la causalitat clara.

A la pràctica, això vol dir que puc aconseguir que un agent faci alguna cosa una vegada, però dubto a deixar-lo fer alguna cosa *de nou*. La memòria canvia implícitament. El context deriva. Els supòsits s'acumulen. I quan alguna cosa va malament, no puc respondre què ha canviat, per què ha canviat o si el sistema prendria la mateixa decisió si ho tornés a fer des de zero.

Això és tolerable quan la IA és d'assessorament, però no quan està operativa.

## Una part del problema és un desajust de categoria

Encara tractem dades personals com notes, taques de text o context solt. Mentrestant, els agents tracten les mateixes dades com a entrades, restriccions, activadors i estat de llarga vida. No podeu automatitzar de manera segura les dades que no podeu inspeccionar, diferenciar, auditar o reproduir.

Això no és un problema d'UX. És un problema de sistemes.

## El que se sent a faltar és un primitiu bàsic

Estat personal explícit, inspeccionable i reproduïble.

Altres dominis ho van solucionar fa temps. Les bases de dades van fer que l'estat de l'aplicació fos fiable. Els registres d'esdeveniments van fer comprensibles els sistemes distribuïts. Els llibres majors van fer auditar la història financera. Les dades personals mai van necessitar aquest nivell de rigor abans, perquè els humans podien portar context al cap o reconstruir-lo revisant els registres manualment.

Els agents canvien aquesta hipòtesi.

## La implicació incòmoda és que fer-ho correctament afegeix fricció

Els canvis d'estat no poden ser implícits.

Les actualitzacions de memòria han de ser anomenades operacions en lloc d'efectes secundaris. Les entrades han de ser visibles en lloc de deduir-se. La història ha de ser reconstruible en lloc d'agitar a mà.

Renuncieu a una mica de màgia i accepteu més cerimònia. En cas contrari, vosaltres i els vostres agents acabareu vivint junts de manera poc fiable a través de lents divergents de la realitat.

No hi ha cap drecera al voltant d'aquesta compensació. Els sistemes de conveniència primer i els sistemes segurs per a agents tiren en direccions oposades.

## Tracto les dades personals com els sistemes de producció tracten l'estat

Això comporta algunes conseqüències inevitables. El comportament ha de ser el primer contracte: els canvis d'estat són explícits, operacions escrites, no actualitzacions ad hoc. Les mutacions han de ser explícites. Res "només actualitza la memòria".

Si els agents actuen, necessiten interfícies restringides i auditables en lloc d'indicacions o incrustacions opaques. La repetició importa tant com la resposta actual: poder explicar com vas arribar aquí és part de la veritat.

La mateixa entrada sempre produeix la mateixa sortida, ja que la capa de memòria és determinista i els agents tenen un substrat fiable. Els canvis són immutables i consultables, de manera que podeu veure l'estat de l'entitat en qualsevol moment.

La memòria prové tant dels documents que pengeu com dels agents de dades que escriuen durant les converses, un gràfic estructurat que unifica entitats i esdeveniments perquè els agents puguin raonar-ho tot.

Aquestes no són preferències estètiques. Cauen directament d'intentar, i fracassar repetidament, automatitzar fluxos de treball reals sense perdre la confiança en el sistema que fa la feina.

## Per què ho estic dissenyant d'aquesta manera

Ho mantinc MCP i CLI primer. No hi ha cap interfície d'usuari web ni memòria oculta. De manera predeterminada, és local primer, amb interfícies explícites per als agents. Estic ingerint només el que proporciono explícitament sense cap escaneig automàtic ni ingestió en segon pla. Això no són omissions, són baranes. Dificulten, accidentalment o no, mentir sobre què sap el sistema i com va arribar-hi.

També ho estic fent multiplataforma i la privadesa primer per disseny. Funciona amb ChatGPT, Claude i Cursor mitjançant MCP, no bloquejat a un sol proveïdor. Les teves dades segueixen sent teves, controlades per l'usuari, mai utilitzades per a la formació. Això no són comoditats; són requisits previs per a la confiança.

## Què no és

No és una aplicació per prendre notes ni un "segon cervell"; és un substrat de memòria estructurada per als agents.

No és ChatGPT Memory o Claude Projects controlat pel proveïdor; és el vostre propi substrat, exposat mitjançant MCP perquè qualsevol agent el pugui utilitzar.

No és una botiga de vectors ni una capa RAG; és l'esquema primer, la memòria estructurada amb la procedència.

No és un agent autònom ni un motor de flux de treball ni un assistent d'IA amb memòria invisible; són els agents de la capa de memòria que llegeixen i escriuen, i tu controles.


I encara no és una cosa que diria fiable. Estic intentant construir la capa de base abans de fingir que existeixen garanties.

## Per què ara

Estem normalitzant sistemes que prenen accions en nom nostre, persisteixen creences i acumulen decisions al llarg del temps. Quan aquests sistemes fallin, i ho faran, la primera pregunta serà: "Com va passar això?"

Ara mateix, la majoria de les eines no podran respondre-ho. I durant l'últim any, aquesta incapacitat ha estat el que m'ha impedit confiar en els agents amb tot allò que importa. Aquest problema està a punt d'escalar.

La web agentica està sorgint. Necessitem un en què els usuaris mantinguin el control de la memòria, no un en què el donem a plataformes centralitzades i els agents actuen en nom nostre mitjançant mètodes opacs i poc fiables. Estic construint Neotoma per proporcionar això: un substrat que sigui inspeccionable, reproduïble i controlat per l'usuari a mesura que creix el web agent.

## Pròxima previsualització del desenvolupador

Estic treballant per publicar una vista prèvia de desenvolupador per al meu propi ús i proves públiques. Serà dur i explícitament poc fiable (p. ex., les API poden canviar). El seu propòsit serà posar a prova aquestes idees en ús real, no vendre res.

Com m'apropo a la compilació: primer l'estic provant a la meva pròpia pila d'agents perquè pugui veure on realment ajuden el determinisme i la procedència i on s'interposen. Els casos d'ús inclouen:

- **Tasques i execució**: tasques, plans, projectes i resultats amb dates de venciment i recordatoris de seguiment
- **Contactes i relacions**: registres de contacte i gràfic de relacions vinculats a comunicacions, tasques i esdeveniments
- **Comunicacions**: triatge de correu electrònic, processament activat pel flux de treball i seguiment de converses
- **Finances** — Transaccions, fluxos, ingressos, participacions, transferències i registre de costos
- **Manteniment de registres** — Compres, comptes, propietats i informes d'anàlisi puntuals
- **Contingut** — Publicacions, història personal, mitjans preferits i fonts de consum
- **Salut**: hàbits, exercicis i seguiment continu

Estic prioritzant l'estabilitat de MCP i una CLI mínima abans d'afegir més superfície, entitats de prova d'estrès i consultes de resolució de relacions i cronologia com a escala d'ús.

Si aquest enquadrament ressona, el treball està succeint a la intempèrie aquí:
[https://github.com/markmhendrickson/neotoma](https://github.com/markmhendrickson/neotoma)

Protagonitzar el repo és la manera més senzilla de fer-ne un seguiment a mesura que evoluciona. Les aportacions de persones que pensen en sistemes agents i estat escalables sempre són benvingudes.

[^1]: Rep el nom del gènere *Neotoma* (packrats), conegut per recollir i conservar material.