Entre el 8 y el 9 de junio, tres personas que rara vez escriben el mismo ensayo escribieron el mismo ensayo. [Addy Osmani](https://x.com/addyosmani/status/2064127981161959567), director de IA en Google Cloud, publicó "Loop Engineering", una taxonomía de los sistemas que solicitan agentes de codificación para que usted no tenga que hacerlo. [Matt Van Horn](https://x.com/mvanhorn/status/2063865685558903149) publicó "¿WTF Is a Loop?", una investigación en Reddit, X, YouTube y Hacker News que rastreó la idea desde el artículo ReAct de 2022 hasta los bucles de orquestación que la gente ejecuta hoy. Y [Lance Martin](https://x.com/RLanceMartin/status/2064397389189071163), miembro del personal técnico de Anthropic, publicó "Designing loops with Fable 5", dos patrones para aprovechar al máximo los modelos de frontera diseñando bucles en lugar de solicitarlos directamente.

Los tres convergen en el mismo cambio: las indicaciones están dando paso al diseño de bucles que incitan a los agentes por usted. Y los tres nombran el mismo componente como el que más importa. Osmani enumera cinco pilares, luego añade un sexto y le da la frase más fuerte de su artículo: "El expediente estatal es la columna vertebral de todo". Van Horn sostiene que la generación actual de bucles es genuinamente nueva por una razón estructural: "la durabilidad se volvió explícita, con estado respaldado por git y recuperación de fallas". Martin enmarca la memoria como "un bucle externo que se extiende a lo largo de las sesiones".

El diagnóstico es ahora consenso. El estado externo duradero es la parte que soporta la carga de los agentes autónomos. Lo que me sorprendió es lo que pasó después. Los tres entregaron el trabajo a un archivo de texto.

## Qué es un bucle, brevemente

La definición de Van Horn es la más clara: un bucle es cron más un tomador de decisiones en el cuerpo. Un trabajo cron ejecuta un script fijo. Un bucle ejecuta un modelo que analiza el estado actual, decide qué hacer, lo hace, comprueba si funcionó y decide si continuar. Apílelos, deje que un bucle envíe a otros, y obtendrá lo que Boris Cherny quiere decir cuando dice que su trabajo es escribir bucles.

El modelo dentro de ese bucle olvida todo entre ejecuciones por diseño. Las ventanas de contexto finalizan. Se reinician las sesiones. Entonces, algo en el sistema no debe olvidarse. Ese algo es lo que el bucle lee para decidir qué hacer a continuación y lo escribe para registrar lo sucedido. Es la columna vertebral, y Osmani tiene razón al llamarla así.

## La batea de sustrato

Aquí está el inventario completo de los candidatos de columna vertebral en las tres publicaciones: un archivo de rebajas, un tablero lineal, archivos de estado comprometidos con git y un sistema de archivos montado compartido entre sesiones. Osmani ofrece los dos primeros. Van Horn documenta el tercero, que es lo que Gas Town de Steve Yegge utiliza para coordinar veinte o treinta instancias de Claude. Martin utiliza la cuarta función, la memoria de Claude Managed Agents.

Todos estos resuelven la persistencia. Los bytes sobreviven a un reinicio. Ninguno de ellos resuelve la integridad. Haga a cualquiera de estos sustratos la pregunta que un bucle realmente necesita respuesta: de estas dos notas contradictorias, ¿cuál es verdadera, quién la escribió, cuándo y alguna vez se verificó? Un archivo en prosa contiene ambas notas una al lado de la otra y deja la conciliación al modelo que lea el archivo a continuación. Git conserva cada versión histórica de la ambigüedad sin resolverla. Un montaje compartido agrega ganancias de última escritura en la parte superior.

La persistencia y la integridad son propiedades diferentes. El discurso ha absorbido plenamente lo primero y aún no se ha dado cuenta de lo segundo.

## Realizamos este experimento antes

Las aplicaciones almacenaron su estado en archivos planos durante décadas. Tres fuerzas pusieron fin a esa era: los escritores simultáneos corrompieron los archivos, las contradicciones acumuladas no tenían mecanismo de resolución y responder preguntas significaba analizarlo todo. Las bases de datos ganaron porque hicieron de la integridad una propiedad de la capa de almacenamiento en lugar de una disciplina esperada de cada programa que tocara los datos.

Cada una de esas fuerzas ya es visible dentro de los tres postes.

La concurrencia llega en el momento en que los bucles supervisan los bucles, que es exactamente la etapa en la que Van Horn dice que estamos entrando. Dos bucles que escriben un archivo de estado son el mismo error que dos ingenieros que se comprometen con las mismas líneas sin hablar. Los árboles de trabajo resuelven esto para el código. Nada en la cadena de herramientas actual resuelve el problema del [estado compartido](/posts/when-agents-share-state-everything-breaks).

La contradicción está documentada en los resultados de las pruebas comparativas de Martin. En una tarea de aprendizaje continuo, Sonnet 4.6 dejó un almacén de memoria que describe como una lista de notas de error y conjeturas abiertas, incluidas entradas como "¿quizás prc en lugar de prc_usd?" Las conjeturas se acumulan. Nada marca uno resuelto. La siguiente sesión hereda la pila.

Las consultas son el remate del propio Van Horn. Sostiene que la parte costosa de la codificación agente es ahora la gestión de bucles: condiciones de detención, falta de detección de progreso y límites presupuestarios. Cada uno de ellos requiere comparar la ejecución actual con ejecuciones anteriores. En un sustrato en prosa, eso significa volver a leer y analizar un archivo en crecimiento en cada tick, lo cual es un impuesto simbólico que aumenta con la edad del bucle.

## Lo que me enseñó dirigir un enjambre

Dirijo un enjambre de agentes nombrados en mi propia máquina: uno para inteligencia de clientes, otro para contenido, uno para extensión y otros para operaciones. Al principio, cada uno guardaba notas en sus propios archivos. Esos archivos se fueron a la deriva. La misma persona apareció bajo tres nombres. Un hecho corregido en un archivo sobrevivió sin corregir en otros dos, y ningún registro mostró qué versión era la actual ni de dónde procedía.

El enjambre ahora comparte [una tienda estructurada](/posts/from-memory-to-nervous-system), y esta publicación es en sí misma un recibo. La investigación detrás de esto fue realizada por mi agente de inteligencia de clientes, que obtuvo las tres publicaciones X, almacenó cada una como un registro mecanografiado con números de participación y procedencia, escribió los hallazgos competitivos en un análisis estructurado y presentó tareas de seguimiento a otros dos agentes a través de la tienda compartida. Cuando hice una pregunta de seguimiento una hora más tarde, la comparación se añadió al mismo registro de análisis con su propio rastro de procedencia, no se dispersó en un archivo nuevo. Ningún agente volvió a derivar lo que otro ya había establecido.

## La madurez de la memoria es una propiedad del sustrato.

Los datos más nítidos en cualquiera de las tres publicaciones están en el de Martin. Describe cinco etapas del uso de la memoria: un agente falla, investiga por qué, verifica lo que encontró, resume la respuesta en una regla y consulta esa regla la próxima vez. Un agente que completa los cinco convierte los errores en reglas verificadas y reutilizables. Un agente que se detiene antes de tiempo deja un montón de conjeturas.

Sus resultados, todos en el mismo sistema de archivos montado: Sonnet 4.6 se detiene en la etapa uno, registrando fallas sin investigarlas. Opus 4.7 llega a la etapa de verificación, pero en el plazo medio sólo verifica alrededor del 17 por ciento de sus afirmaciones. Fable 5 completa la progresión y verifica hasta el 73 por ciento.

Mismo sistema de archivos, calidad de memoria radicalmente diferente. La diferencia reside enteramente en la disciplina del modelo, porque el sistema de archivos no garantiza nada: cada etapa es un comportamiento que el modelo debe elegir realizar. Una tienda estructurada convierte esos comportamientos en operaciones de datos. Una falla es una observación almacenada. La investigación está recuperando los registros relacionados. La verificación es una corrección con la procedencia adjunta. La destilación es escribir una regla mecanografiada. La consultoría es una consulta acotada. Cuando el sustrato lleva la progresión, cualquier modelo llega a completarla.

## Qué exigir de una capa de estado de bucle

Expresado de manera independiente como herramienta, la columna vertebral de un bucle debe proporcionar seis cosas: registros escritos en lugar de blobs en prosa, procedencia en cada campo, correcciones que calculan la verdad actual en lugar de acumular versiones, escrituras simultáneas que no pueden entrar en conflicto, recuperación que devuelve solo lo que el tick actual necesita y acceso desde cualquier arnés en lugar de la pila de un proveedor.

Para ser justos con el archivo de texto: para un bucle en un repositorio, [el descuento está realmente bien](/posts/the-markdown-memory-ceiling). Es legible, diferenciable y gratuito. La función forzada es el bucle número dos, la primera vez que dos procesos se preocupan por el mismo hecho y ninguno puede confiar en lo que el otro escribió.

## Los archivos recuerdan, los sistemas de registro saben

Van Horn termina su artículo argumentando que el circuito es plomería y el activo duradero es la biblioteca de habilidades que solicita. La mitad de lo cierto, creo. Las habilidades son memoria procedimental, el cómo del trabajo repetido. Debajo de ellos se encuentra la memoria factual, lo que es cierto en este momento y de lo que depende cada invocación de habilidad. Ambos compuestos, pero sólo si se puede confiar en la capa fáctica después de mil escrituras desatendidas.

Construí [Neotoma](https://github.com/markmhendrickson/neotoma) porque necesitaba esa capa para mi propio enjambre: observaciones escritas, por procedencia de campo, correcciones que se resuelven según la verdad actual y acceso compartido para cada agente que ejecuto. El discurso del bucle acaba de pasar una semana describiendo el espacio que ocupa sin nombrar nada que lo ocupe.

Osmani cierra su ensayo con el consejo de construir el circuito como quien pretende seguir siendo ingeniero. La capa estatal es donde esa intención se vuelve comprobable. Los archivos recuerdan. Un sistema de registro lo sabe.