## जिस अभिसरण की किसी ने योजना नहीं बनाई थी

मानुस एक उपभोक्ता-सामना वाला एआई एजेंट है। क्लाउड कोड एंथ्रोपिक का कोडिंग सहायक है। OpenClaw एक ओपन-सोर्स व्यक्तिगत AI है। अलग-अलग टीमें, अलग-अलग कोडबेस, अलग-अलग बिजनेस मॉडल।

मार्कडाउन फ़ाइलों में सभी तीन स्टोर एजेंट मेमोरी।

मानुस एक `todo.md` चेकलिस्ट का उपयोग करता है जो प्रत्येक चरण के बाद खुद को फिर से लिखता है। OpenClaw एक `memory/` निर्देशिका में `MEMORY.md` प्लस दिनांकित फ़ाइलों का उपयोग करता है। क्लाउड कोड हमेशा लोड की गई सामग्री पर 200-लाइन कैप के साथ, निर्देशिकाओं के दायरे में पदानुक्रमित `CLAUDE.md` फ़ाइलों का उपयोग करता है।

कोई भी दूसरे की नकल करता नहीं दिखा। [DEV समुदाय पर याओहुआ चेन](https://dev.to/imaginex/ai-agent-memory-management-when-markdown-files-are-all-you-need-5ekk) ने इसे "अभिसरण विकास" कहा है। जब विभिन्न बाधाओं के तहत तीन स्वतंत्र सिस्टम एक ही आर्किटेक्चर पर पहुंचते हैं, तो आर्किटेक्चर आपको समस्या के बारे में कुछ बता रहा है।

मार्च 2026 में माइकल लैनहम ने इस अभिसरण का दस्तावेजीकरण किया था। सभी तीन प्रणालियों का उनका विश्लेषण उत्पादन एजेंट मेमोरी आर्किटेक्चर की सबसे गहन सार्वजनिक तुलना है जो मैंने देखा है। डेटा सीधे तौर पर जुड़ने लायक है।

## फ़ाइलें डिफ़ॉल्ट प्रारंभिक बिंदु क्यों हैं

स्पष्ट व्याख्या सरलता है. फ़ाइलें मानव-पठनीय, गिट-ट्रैक करने योग्य हैं, और किसी बुनियादी ढांचे की आवश्यकता नहीं है। सच है लेकिन अधूरा है.

इसका गहरा कारण एलएलएम अर्थशास्त्र है।

मानुस के सह-संस्थापक यिचाओ "पीक" जी ने संख्याएँ प्रकाशित कीं। मानुस प्रत्येक 1 आउटपुट टोकन के लिए 100 इनपुट टोकन संसाधित करता है। क्लाउड सॉनेट पर, कैश्ड टोकन की कीमत लगभग $0.30 प्रति मिलियन है। अनकैच्ड टोकन की कीमत $3 प्रति मिलियन है। उस 10x प्रसार का मतलब है कि इनपुट लागत हावी है। जो कुछ भी केवी-कैश हिट दरों को बढ़ाता है वह वास्तविक धन बचाता है।

फ़ाइल-आधारित मेमोरी स्थिर, पूर्वानुमेय पाठ है जो केवी-कैश उपसर्गों के साथ अच्छी तरह से चलता है। केवल-संलग्न संदर्भ जो कॉल के बीच शायद ही कभी बदलता है, इसका मतलब है कि मॉडल कैश्ड गणनाओं का पुन: उपयोग कर सकता है। एक डेटाबेस-समर्थित RAG प्रणाली जो हर बार अलग-अलग संदर्भ अंशों को इकट्ठा करती है, इस अनुकूलन को विफल कर देती है।

मानुस का `todo.md` पैटर्न सबसे स्पष्ट उदाहरण है। एजेंट प्रत्येक चरण के बाद चेकलिस्ट को फिर से लिखता है। यह वर्तमान योजना को नवीनतम संदर्भ विंडो स्थिति में रखता है। लम्बे सन्दर्भों के बीच में सूचनाएँ नज़रअंदाज हो जाती हैं। संदर्भ के अंत में एक ताज़ा पुनर्लिखित योजना फ़ाइल बिना किसी पुनर्प्राप्ति बुनियादी ढांचे के इसे ठीक कर देती है।

आर्थिक तर्क मनुस से आगे तक फैला हुआ है। क्लाउड कोड हमेशा लोड की गई मेमोरी को 200 लाइनों तक सीमित करता है क्योंकि मेमोरी फ़ाइलें हर सत्र में टोकन का उपभोग करती हैं। बाधा भंडारण नहीं है. यह ध्यान बजट है. फ़ाइलें आपको यह नियंत्रित करने देती हैं कि मॉडल क्या देखता है और संदर्भ में कहां दिखाई देता है।

ये आकस्मिक विकल्प नहीं हैं. वे लागत-जागरूक वास्तुकला हैं।

## जहां फाइलें टूटती हैं

लानहम का लेख विफलता के तरीकों के बारे में ईमानदार है। वह ईमानदारी विश्लेषण का सबसे मूल्यवान हिस्सा है।

**संदर्भ बजट दबाव।** क्लाउड कोड चेतावनी देता है कि बड़ी `CLAUDE.md` फ़ाइलें मॉडल पालन को कम करती हैं। फ़ाइलें तब तक काम करती हैं जब तक वे फूली हुई और आंतरिक रूप से विरोधाभासी न हो जाएं। 200-लाइन की सीमा एक व्यावहारिक समाधान है, कोई समाधान नहीं। जैसे-जैसे एजेंट स्केल का उपयोग करता है, फ़ाइल बढ़ती है, स्वयं का खंडन करती है, और कोई नहीं जानता कि तथ्य का कौन सा संस्करण चालू है।

**Concurrency.** एकाधिक एजेंट एक ही मेमोरी फ़ाइल को भ्रष्ट स्थिति में लिख रहे हैं। लैनहैम सीधे तौर पर कहता है: "जिस क्षण कई एजेंटों या उपयोगकर्ताओं को एक ही मेमोरी को छूने की आवश्यकता होती है, समवर्ती फ़ाइल लेखन डेटा को दूषित कर सकता है।" एकल-एजेंट सीमा वास्तविक है। अधिकांश एजेंटिक वर्कफ़्लोज़ [सिंगल-एजेंट नहीं रहेंगे](/पोस्ट/कब-एजेंट-शेयर-स्टेट-एवरीथिंग-ब्रेक) हमेशा के लिए।

**कोई संस्करणीकरण नहीं।** फ़ाइलें अधिलेखित हो जाती हैं। ओपनक्लॉ की मेमोरी कॉम्पैक्शन एक साइलेंट एजेंट टर्न को ट्रिगर करता है जो ट्रंकेशन से पहले टिकाऊ यादें लिखता है। संघनन से पहले फ़ाइल में क्या था? अज्ञात। यदि संक्षिप्त संस्करण ने कोई तथ्य छोड़ दिया है, तो वह चला गया है। कोई अवलोकन लॉग नहीं. कोई रोलबैक नहीं.

**कोई उत्पत्ति नहीं।** जब कोई एजेंट मेमोरी प्रविष्टि लिखता है, तो इसका कोई रिकॉर्ड नहीं होता है कि इसे किस स्रोत ने कब बनाया, या क्या यह पिछले सप्ताह लिखी गई किसी बात का खंडन करता है। फ़ाइल एक सारांश है. सारांश उनके अवयवों को अस्पष्ट करते हैं।

**कोई इकाई समाधान नहीं।** एक सत्र में "एसीएमई कॉर्प" और अगले में "एसीएमई कॉर्प"। एजेंट हर बार संदर्भ विंडो से पहचान का पुन: अनुमान लगाता है। कोई स्थिर आईडी नहीं. कोई मर्ज नियम नहीं. कोई विहित संस्थाएँ नहीं. प्रत्येक सत्र सत्र-क्षेत्रीय अनुमान है।

**कोई स्कीमा बाधा नहीं।** कोई भी एजेंट या टूल मेमोरी फ़ाइल में कुछ भी लिख सकता है। कोई सत्यापन नहीं. कोई प्रकार की जाँच नहीं. स्मृति प्रविष्टि में क्या होना चाहिए इसका कोई प्रवर्तन नहीं। बुरी बातें सत्य के रूप में प्रचारित की जाती हैं।

ये असफलताएँ काल्पनिक नहीं हैं। इन प्रणालियों का निर्माण करने वाली टीमों द्वारा उनका दस्तावेजीकरण किया जाता है। वे फ़ाइल-आधारित मेमोरी की परिचालन छत हैं।

## संतुलन में अंतर

लैनहैम चार परतों वाली एक "संतुलन वास्तुकला" का प्रस्ताव करता है। प्राथमिक इंटरफ़ेस के रूप में फ़ाइलें। डिस्क पर आक्रामक ऑफलोडिंग। व्युत्पन्न पुनर्प्राप्ति परतें (फ़ाइलों पर वेक्टर सूचकांक)। जब समरूपता और शुद्धता इसकी मांग करती है तो डेटाबेस में स्पष्ट वृद्धि।

पहली तीन परतें अच्छी तरह से प्रलेखित हैं। चौथा पाठक के लिए एक अभ्यास के रूप में छोड़ा गया है।

"डेटाबेस में आगे बढ़ें" मानता है कि डेटाबेस अखंडता समस्याओं का समाधान करता है। पोस्टग्रेज़ आपको डिफ़ॉल्ट रूप से संस्करणबद्ध अवलोकन नहीं देता है। यह आपको उत्पत्ति श्रृंखला नहीं देता है। यह आपको दस्तावेज़ों में नियतात्मक इकाई समाधान नहीं देता है। यह आपको एजेंट-लिखित स्थिति पर स्कीमा बाधा नहीं देता है। मार्कडाउन फ़ाइल से डेटाबेस तालिका में जाने से "कोई संस्करण नहीं" का समाधान नहीं होता है। यह "कोई समवर्ती पहुंच नहीं" का समाधान करता है। वे अलग-अलग समस्याएं हैं.

संतुलन में परतों तीन और चार के बीच एक अंतर होता है। "मार्कडाउन फ़ाइलें जो एक एजेंट के लिए काम करती हैं" और "पूर्ण डेटाबेस संरचना" के बीच एक गायब परत है। अखंडता की गारंटी के साथ संरचित राज्य। किसी कस्टम डेटाबेस स्कीमा की आवश्यकता नहीं है.

OpenClaw का आर्किटेक्चर इस ओर संकेत करता है। इसकी हाइब्रिड पुनर्प्राप्ति, कॉन्फ़िगर करने योग्य वेक्टर/टेक्स्ट वेटिंग, अस्थायी क्षय, एमएमआर विविधीकरण के साथ एसक्लाइट-वेक, सरल फ़ाइल खोज की तुलना में अधिक परिष्कृत है। लेकिन यह अभी भी मार्कडाउन फ़ाइलों को सत्य का स्रोत मानता है। सूचकांक एक पठन अनुकूलन है, न कि राज्य अखंडता परत।

गायब प्राइमेटिव्स वही हैं जिन्हें मैंने पहचाना है [अपना खुद का एजेंटिक स्टैक चला रहा हूं](/पोस्ट/एजेंट-सर्च-एंड-द-ट्रुथ-लेयर):

- **संस्करणित टिप्पणियाँ।** प्रत्येक लेख संलग्न है, कुछ भी अधिलेखित नहीं है। किसी भी समय राज्य का पुनर्निर्माण करें।
- **उत्पत्ति।** प्रत्येक तथ्य एक स्रोत, एक टाइमस्टैम्प और इसे लिखने वाले एजेंट या इंसान से पता लगाया जा सकता है।
- **नियतात्मक इकाई संकल्प।** स्थिर नियमों पर आधारित कैननिकल आईडी, प्रति-सत्र अनुमान पर नहीं।
- **स्कीमा बाधाएँ।** लिखने पर सत्यापन। खराब डेटा स्टोर में प्रवेश करने से पहले ही खारिज कर दिया गया।

ये डेटाबेस सुविधाएँ नहीं हैं. वे राज्य अखंडता विशेषताएं हैं। आप उन्हें डेटाबेस के शीर्ष पर बना सकते हैं। पोस्टग्रेज़ उन्हें आपको बॉक्स से बाहर नहीं देगा। और आप उन्हें मार्कडाउन फ़ाइल से बिल्कुल भी प्राप्त नहीं कर सकते।

## फ़ाइलें वास्तविक अवलंबी हैं

लानहम के विश्लेषण से सबसे महत्वपूर्ण रणनीतिक अंतर्दृष्टि फ़ाइलों बनाम डेटाबेस के बारे में नहीं है। यह इस बारे में है कि वास्तविक प्रतिस्पर्धी परिदृश्य कैसा दिखता है।

मेमोरी इन्फ्रास्ट्रक्चर कंपनियों ने पुनर्प्राप्ति समस्याओं के खिलाफ लाखों डॉलर जुटाए। [Mem0](https://mem0.ai) ने $24 मिलियन जुटाए। [लेट्टा](https://www.letta.com) ने $10M के बीज को $70M मूल्यांकन पर बंद किया। [Zep](https://www.getzep.com) का [ग्राफिटी](https://github.com/getzep/graphiti) प्रोजेक्ट 20K GitHub स्टार्स को पार कर गया। [मेमपैलेस](https://github.com/MemPalace/mempalace) ने स्थानीय-प्रथम, शब्दशः-भंडारण दृष्टिकोण के साथ अपने पहले दो हफ्तों में 46K सितारों को हिट किया। वे वास्तविक समस्याओं का समाधान करते हैं: तैनाती में स्थायित्व, वैयक्तिकरण, बड़े पैमाने पर पुनर्प्राप्ति, और संरचित रिकॉल।

लेकिन अधिकांश एजेंट इंटरैक्शन को संभालने वाले सिस्टम मेमोरी के लिए वेक्टर डेटाबेस का उपयोग नहीं कर रहे हैं। वे टेक्स्ट फ़ाइलों का उपयोग कर रहे हैं. तीन बिलियन-डॉलर-स्केल प्लेटफ़ॉर्म से उत्पादन साक्ष्य पुष्टि करते हैं कि वास्तविक डिफ़ॉल्ट कोई मौजूदा डेटाबेस उत्पाद नहीं है। यह एक फ़ाइल है.

इससे विस्थापन की कहानी बदल जाती है. अपग्रेड पथ वेक्टर डेटाबेस से कुछ बेहतर तक नहीं है। यह मार्कडाउन फ़ाइलों से संरचित स्थिति तक है। जिन लोगों को राज्य अखंडता गारंटी की आवश्यकता है वे वर्तमान में Mem0 या Zep का उपयोग नहीं कर रहे हैं। वे वर्तमान में `MEMORY.md` को लिख रहे हैं।

## स्थानांतरण, प्रतिस्थापन नहीं

लैनहैम की समापन सलाह भावना के अनुरूप सही है: "मार्कडाउन फ़ाइल से प्रारंभ करें। आप बाद में कभी भी डेटाबेस जोड़ सकते हैं।" फ़ाइलें एक तर्कसंगत प्रारंभिक वास्तुकला हैं। अर्थशास्त्र उनका समर्थन करता है। निरीक्षणशीलता वास्तविक है. सादगी मायने रखती है.

प्रश्न यह है कि "बाद में" कैसा दिखता है।

मैं उस अपग्रेड पथ के रूप में [नियोटोमा](https://github.com/markmhendrickson/neotoma) का निर्माण कर रहा हूं। अखंडता के साथ संरचित स्थिति फाइलों की कमी की गारंटी देती है: संस्करण, उत्पत्ति, इकाई संकल्प, स्कीमा बाधाएं।

लागत दक्षता प्रश्न मायने रखता है। यदि अपग्रेड पथ केवी-कैश अर्थशास्त्र का त्याग करता है जो फ़ाइलों को तर्कसंगत बनाता है, तो यह वास्तविक अपग्रेड नहीं है। नियोटोमा का पठन पथ इस बाधा के आसपास डिज़ाइन किया गया है। एजेंट इसे एमसीपी के माध्यम से एक्सेस करते हैं। प्रतिक्रिया संरचित पाठ को संदर्भ विंडो में इंजेक्ट किया जाता है, वही प्रारूप जो एक मॉडल किसी फ़ाइल को पढ़ने पर देखेगा। कॉल के बीच निकाय स्नैपशॉट स्थिर होते हैं। एक ही इकाई से दो बार पूछताछ की गई तो वह एक ही पाठ लौटाता है जब तक कि किसी अवलोकन ने उसे बदल न दिया हो। स्थिर पाठ का अर्थ है स्थिर टोकन अनुक्रम। स्थिर टोकन अनुक्रम का अर्थ है केवी-कैश हिट।

लेखन पथ वह है जहां अर्थशास्त्र भिन्न है, और जहां उन्हें होना चाहिए। स्कीमा सत्यापन के साथ एक संरचित स्टोर में एक अवलोकन लिखने में एक मार्कडाउन फ़ाइल में एक पंक्ति जोड़ने की तुलना में अधिक लागत आती है। वह ओवरहेड संस्करण, उद्गम और संघर्ष का पता लगाने की कीमत है। सवाल यह है कि क्या वह ओवरहेड भुगतान करने लायक है। यदि आपको कभी भी यह उत्तर देने की आवश्यकता नहीं पड़ी कि "मेरे एजेंट को पिछले मंगलवार को क्या पता चला" या "किस चीज़ ने इस इकाई को दूषित किया," तो नहीं। मार्कडाउन सही है. यदि आपको उन उत्तरों की आवश्यकता है और आप उन्हें नहीं पा सके हैं, तो लेखन-पथ की लागत समस्या का सबसे सस्ता हिस्सा है।

प्रवास की कहानी सीधी है. आपने `MEMORY.md` से शुरुआत की क्योंकि यह सही डिफ़ॉल्ट था। जब आपको संस्करण, या समवर्ती पहुंच, या उत्पत्ति, या सत्रों में इकाई समाधान की आवश्यकता होती है तो आप उच्चतम स्तर पर पहुंच जाते हैं। अगला चरण "पोस्टग्रेज़ सेट अप करना और एक कस्टम स्कीमा बनाना" नहीं है। यह एक संरचित परत है जो आपको फाइलों के बारे में काम करने वाली चीज़ों को संरक्षित करते हुए वे गारंटी देती है: निरीक्षणशीलता, सरलता, स्थानीय-प्रथम ऑपरेशन।

लैनहैम द्वारा प्रलेखित अभिसरण विकास समस्या की पुष्टि करता है। कुल मिलाकर अरबों मूल्य की तीन टीमें एक ही वास्तुकला पर पहुंचीं और एक ही दीवारों से टकराईं। दीवारें अगली परत को परिभाषित करती हैं।