मैं **[नियोटोमा](/पोस्ट/ट्रुथ-लेयर-एजेंट-मेमोरी)** नामक किसी चीज़ पर काम कर रहा हूं।[^1]

अभी तक प्रयास करने के लिए कुछ भी नहीं है। यह कोई लॉन्च पोस्ट नहीं है, और मैं किसी उत्पाद की घोषणा नहीं कर रहा हूं या साइनअप के लिए नहीं कह रहा हूं। समस्या मुझे कुछ समय से परेशान कर रही है, और इससे भी महत्वपूर्ण बात यह है कि यह मेरे काम करने की कोशिश में सक्रिय रूप से बाधा बन रही है।

पिछले वर्ष में, मैंने एजेंटिक सिस्टम के साथ प्रयोग करने में बहुत समय बिताया है: वर्कफ़्लो को स्वचालित करना, एजेंटों को कार्य सौंपना, सिस्टम को हर बार शून्य से शुरू करने के बजाय पूरे सत्र में काम करने देना। बार-बार, मैं उसी दीवार से टकराया हूं। सिस्टम सक्षम थे, अक्सर प्रभावशाली ढंग से, लेकिन मैं वास्तविक, चालू स्थिति में उन पर भरोसा नहीं कर सका।

वह सीमा सिर्फ सैद्धांतिक नहीं रही है। यह स्वचालन के लिए एक व्यावहारिक अवरोधक रहा है।

## एआई सिस्टम चुपचाप भूमिकाएँ बदल रहे हैं

वे कुछ ऐसे होते थे जिनसे आप बस परामर्श लेते थे: आप एक प्रश्न पूछते थे, उत्तर प्राप्त करते थे और आगे बढ़ जाते थे। वे तेजी से कार्य करते हैं। वे फ़ाइलें और दस्तावेज़ लिखते हैं, टूल और एपीआई कॉल करते हैं, सत्रों में पिछली बातचीत का संदर्भ लेते हैं, और प्रत्येक चरण के लिए स्पष्ट रूप से संकेत दिए बिना समय के साथ निर्णयों की श्रृंखला बनाते हैं।

उस बिंदु पर, व्यक्तिगत डेटा संदर्भ सामग्री बनना बंद कर देता है और *राज्य* बनना शुरू कर देता है।

और राज्य की अलग-अलग आवश्यकताएं हैं।

## जो चीज़ टूटती रहती है वो अक्ल नहीं, भरोसा है

वर्तमान एआई मेमोरी सिस्टम सुविधा के आधार पर बनाए गए हैं। वे स्मरण, गति और प्रवाह के लिए अनुकूलन करते हैं, और यह भी कि क्या सिस्टम को ऐसा महसूस होता है कि वह आपको याद रखता है। कोई भी उत्पत्ति, निरीक्षणशीलता, पुनरावृत्ति, या स्पष्ट कार्य-कारण के आसपास नहीं बनाया गया है।

व्यवहार में, इसका मतलब है कि मैं किसी एजेंट से एक बार कुछ करवा सकता हूं, लेकिन मैं उसे *दोबारा* कुछ करने देने में झिझकता हूं। स्मृति अन्तर्निहित रूप से बदलती रहती है। प्रसंग भटक जाता है। धारणाएँ एक-दूसरे से जुड़ती हैं। और जब कुछ गलत होता है, तो मैं इसका जवाब नहीं दे सकता कि क्या बदला, क्यों बदला, या अगर मैं इसे स्क्रैच से दोबारा चलाऊं तो क्या सिस्टम वही निर्णय लेगा।

यह तब सहन किया जा सकता है जब एआई सलाहकारी हो लेकिन तब नहीं जब यह क्रियाशील हो।

## समस्या का एक हिस्सा श्रेणी बेमेल है

हम अभी भी व्यक्तिगत डेटा को नोट्स, टेक्स्ट ब्लॉब्स या ढीले संदर्भ की तरह मानते हैं। इस बीच, एजेंट उसी डेटा को इनपुट, बाधाएं, ट्रिगर और लंबे समय तक रहने वाली स्थिति जैसे मानते हैं। आप उस डेटा के विरुद्ध सुरक्षित रूप से स्वचालित नहीं हो सकते जिसका आप निरीक्षण नहीं कर सकते, अंतर नहीं कर सकते, ऑडिट नहीं कर सकते, या दोबारा नहीं चला सकते।

यह कोई UX समस्या नहीं है. यह एक सिस्टम समस्या है.

## जो कमी महसूस होती है वह एक बुनियादी आदिम है

स्पष्ट, निरीक्षण योग्य, पुन: प्रयोज्य व्यक्तिगत स्थिति।

अन्य डोमेन ने इसे बहुत पहले ही हल कर लिया था। डेटाबेस ने एप्लिकेशन स्थिति को विश्वसनीय बना दिया। इवेंट लॉग ने वितरित सिस्टम को समझने योग्य बना दिया। लेजर्स ने वित्तीय इतिहास को श्रवण योग्य बनाया। व्यक्तिगत डेटा को पहले कभी भी उस स्तर की कठोरता की आवश्यकता नहीं थी, क्योंकि मनुष्य संदर्भ को अपने दिमाग में रख सकते थे या मैन्युअल रूप से रिकॉर्ड की समीक्षा करके इसका पुनर्निर्माण कर सकते थे।

एजेंट उस धारणा को बदल देते हैं।

## असुविधाजनक निहितार्थ यह है कि इसे सही ढंग से करने से घर्षण बढ़ता है

राज्य परिवर्तन अंतर्निहित नहीं हो सकते.

मेमोरी अपडेट को साइड इफेक्ट के बजाय ऑपरेशन नाम देना होगा। इनपुट को अनुमान लगाने के बजाय दृश्यमान होना चाहिए। इतिहास को हाथ से हिलाने की बजाय पुनर्निर्माण योग्य बनाना होगा।

आप कुछ जादू छोड़ें और अधिक समारोह स्वीकार करें। अन्यथा आप और आपके एजेंट वास्तविकता के भिन्न-भिन्न दृष्टिकोणों के माध्यम से अविश्वसनीय रूप से एक साथ रहना समाप्त कर देंगे।

इस ट्रेडऑफ़ के आसपास कोई शॉर्टकट नहीं है। सुविधा-प्रथम प्रणालियाँ और एजेंट-सुरक्षित प्रणालियाँ विपरीत दिशाओं में खींचती हैं।

## मैं व्यक्तिगत डेटा के साथ उसी तरह व्यवहार कर रहा हूं जिस तरह उत्पादन प्रणालियाँ राज्य के साथ करती हैं

इससे कुछ अपरिहार्य परिणाम सामने आते हैं। व्यवहार को अनुबंध-प्रथम होना चाहिए: राज्य परिवर्तन स्पष्ट, टाइप किए गए ऑपरेशन हैं, तदर्थ अपडेट नहीं। उत्परिवर्तन स्पष्ट होना चाहिए। कुछ नहीं "बस स्मृति को अद्यतन करता है।"

यदि एजेंट कार्रवाई करने जा रहे हैं, तो उन्हें अपारदर्शी संकेतों या एम्बेडिंग के बजाय प्रतिबंधित, श्रवण योग्य इंटरफेस की आवश्यकता होती है। रीप्ले उतना ही मायने रखता है जितना वर्तमान उत्तर: यह समझाने में सक्षम होना कि आप यहां तक ​​कैसे पहुंचे, सच्चाई का हिस्सा है।

समान इनपुट हमेशा समान आउटपुट उत्पन्न करता है क्योंकि मेमोरी परत नियतात्मक होती है और एजेंटों के पास एक विश्वसनीय सब्सट्रेट होता है। परिवर्तन अपरिवर्तनीय और क्वेरी योग्य हैं इसलिए आप किसी भी समय इकाई स्थिति देख सकते हैं।

मेमोरी आपके द्वारा अपलोड किए गए दस्तावेज़ों और बातचीत के दौरान डेटा एजेंटों द्वारा लिखे गए दोनों से आती है, एक संरचित ग्राफ इकाइयों और घटनाओं को एकीकृत करता है ताकि एजेंट इन सभी पर तर्क कर सकें।

ये सौंदर्य संबंधी प्राथमिकताएँ नहीं हैं। काम करने वाले सिस्टम पर भरोसा खोए बिना वास्तविक वर्कफ़्लो को स्वचालित करने की कोशिश करने और बार-बार असफल होने से वे सीधे तौर पर असफल हो जाते हैं।

## मैं इसे इस तरह क्यों डिज़ाइन कर रहा हूं

मैं इसे एमसीपी और सीएलआई-प्रथम रख रहा हूं। कोई वेब यूआई नहीं है और कोई छिपी हुई मेमोरी नहीं है। यह एजेंटों के लिए स्पष्ट इंटरफेस के साथ, डिफ़ॉल्ट रूप से स्थानीय-प्रथम है। मैं बिना किसी स्वचालित स्कैनिंग या पृष्ठभूमि अंतर्ग्रहण के केवल वही ग्रहण कर रहा हूँ जो मैं स्पष्ट रूप से प्रदान करता हूँ। वे चूक नहीं हैं, वे रेलिंग हैं। वे गलती से या अन्यथा इस बारे में झूठ बोलना कठिन बना देते हैं कि सिस्टम क्या जानता है और यह वहां तक ​​कैसे पहुंचा।

मैं इसे डिज़ाइन द्वारा क्रॉस-प्लेटफ़ॉर्म और गोपनीयता-प्रथम भी बना रहा हूं। यह MCP के माध्यम से ChatGPT, क्लाउड और कर्सर के साथ काम करता है, किसी एक प्रदाता पर लॉक नहीं होता है। आपका डेटा आपका ही रहता है, उपयोगकर्ता-नियंत्रित, प्रशिक्षण के लिए कभी उपयोग नहीं किया जाता। वे सुविधाएं नहीं हैं; वे विश्वास के लिए आवश्यक शर्तें हैं।

## यह क्या नहीं है

यह नोट लेने वाला ऐप या "दूसरा दिमाग" नहीं है; यह एजेंटों के लिए एक संरचित मेमोरी सब्सट्रेट है।

यह प्रदाता-नियंत्रित चैटजीपीटी मेमोरी या क्लाउड प्रोजेक्ट नहीं है; यह आपका अपना सब्सट्रेट है, जो एमसीपी के माध्यम से उजागर होता है ताकि कोई भी एजेंट इसका उपयोग कर सके।

यह कोई वेक्टर स्टोर या RAG परत नहीं है; यह स्कीमा-प्रथम, उत्पत्ति के साथ संरचित मेमोरी है।

यह कोई स्वायत्त एजेंट या वर्कफ़्लो इंजन या अदृश्य मेमोरी वाला AI सहायक नहीं है; यह मेमोरी लेयर एजेंट है जो पढ़ता और लिखता है, और आप नियंत्रित करते हैं।


और यह ऐसा कुछ नहीं है जिसे मैं अभी तक विश्वसनीय कहूँ। मैं गारंटी देने का दिखावा करने से पहले नींव की परत बनाने की कोशिश कर रहा हूं।

## अब क्यों

हम उन प्रणालियों को सामान्य बना रहे हैं जो हमारी ओर से कार्रवाई करती हैं, विश्वास कायम रखती हैं और समय के साथ निर्णय लेती हैं। जब वे प्रणालियाँ विफल होंगी, और होंगी, तो पहला प्रश्न होगा, "यह कैसे हुआ?"

अभी, अधिकांश उपकरण इसका उत्तर देने में सक्षम नहीं होंगे। और पिछले वर्ष में, यही अक्षमता मुझे किसी भी महत्वपूर्ण मामले में एजेंटों पर भरोसा करने से रोक रही है। वह समस्या बढ़ने वाली है.

एजेंटों का जाल उभर रहा है. हमें ऐसी जगह की जरूरत है जहां उपयोगकर्ता मेमोरी के नियंत्रण में रहें, न कि ऐसी जगह जहां हम इसे केंद्रीकृत प्लेटफार्मों को सौंप दें और एजेंट अपारदर्शी, अविश्वसनीय तरीकों का उपयोग करके हमारी ओर से कार्य करें। मैं यह प्रदान करने के लिए नियोटोमा का निर्माण कर रहा हूं: एक सब्सट्रेट जो एजेंटिक वेब के बढ़ने के साथ निरीक्षण योग्य, पुन: चलाने योग्य और उपयोगकर्ता-नियंत्रित है।

## आगामी डेवलपर पूर्वावलोकन

मैं अपने स्वयं के उपयोग और सार्वजनिक परीक्षण के लिए एक डेवलपर पूर्वावलोकन जारी करने पर काम कर रहा हूं। यह कठिन और स्पष्ट रूप से अविश्वसनीय होगा (उदाहरण के लिए एपीआई बदल सकते हैं)। इसका उद्देश्य इन विचारों को वास्तविक उपयोग में लाने के लिए दबाव-परीक्षण करना होगा, न कि कुछ बेचना।

मैं निर्माण के बारे में कैसे सोच रहा हूं: मैं इसे पहले अपने एजेंटिक स्टैक में डॉगफूड कर रहा हूं ताकि मैं देख सकूं कि नियतिवाद और उद्गम वास्तव में कहां मदद करते हैं और वे रास्ते में कहां आते हैं। उपयोग के मामलों में शामिल हैं:

- **कार्य और निष्पादन** - नियत तिथियों और अनुवर्ती अनुस्मारक के साथ कार्य, योजनाएं, परियोजनाएं और परिणाम
- **संपर्क और रिश्ते** - संचार, कार्यों और घटनाओं से जुड़े संपर्क रिकॉर्ड और संबंध ग्राफ़
- **संचार** - ईमेल ट्राइएज, वर्कफ़्लो-ट्रिगर प्रोसेसिंग, और वार्तालाप ट्रैकिंग
- **वित्त** - लेनदेन, प्रवाह, आय, होल्डिंग्स, स्थानांतरण और लागत रिकॉर्डिंग
- **रिकॉर्ड रखना** - खरीद, खाते, संपत्ति और एकमुश्त विश्लेषण रिपोर्ट
- **सामग्री** - पोस्ट, व्यक्तिगत इतिहास, पसंदीदा मीडिया और उपभोग स्रोत
- **स्वास्थ्य** - आदतें, व्यायाम, और चल रही ट्रैकिंग

मैं उपयोग के पैमाने के रूप में अधिक सतह क्षेत्र, तनाव-परीक्षण इकाई और संबंध समाधान और समयरेखा प्रश्नों को जोड़ने से पहले एमसीपी स्थिरता और न्यूनतम सीएलआई को प्राथमिकता दे रहा हूं।

यदि यह फ़्रेमिंग प्रतिध्वनित होती है, तो कार्य यहां खुले में हो रहा है:
[https://github.com/markmhendrickson/neotoma](https://github.com/markmhendrickson/neotoma)

रेपो के विकसित होने पर उस पर नज़र रखने के लिए उसे तारांकित करना सबसे आसान तरीका है। एजेंटिक सिस्टम और स्केलेबल स्थिति के बारे में सोचने वाले लोगों के इनपुट का हमेशा स्वागत है।

[^1]: इसका नाम जीनस *नियोटोमा* (पैक्रेट्स) के नाम पर रखा गया है, जो सामग्री एकत्र करने और संरक्षित करने के लिए जाना जाता है।