मेरा एजेंटिक स्टैक वास्तव में क्या करता है
मैंने डॉगफूड नियोटोमा के लिए एक एजेंटिक स्टैक बनाया और अपने काम में तेजी लाई। 12+ एमसीपी सर्वर के साथ एक निजी मोनोरेपो जहां मैं रोजाना एआई एजेंटों के साथ काम करता हूं। नियोटोमा नीचे संरचित मेमोरी प्रदान करता है, जिससे एजेंटों को प्रत्येक सत्र में पूर्व कार्य करने में मदद मिलती है।
चाबी छीनना
- मेरा एजेंटिक स्टैक 12+ एमसीपी सर्वर, लगातार नियमों और पुन: प्रयोज्य कौशल के साथ एक निजी मोनोरेपो है। मैं पूरे दिन कर्सर में एआई एजेंटों के साथ काम करता हूं, ईमेल ट्राइएज से लेकर बिटकॉइन भुगतान से लेकर वेबसाइट परिनियोजन तक के कार्यों के लिए सत्र खोलता हूं।
- नियोटोमा नीचे संरचित मेमोरी परत प्रदान करता है: 1,000+ संपर्क, 600 कार्य, 170 इकाई प्रकार। एजेंट हर मोड़ पर संस्थाओं और रिश्तों को संग्रहीत करते हैं और प्रतिक्रिया देने से पहले पूर्व संदर्भ पुनः प्राप्त करते हैं।
- वास्तविक एमसीपी कॉल पैटर्न दिखाती हैं: एक एकल `स्टोर' कॉल एक वार्तालाप, निकाले गए संपर्क, कार्यों और एक पेलोड में टाइप किए गए रिश्तों को जारी रखती है। पुनर्प्राप्ति कॉल एजेंटों को कार्य करने से पहले संदर्भ देती हैं।
- नियोटोमा की स्तरित वास्तुकला सत्य (घटना-स्रोत वाली स्थिति), रणनीति (शुद्ध अनुभूति, निर्णय बाहर), और निष्पादन (दुष्प्रभाव, घटनाएँ वापस) को अलग करती है। आज मैं रणनीति परत हूं। आर्किटेक्चर उस भूमिका को सॉफ़्टवेयर द्वारा प्रतिस्थापित करने योग्य बनाता है।
- लक्ष्य हाथों-हाथ निष्पादन से समीक्षा और अनुमोदन की ओर स्थानांतरित करना है, जिसमें एजेंट स्वायत्त रूप से दोहराए जाने वाले वर्कफ़्लो को संभालते हैं। एक बार जब व्यक्तिगत डेटा को नियोटोमा में स्थानांतरित कर दिया जाएगा और स्क्रिप्ट को सामान्य होने के लिए दोबारा तैयार कर लिया जाएगा तो स्टैक ओपन-सोर्स हो जाएगा।

मेरा एजेंटिक स्टैक यह है कि मैं कैसे डॉगफूड करता हूं नियोटोमा। यह मेरा निजी ऑपरेटिंग सिस्टम भी है। एक निजी मोनोरेपो जहां एआई एजेंट ईमेल ट्राइएज से लेकर बिटकॉइन भुगतान से लेकर वेबसाइट परिनियोजन तक सब कुछ संभालते हैं, जिसके नीचे नियोटोमा संरचित मेमोरी है।
नियोटोमा में मेरे द्वारा भेजा गया हर फीचर पहले यहां मान्य होता है, मुख्य रूप से [कर्सर] (https://cursor.com) में और दूसरा टर्मिनल एजेंटों जैसे [क्लाउड कोड] (https://www.anthropic.com/claude-code), [कोडेक्स] (https://openai.com/codex), और [कर्सर सीएलआई] (https://cursor.com/cli) के माध्यम से। एजेंट मेमोरी में मुझे जो भी अंतर मिलता है वह सबसे पहले यहां सामने आता है। स्टैक इस प्रकार है कि मैं अपना दैनिक जीवन और कार्य कैसे चलाता हूँ। उपयोगकर्ता प्रतिक्रिया के अलावा, मुझे जो घर्षण का सामना करना पड़ता है, वही नियोटोमा रोडमैप को संचालित करता है।
मैं स्टैक को ओपन-सोर्स करने का इरादा रखता हूं। लेकिन रेपो ने महीनों का व्यक्तिगत डेटा, मेरे खातों में हार्डकोड की गई स्क्रिप्ट और मेरे सेटअप से जुड़ा कॉन्फ़िगरेशन जमा कर लिया है। इससे पहले कि यह सार्वजनिक हो सके, मुझे उस डेटा को पूरी तरह से नियोटोमा में डालना होगा और टूलींग को सामान्य बनाने के लिए उसे दोबारा तैयार करना होगा। वह काम जारी है.
यह पोस्ट बताती है कि स्टैक क्या है, मैं इसका उपयोग कैसे करता हूं, और यह बताता है कि संरचित एजेंट मेमोरी को क्या करने की आवश्यकता है।
स्टैक क्या है
स्टैक एक मोनोरेपो है जिसमें एक दर्जन से अधिक [एमसीपी] (https://modelcontextprotocol.io) सर्वर और सीएलआई हैं, प्रत्येक एआई एजेंटों को एक अलग सेवा से जोड़ता है: [जीमेल] (https://github.com/markmhendrickson/mcp-server-gmail), [Google कैलेंडर] (https://github.com/markmhendrickson/mcp-server-google-calendar), व्हाट्सएप, एक बिटकॉइन वॉलेट, इंस्टाग्राम, आसन, होमकिट, DNSimple, Google सर्च कंसोल, 1पासवर्ड, एक वेब स्क्रेपर, और भी बहुत कुछ। कुछ MCP सर्वर हैं जिन्हें एजेंट टूल कहते हैं। अन्य सीएलआई हैं जिन्हें एजेंट टर्मिनल से मंगाते हैं। दोनों एजेंटों को एक ही चीज़ देते हैं: बाहरी सेवाओं तक पहुँचना।
एमसीपी सर्वर के शीर्ष पर नियम और कौशल बैठे हैं। नियम लगातार व्यवहार संबंधी निर्देश हैं जो रेपो में रहते हैं, नियोटोमा में नहीं: हमेशा प्रतिक्रिया देने से पहले संपर्कों को नियोटोमा में संग्रहीत करें, कभी रहस्य न बताएं, शीर्षकों में वाक्य केस का उपयोग करें, कोड परिवर्तन के बाद परीक्षण चलाएं, लॉग और कॉन्फ़िगरेशन के लिए डैशबोर्ड पर सीएलआई को प्राथमिकता दें, उत्पाद नामों के पहले उल्लेख को लिंक करें। कौशल बहु-चरणीय वर्कफ़्लो हैं: मेरे इनबॉक्स को ट्राइएज करें, एक ब्लॉग पोस्ट का मसौदा तैयार करें, एक वेबसाइट तैनात करें, उत्पाद फीडबैक संसाधित करें, ईमेल से अमेज़ॅन ऑर्डर निकालें, बिटकॉइन में एक ठेकेदार को भुगतान करें।
और हर चीज़ के नीचे संरचित मेमोरी परत के रूप में नियोटोमा बैठता है। प्रत्येक एजेंट इसे पढ़ता है और इसे लिखता है। यही वह चीज़ है जो प्रत्येक सत्र पर रीसेट होने के बजाय समय के साथ स्टैक कंपाउंड बनाती है।
मैं इसके साथ कैसे काम करता हूं
मैं कर्सर में रहता हूँ. मेरा दिन एजेंट सत्रों का एक क्रम है। मैं एक नया एजेंट खोलता हूं, वर्णन करता हूं कि मैं क्या करना चाहता हूं, और एजेंट कार्यक्षेत्र में एमसीपी सर्वर, नियमों और कौशल का उपयोग करके कार्यान्वित करता है। कुछ सत्र त्वरित होते हैं: "इस ईमेल का उत्तर दें।" कुछ लंबे हैं: "मेरे इनबॉक्स को ट्राइएज करें, नवीनतम परीक्षक प्रतिक्रिया को संसाधित करें, फिर [Google के मेमोरी एजेंट] (/पोस्ट/हमेशा-ऑन-मेमोरी-एजेंट-और-द-ट्रुथ-लेयर) के बारे में एक तुलनात्मक पोस्ट का मसौदा तैयार करें।"
यह एजेंटों के साथ मिलकर काम कर रहा है। मैं अपने डेस्क पर बैठता हूं और पूरे दिन उनके साथ काम करता हूं। व्यक्तिगत कार्य: मरम्मत का समय निर्धारित करना, ठेकेदार को भुगतान करना, कैलेंडर कार्यक्रमों का प्रबंधन करना। पेशेवर: पोस्ट लिखना, फीडबैक संसाधित करना, वेबसाइट तैनात करना, डोमेन प्रबंधित करना। एजेंट निष्पादन को संभालते हैं। मैं दिशानिर्देश प्रदान करता हूं, आउटपुट की समीक्षा करता हूं और उन कार्यों को मंजूरी देता हूं जिनके लिए लूप में एक मानव की आवश्यकता होती है।
प्रत्येक एजेंट सत्र में पूर्ण कार्यक्षेत्र संदर्भ होता है: प्रत्येक MCP सर्वर, प्रत्येक नियम, प्रत्येक कौशल। एजेंट मेरे जीमेल को पढ़ सकता है, मेरे कैलेंडर की जांच कर सकता है, पूर्व संदर्भ के लिए नियोटोमा से पूछताछ कर सकता है, नया डेटा संग्रहीत कर सकता है, छवियां उत्पन्न कर सकता है, कोड पुश कर सकता है और तैनाती को सत्यापित कर सकता है। इरादे का वर्णन करने और परिणामों की समीक्षा करने में मेरी भूमिका बढ़ती जा रही है।
नियोटोमा कैसे फिट बैठता है
संरचित मेमोरी के बिना, प्रत्येक एजेंट सत्र शून्य से शुरू होता है। एजेंट को यह नहीं पता होता है कि आपके संपर्क कौन से हैं, आपके पास कौन से कार्य खुले हैं, आपने कल क्या चर्चा की थी, या आपने पहले ही किसी को कितना भुगतान कर दिया है। आप प्रत्येक संकेत में संदर्भ चिपका सकते हैं, लेकिन यह कुछ सत्रों से आगे नहीं बढ़ता है। प्लेटफ़ॉर्म मेमोरी आपके वाइब को संग्रहीत करता है, आपके काम को नहीं। RAG कोड के साथ मदद करता है, लेकिन उन संरचित तथ्यों के साथ नहीं जो वर्कफ़्लो को संचालित करते हैं: आपको किसके पैसे देने हैं, आपको पिछले सप्ताह क्या फीडबैक मिला था, कौन से कार्य अभी भी खुले हैं।
मेरा नियोटोमा इंस्टेंस 1,000 से अधिक संपर्कों, 600 कार्यों, 140 वार्तालापों, 120 ब्लॉग पोस्टों और 170 इकाई प्रकारों को संग्रहीत करता है जिन्हें एजेंटों ने नई प्रकार की जानकारी का सामना करने के दौरान बनाया था: लेनदेन, स्थायी नियम, फीडबैक नोट्स, कैलेंडर ईवेंट, विवाद, चालान, कौशल, तैनाती परिणाम। जब कोई एजेंट एक नया सत्र शुरू करता है, तो उसे वह सब मिल जाता है जिसकी उसे आवश्यकता होती है। जब यह समाप्त हो जाता है, तो यह जो कुछ सीखा था उसे संग्रहीत करता है।
आज मेरे नियोटोमा इंस्टेंस में शीर्ष 20 इकाई प्रकार हैं, प्रत्येक के एक उदाहरण के साथ:
इनमें से कोई भी स्कीमा पहले से डिज़ाइन नहीं किया गया था। एजेंट आवश्यकतानुसार स्कीमा बनाते और विस्तारित करते हैं क्योंकि उन्हें नई प्रकार की जानकारी मिलती है। सिस्टम में अब कुल 170 इकाई प्रकार हैं, जिनमें से अधिकांश में केवल कुछ मुट्ठी भर रिकॉर्ड हैं। लंबी पूंछ वह जगह है जहां एजेंट की स्मृति दिलचस्प हो जाती है: अपने पूर्ण बातचीत इतिहास के साथ एक एकल विवाद इकाई, यदि रणनीति बदलती है तो किसी के साथ अनुवर्ती कार्रवाई करने की एक एकल प्रतिबद्धता, एक विशिष्ट भुगतान को कैसे संभालना है इसके बारे में एक एकल प्राथमिकता।
व्यावहारिक अंतर यह है कि एजेंट पूर्व कार्य पर आधारित होते हैं। जब मैं किसी एजेंट से किसी को ईमेल करने के लिए कहता हूं, तो वह पहले संपर्क के लिए नियोटोमा खोजता है। जब मैं इसे फीडबैक संसाधित करने के लिए कहता हूं, तो यह मौजूदा फीडबैक इकाइयों को पुनः प्राप्त करता है और नई इकाइयों को लिंक करता है। जब मैं इसे बिटकॉइन में एक ठेकेदार को भुगतान करने के लिए कहता हूं, तो यह स्थायी नियम जानता है (इस व्यक्ति को हमेशा बीटीसी में भुगतान करें) और पुष्टिकरण में लेनदेन लिंक शामिल करता है क्योंकि एक अन्य स्थायी नियम कहता है।
भंडारण और पुनर्प्राप्ति करीब से
नियोटोमा एमसीपी उन उपकरणों को उजागर करता है जिन्हें एजेंट सीधे कॉल करते हैं। यहाँ वास्तविक भंडारण और पुनर्प्राप्ति व्यवहार में कैसी दिखती है।
जब किसी एजेंट को निकाली गई संस्थाओं के साथ बातचीत जारी रखने की आवश्यकता होती है, तो वह एकल पेलोड के साथ स्टोर को कॉल करता है:
स्टोर({
"इकाइयाँ": [
{
"entity_type": "बातचीत",
"शीर्षक": "ईमेल ट्राइएज 9 मार्च"
},
{
"entity_type": "एजेंट_मैसेज",
"भूमिका": "उपयोगकर्ता",
"सामग्री": "मेरे इनबॉक्स को ट्राइएज करें",
"टर्न_की": "कन्व-42:1"
},
{
"entity_type": "संपर्क",
"पूरा_नाम": "एलेक्स चेन",
"ईमेल": "alex@example.com",
"स्रोत": "परीक्षक फीडबैक कॉल"
},
{
"entity_type": "कार्य",
"शीर्षक": "एलेक्स की प्रतिक्रिया का पालन करें",
"स्थिति": "लंबित",
"प्राथमिकता": "मध्यम"
}
],
"रिश्ते": [
{
"संबंध_प्रकार": "PART_OF",
"स्रोत_सूचकांक": 1,
"लक्ष्य_सूचकांक": 0
},
{
"रिलेशनशिप_टाइप": "REFERS_TO",
"स्रोत_सूचकांक": 1,
"लक्ष्य_सूचकांक": 2
},
{
"रिलेशनशिप_टाइप": "REFERS_TO",
"स्रोत_सूचकांक": 1,
"लक्ष्य_सूचकांक": 3
}
],
"idempotency_key": "conv-42-turn-1-triage"
})
एक कॉल में बातचीत, संदेश, एक नया संपर्क और एक कार्य संग्रहीत होता है, जो सभी टाइप किए गए रिश्तों से जुड़े होते हैं। एजेंट को पहले से संपर्क या कार्य के लिए स्कीमा परिभाषा की आवश्यकता नहीं थी। नियोटोमा मनमाने क्षेत्रों को स्वीकार करता है और संरचना का अनुमान लगाता है।
जब किसी एजेंट को प्रतिक्रिया देने से पहले संदर्भ की आवश्यकता होती है, तो वह पहचानकर्ता द्वारा पूछताछ करता है:
पुनर्प्राप्त_entity_by_identifier({
"पहचानकर्ता": "एलेक्स चेन"
})
यह ईमेल, पूर्व वार्तालाप और प्रत्येक क्षेत्र की उत्पत्ति के साथ संपर्क रिकॉर्ड लौटाता है। यदि एजेंट को व्यापक संदर्भ की आवश्यकता है, तो वह प्रकार के आधार पर प्रश्न पूछता है:
पुनःप्राप्त_इकाईयाँ({
"entity_type": "फीडबैक_नोट",
"खोज": "डेवलपर रिलीज़",
"सीमा": 10
})
यह डेवलपर रिलीज़ के बारे में दस सबसे प्रासंगिक फीडबैक नोट्स लौटाता है, जिनमें से प्रत्येक का पूरा स्नैपशॉट और अवलोकन इतिहास होता है।
स्थायी नियमों के लिए, एजेंट वर्कफ़्लो की शुरुआत में एक बार उन्हें पुनः प्राप्त करता है:
पुनःप्राप्त_इकाईयाँ({
"इकाई_प्रकार": "स्थायी_नियम"
})
मेरा उदाहरण "हमेशा कार्लोस को बिटकॉइन में भुगतान करें" और "मार्कडाउन ब्लॉक में ड्राफ्ट किए गए संदेश प्रदान करें" जैसे नियम लौटाता है। एजेंट इन्हें शेष सत्र के लिए स्वचालित रूप से लागू करता है।
जब वर्कफ़्लो फ़ाइलों (रसीदें, स्क्रीनशॉट, दस्तावेज़) को छूता है, तो एजेंट उन्हें 'file_path' का उपयोग करके एक ही कॉल में इकाइयों के साथ संग्रहीत करता है:
स्टोर({
"इकाइयाँ": [
{
"entity_type": "लेन-देन",
"विक्रेता": "अमेज़ॅन",
"राशि": 47.99,
"मुद्रा": "EUR"
}
],
"file_path": "/path/to/receipt.pdf",
"idempotency_key": "अमेज़ॅन-ऑर्डर-मार्च-9"
})
नियोटोमा का असंरचित भंडारण पथ वहां से फ़ाइल को संभालता है। कच्चे बाइट्स सामग्री-संबोधित (SHA-256) हैं इसलिए एक ही फ़ाइल को कभी भी दो बार संग्रहीत नहीं किया जाता है। एजेंट फ़ाइल को file_path (कर्सर जैसे स्थानीय वातावरण) या file_content (वेब-आधारित वातावरण के लिए बेस64) के माध्यम से वैसे ही पास करता है; यह भंडारण से पहले डेटा की व्याख्या या निष्कर्षण नहीं करता है। डिफ़ॉल्ट रूप से, नियोटोमा स्वचालित रूप से संग्रहीत फ़ाइल पर एआई व्याख्या चलाता है, संरचित इकाइयों को निकालता है और उन्हें ईएमबीईडीएस संबंध के साथ स्रोत से वापस जोड़ता है। interpret: true के साथ उसी फ़ाइल को दोबारा संग्रहीत करने से डुप्लिकेट बनाए बिना पुनर्व्याख्या शुरू हो जाती है। रसीद स्रोत के लिए संरक्षित मूल पीडीएफ के साथ पूछताछ योग्य संरचित डेटा बन जाती है। बैच प्रोसेसिंग या कोटा प्रबंधन के लिए व्याख्या को स्थगित भी किया जा सकता है (व्याख्या: गलत), फिर बाद में विभिन्न कॉन्फ़िगरेशन के साथ चलाया जा सकता है।
व्यवहार में कार्यप्रवाह
कुछ वर्कफ़्लोज़ पैटर्न दिखाते हैं।
ईमेल ट्राइएज। एजेंट जीमेल एमसीपी के माध्यम से अपठित ईमेल पढ़ता है, प्रत्येक प्रेषक के साथ मौजूदा संपर्क रिकॉर्ड और पूर्व संदर्भ के लिए नियोटोमा की जांच करता है, मेरे संचार शैली नियमों का उपयोग करके ड्राफ्ट उत्तर देता है, नए संपर्कों और कार्यों को संग्रहीत करता है, और संसाधित संदेशों को संग्रहीत करता है। एक एकल ट्राइएज रन में पांच नए संपर्क, तीन कार्य और एक दर्जन वार्तालाप मोड़ संग्रहीत हो सकते हैं।
ब्लॉग पोस्ट लेखन। कौशल स्वयं एक संरचित इकाई के रूप में नियोटोमा में रहता है। एजेंट इसे retrieve_entity_snapshot के साथ पुनः प्राप्त करता है। इसके बाद यह स्टाइल कैलिब्रेशन के लिए मौजूदा पोस्टों पर सवाल उठाता है, ड्राफ्ट लिखता है, पोस्ट इकाई को सभी मेटाडेटा के साथ संग्रहीत करता है, हीरो छवियां उत्पन्न करता है, ट्विटर और लिंक्डइन के लिए शेयर कॉपी बनाता है, नियोटोमा निर्यात से वेबसाइट कैश को पुन: उत्पन्न करता है, और तैनात करता है। यह पोस्ट इसी तरह लिखी गई थी.
बिटकॉइन भुगतान। मैं एक बीटीसी वॉलेट एमसीपी सर्वर का उपयोग करके बिटकॉइन में एक ठेकेदार को भुगतान करता हूं। नियोटोमा स्थायी नियम, संपर्क रिकॉर्ड और लेनदेन इतिहास को संग्रहीत करता है। एजेंट तीनों को पुनः प्राप्त करता है, भुगतान निष्पादित करता है, नए लेनदेन को ऑन-चेन लिंक के साथ संग्रहीत करता है, और पुष्टि करता है।
फीडबैक प्रोसेसिंग। जब परीक्षक नियोटोमा डेवलपर रिलीज पर फीडबैक देते हैं, तो एजेंट संरचित फीडबैक इकाइयां निकालते हैं, उन्हें परीक्षक के संपर्क रिकॉर्ड से जोड़ते हैं, फीडबैक को बकेट द्वारा वर्गीकृत करते हैं, और रिलीज चरण की बाधाओं के खिलाफ इसका आकलन करते हैं। पूर्व फीडबैक परीक्षक, बकेट या तिथि के अनुसार पुनर्प्राप्त किया जा सकता है।
वेबसाइट परिनियोजन। परिनियोजन कौशल स्थानीय मार्कडाउन संपादनों को नियोटोमा में सिंक करता है, संपूर्ण वेबसाइट डेटासेट निर्यात करता है, कैश को पुन: उत्पन्न करता है, वेबसाइट रेपो को पुश करता है, और बिल्ड सफल होने तक GitHub Actions की निगरानी करता है। यदि बिल्ड विफल हो जाता है, तो एजेंट लॉग पढ़ता है, समस्या को ठीक करता है, और फिर से चलाता है।
उन एजेंटों की ओर जो मेरे बिना चलते हैं
प्रत्येक वर्कफ़्लो मेरे द्वारा कर्सर एजेंट खोलने और एक निर्देश टाइप करने से शुरू होता है। मैं हर कार्य के लिए लूप में हूं। यह वर्तमान चरण के लिए ठीक है, लेकिन यह अंतिम स्थिति नहीं है।
मैं स्वचालित प्रक्रियाएं स्थापित कर रहा हूं ताकि एजेंट मेरी प्रत्यक्ष भागीदारी के बिना वर्कफ़्लो को संभाल सकें। टुकड़े पहले से ही मौजूद हैं: कौशल पूर्ण वर्कफ़्लो चरणों को परिभाषित करते हैं, नियोटोमा संदर्भ और नियमों को संग्रहीत करता है, एमसीपी सर्वर पहुंच प्रदान करते हैं। जो चीज़ गायब है वह है ऑर्केस्ट्रेशन जो शेड्यूल पर या घटनाओं के जवाब में वर्कफ़्लो को ट्रिगर करता है, और एक हल्का अनुमोदन इंटरफ़ेस है ताकि मैं अपने लैपटॉप पर बैठे बिना कार्यों की समीक्षा और अधिकृत कर सकूं।
नियोटोमा का लेयर्ड आर्किटेक्चर बिल्कुल इसी के लिए डिज़ाइन किया गया है। यह तीन चिंताओं को अलग करता है:
- सत्य परत (नियोटोमा)। घटना-स्रोत, रेड्यूसर-चालित, नियतात्मक। सभी एजेंट इससे पढ़ते हैं। राज्य अद्यतन केवल रेड्यूसर द्वारा संसाधित डोमेन घटनाओं के माध्यम से प्रवाहित होते हैं। कोई भी एजेंट सत्य को सीधे तौर पर परिवर्तित नहीं करता।
- रणनीति परत। नियोटोमा से वर्तमान विश्व स्थिति को पढ़ता है। प्राथमिकताओं, बाधाओं, जोखिम, प्रतिबद्धताओं और समय का मूल्यांकन करता है। आउटपुट निर्णय और आदेश। शुद्ध अनुभूति: अवस्था अंदर, निर्णय बाहर। कोई दुष्प्रभाव नहीं।
- निष्पादन परत। रणनीति परत से आदेश लेता है। बाहरी एडेप्टर (ईमेल एपीआई, भुगतान सेवाएं, कैलेंडर, मैसेजिंग) के माध्यम से साइड इफेक्ट करता है। जो कुछ हुआ उसका वर्णन करते हुए डोमेन ईवेंट उत्सर्जित करता है। वे घटनाएँ स्थिति को अद्यतन करने के लिए रिड्यूसर के माध्यम से वापस प्रवाहित होती हैं। शुद्ध प्रभाव: आदेश अंदर, घटनाएँ बाहर।
लूप बंद है:
इनबाउंड सिग्नल (ईमेल, व्हाट्सएप, कैलेंडर, वित्तीय डेटा)
-> सामान्यीकरण -> नियोटोमा स्थिति (इवेंट लॉग + रिड्यूसर)
-> रणनीति टिक (प्राथमिकताओं, आउटपुट निर्णयों का मूल्यांकन करें)
-> निष्पादन एजेंट (दुष्प्रभाव निष्पादित करें, घटनाओं का उत्सर्जन करें)
-> रिड्यूसर -> अद्यतन स्थिति
-> अगला टिक करें
आज, मैं रणनीति परत हूँ. मैं राज्य को देखता हूं, निर्णय लेता हूं कि क्या करना है, और एक एजेंट को कार्यान्वित करने के लिए कहता हूं। आर्किटेक्चर उस भूमिका को सॉफ़्टवेयर द्वारा प्रतिस्थापित करने योग्य बनाता है। एक रणनीति इंजन नियोटोमा को पढ़ता है, स्थायी नियमों और प्राथमिकताओं के आधार पर मूल्यांकन करता है कि किस चीज़ पर ध्यान देने की आवश्यकता है, और निष्पादन एजेंटों को आदेश जारी करता है। वे एजेंट एमसीपी सर्वर को कॉल करते हैं, परिणाम संग्रहीत करते हैं, और चक्र दोहराता है।
महत्वपूर्ण अपरिवर्तनीयता यह है कि कोई भी परत नियोटोमा के अंतर्निहित डेटा स्टोर को सीधे नहीं लिखती है। अपडेट केवल डोमेन इवेंट और रिड्यूसर के माध्यम से प्रवाहित होते हैं। यह सिस्टम को श्रवण योग्य और प्रतिवर्ती बनाता है। यदि कोई स्वायत्त एजेंट कोई बुरा निर्णय लेता है, तो मैं उस घटना का पता लगा सकता हूं जिसके कारण यह हुआ, राज्य अद्यतन वापस कर सकता हूं, और उस नियम को सही कर सकता हूं जिसके कारण यह हुआ।
लक्ष्य कंप्यूटर पर अपना दैनिक समय कम करना है। इसे खत्म मत करो. व्यावहारिक निष्पादन से समीक्षा और अनुमोदन की ओर बदलाव। मैं अपने एजेंटों द्वारा रात भर में किए गए कार्यों का सारांश जानना चाहता हूं: ईमेल का क्रमबद्ध, पोस्ट का मसौदा तैयार किया गया, तैनाती का सत्यापन किया गया, भुगतान कतारबद्ध किया गया। मैं अपनी Apple Watch से बिटकॉइन भुगतान स्वीकृत करना चाहता हूं। मैं चलते समय अपने फोन पर ड्राफ्ट किए गए ईमेल की समीक्षा करना चाहता हूं और भेजने के लिए टैप करना चाहता हूं। एजेंट 80% को संभालते हैं जो दोहराने योग्य है। मैं उस 20% को संभालता हूं जिसके लिए निर्णय की आवश्यकता है।
यहीं पर हार्डवेयर प्रश्न दिलचस्प हो जाता है। आज के फ़ोन और घड़ियाँ इस इंटरैक्शन पैटर्न के लिए डिज़ाइन नहीं किए गए हैं। आपको टाइपिंग या ब्राउज़िंग के लिए नहीं, बल्कि संक्षिप्त समीक्षा और अनुमोदन इशारों के लिए अनुकूलित डिवाइस की आवश्यकता है।
आज मौजूद उपकरणों में से, Apple Watch सही फॉर्म फैक्टर के सबसे करीब महसूस होता है: हमेशा आपकी कलाई पर, देखने योग्य, सरल टैप-टू-अनुमोदन इंटरैक्शन में सक्षम। लेकिन सॉफ्टवेयर परत अभी तक वहां नहीं है. एजेंट के सारांश और अनुमोदन अनुरोधों को घड़ी में उस तरह से भेजने का कोई तरीका नहीं है जो मूल लगे।
यह मेरे लिए किसी बिंदु पर प्रयोग करने का एक क्षेत्र हो सकता है, एक हल्का साथी ऐप बनाना जो नियोटोमा की स्थिति को कलाई-स्तरीय इंटरफ़ेस से जोड़ता है। चाहे सही सतह एक वॉच ऐप, एक समर्पित एआई डिवाइस, या कुछ ऐसा हो जो अभी तक मौजूद नहीं है, इंटरेक्शन मॉडल स्पष्ट है: एजेंट काम करते हैं, संरचित मेमोरी स्थिति रखती है, और मानव निष्पादन की गति के बजाय इरादे की गति से दिशा प्रदान करता है।
स्टैक को ओपन-सोर्स करना
यह स्टैक आज निजी है क्योंकि इसमें मेरा जीवन शामिल है: संपर्क, वित्त, स्वास्थ्य डेटा, व्यक्तिगत संचार, मैं अपना घर कैसे चलाता हूं इसके बारे में स्थायी नियम। इससे पहले कि मैं इसे ओपन-सोर्स कर सकूं, मुझे उन सभी को सुलझाना होगा।
रास्ता सीधा है. व्यक्तिगत डेटा पूरी तरह से नियोटोमा में चला जाता है, जो पहले से ही अधिकांश के लिए सत्य का स्रोत है। स्क्रिप्ट जो मेरे विशिष्ट खातों और पथों को संदर्भित करती हैं, उन्हें कॉन्फ़िगरेशन से पढ़ने के लिए दोबारा तैयार किया जाता है। एमसीपी सर्वर रैपर सामान्य हो जाते हैं। कौशल अपनी हार्डकोडेड धारणाएँ खो देते हैं।
जो बचता है वह एक पुन: प्रयोज्य एजेंटिक स्टैक है: एमसीपी सर्वर मचान के साथ एक मोनोरेपो टेम्पलेट, एक नियम और कौशल ढांचा, संरचित मेमोरी के लिए नियोटोमा एकीकरण, और उदाहरण वर्कफ़्लो जिसे कोई भी अनुकूलित कर सकता है। वास्तुकला दिलचस्प हिस्सा है. मेरा व्यक्तिगत डेटा नहीं है.
मेरे पास इसके लिए कोई समयसीमा नहीं है. रिफैक्टरिंग दैनिक उपयोग के साथ-साथ होती है। जब भी मैं किसी स्क्रिप्ट को छूता हूं, मैं उसे और अधिक सामान्य बना देता हूं। जब भी मैं डेटा को नियोटोमा में ले जाता हूं, मैं उसे रेपो से हटा देता हूं। प्रत्येक सत्र के साथ स्टैक अधिक पोर्टेबल हो जाता है।
नियोटोमा के बारे में इससे क्या सिद्ध होता है
मैंने यह स्टैक नियोटोमा के अस्तित्व में आने से पहले बनाया था। प्रारंभिक संस्करण में फ़्लैट फ़ाइलें और Parquet तालिकाओं का उपयोग किया गया था। इसने तब तक काम किया जब तक ऐसा नहीं हुआ।
[विफलता मोड] (/ पोस्ट/ट्रुथ-लेयर-एजेंट-मेमोरी) विशिष्ट थे: एक एजेंट एक संपर्क को एक सत्र में "सारा किम" और दूसरे में "एस. किम" के रूप में संग्रहीत करेगा, डुप्लिकेट बनाएगा और उन्हें मर्ज करने का कोई तरीका नहीं होगा। कोई उद्गम नहीं था, इसलिए मैं यह नहीं बता सका कि किस एजेंट ने फ़ील्ड लिखी या कब।
प्रश्न एकल कॉलम पर सटीक मिलान तक सीमित थे, इसलिए यह पूछना कि "मुझे पिछले सप्ताह क्या प्रतिक्रिया मिली?" मतलब हर फ़ाइल को मैन्युअल रूप से स्कैन करना। कभी-कभी रिकॉर्ड को बुरी तरह से अधिलेखित कर दिया जाता था या पूरी तरह से हटा दिया जाता था, जिससे पुनर्प्राप्त करने के लिए कोई इवेंट लॉग नहीं होता था। और विभिन्न प्रकारों से जुड़ा हुआ कुछ भी नहीं है, इसलिए यह जानते हुए कि किसी लेन-देन से संबंधित संपर्क से संबंधित कार्य के लिए मुझे उस ग्राफ़ को अपने दिमाग में रखना होगा।
नियोटोमा ने उस परत को प्रतिस्थापित कर दिया। इसने एजेंटों को एक [संरचित, क्वेरी करने योग्य, संबंध-जागरूक मेमोरी] (/पोस्ट/एजेंट-मेमोरी-सच्चाई-समस्या) दी जो हर वर्कफ़्लो पर काम करती है। स्टैक में अब नियोटोमा में 170 इकाई प्रकार हैं, इसलिए नहीं कि मैंने 170 स्कीमा पहले से डिज़ाइन किए हैं, बल्कि इसलिए कि एजेंट इकाई प्रकार बनाते हैं क्योंकि उन्हें नई प्रकार की जानकारी मिलती है। एक फीडबैक नोट एक लेन-देन से अलग होता है, एक स्थायी नियम से अलग होता है, और सिस्टम उन सभी को संभालता है।
यह डॉगफ़ूडिंग है जो नियोटोमा को ईमानदार रखती है। जब पुनर्प्राप्ति धीमी होती है, तो मैं इसे प्रत्येक एजेंट सत्र में महसूस करता हूं। जब इकाई रिज़ॉल्यूशन विफल हो जाता है, तो मुझे डुप्लिकेट संपर्क मिलते हैं। जब भंडारण अविश्वसनीय होता है, तो वर्कफ़्लो टूट जाता है। हर बग और हर अंतर किसी और के काम में दिखने से पहले मेरे दैनिक काम में दिखता है।
स्मृति समस्या सार्वभौमिक है. एजेंटिक वर्कफ़्लो का निर्माण करने वाला प्रत्येक डेवलपर एक ही दीवार से टकराएगा: ऐसे एजेंट जो याद नहीं रख सकते, क्वेरी नहीं कर सकते, और पूर्व कार्य पर निर्माण नहीं कर सकते। अकेले पुनर्प्राप्ति पर्याप्त नहीं है; संरचना और उद्गम स्मृति को भरोसेमंद बनाते हैं। यह स्टैक इस बात का प्रमाण है कि संरचित मेमोरी वह परिवर्तन करती है जो एजेंट कर सकते हैं। नियोटोमा के माध्यम से मैं इसे हर किसी के लिए उपलब्ध करा रहा हूं।
डेवलपर रिलीज परीक्षण के लिए खुला है। यदि आप एजेंटिक वर्कफ़्लोज़ का निर्माण कर रहे हैं और नीचे संरचित मेमोरी चाहते हैं, तो यहीं से शुरुआत करें।