मेरा एजेंटिक स्टैक वास्तव में क्या करता है

मेरा एजेंटिक स्टैक यह है कि मैं कैसे डॉगफूड करता हूं नियोटोमा। यह मेरा निजी ऑपरेटिंग सिस्टम भी है। एक निजी मोनोरेपो जहां एआई एजेंट ईमेल ट्राइएज से लेकर बिटकॉइन भुगतान से लेकर वेबसाइट परिनियोजन तक सब कुछ संभालते हैं, जिसके नीचे नियोटोमा संरचित मेमोरी है।

नियोटोमा में मेरे द्वारा भेजा गया हर फीचर पहले यहां मान्य होता है, मुख्य रूप से कर्सर में और दूसरा टर्मिनल एजेंटों जैसे क्लाउड कोड, कोडेक्स, और कर्सर सीएलआई के माध्यम से। एजेंट मेमोरी में मुझे जो भी अंतर मिलता है वह सबसे पहले यहां सामने आता है। स्टैक इस प्रकार है कि मैं अपना दैनिक जीवन और कार्य कैसे चलाता हूँ। उपयोगकर्ता प्रतिक्रिया के अलावा, मुझे जो घर्षण का सामना करना पड़ता है, वही नियोटोमा रोडमैप को संचालित करता है।

मैं स्टैक को ओपन-सोर्स करने का इरादा रखता हूं। लेकिन रेपो ने महीनों का व्यक्तिगत डेटा, मेरे खातों में हार्डकोड की गई स्क्रिप्ट और मेरे सेटअप से जुड़ा कॉन्फ़िगरेशन जमा कर लिया है। इससे पहले कि यह सार्वजनिक हो सके, मुझे उस डेटा को पूरी तरह से नियोटोमा में डालना होगा और टूलींग को सामान्य बनाने के लिए उसे दोबारा तैयार करना होगा। वह काम जारी है.

यह पोस्ट बताती है कि स्टैक क्या है, मैं इसका उपयोग कैसे करता हूं, और यह बताता है कि संरचित एजेंट मेमोरी को क्या करने की आवश्यकता है।

स्टैक क्या है

स्टैक एक मोनोरेपो है जिसमें एक दर्जन से अधिक एमसीपी सर्वर और सीएलआई हैं, प्रत्येक एआई एजेंटों को एक अलग सेवा से जोड़ता है: जीमेल, Google कैलेंडर, व्हाट्सएप, एक बिटकॉइन वॉलेट, इंस्टाग्राम, आसन, होमकिट, DNSimple, Google सर्च कंसोल, 1पासवर्ड, एक वेब स्क्रेपर, और भी बहुत कुछ। कुछ MCP सर्वर हैं जिन्हें एजेंट टूल कहते हैं। अन्य सीएलआई हैं जिन्हें एजेंट टर्मिनल से मंगाते हैं। दोनों एजेंटों को एक ही चीज़ देते हैं: बाहरी सेवाओं तक पहुँचना।

एमसीपी सर्वर के शीर्ष पर नियम और कौशल बैठे हैं। नियम लगातार व्यवहार संबंधी निर्देश हैं जो रेपो में रहते हैं, नियोटोमा में नहीं: हमेशा प्रतिक्रिया देने से पहले संपर्कों को नियोटोमा में संग्रहीत करें, कभी रहस्य न बताएं, शीर्षकों में वाक्य केस का उपयोग करें, कोड परिवर्तन के बाद परीक्षण चलाएं, लॉग और कॉन्फ़िगरेशन के लिए डैशबोर्ड पर सीएलआई को प्राथमिकता दें, उत्पाद नामों के पहले उल्लेख को लिंक करें। कौशल बहु-चरणीय वर्कफ़्लो हैं: मेरे इनबॉक्स को ट्राइएज करें, एक ब्लॉग पोस्ट का मसौदा तैयार करें, एक वेबसाइट तैनात करें, उत्पाद फीडबैक संसाधित करें, ईमेल से अमेज़ॅन ऑर्डर निकालें, बिटकॉइन में एक ठेकेदार को भुगतान करें।

और हर चीज़ के नीचे संरचित मेमोरी परत के रूप में नियोटोमा बैठता है। प्रत्येक एजेंट इसे पढ़ता है और इसे लिखता है। यही वह चीज़ है जो प्रत्येक सत्र पर रीसेट होने के बजाय समय के साथ स्टैक कंपाउंड बनाती है।

मैं इसके साथ कैसे काम करता हूं

मैं कर्सर में रहता हूँ. मेरा दिन एजेंट सत्रों का एक क्रम है। मैं एक नया एजेंट खोलता हूं, वर्णन करता हूं कि मैं क्या करना चाहता हूं, और एजेंट कार्यक्षेत्र में एमसीपी सर्वर, नियमों और कौशल का उपयोग करके कार्यान्वित करता है। कुछ सत्र त्वरित होते हैं: "इस ईमेल का उत्तर दें।" कुछ लंबे हैं: "मेरे इनबॉक्स को ट्राइएज करें, नवीनतम परीक्षक प्रतिक्रिया को संसाधित करें, फिर Google के मेमोरी एजेंट के बारे में एक तुलनात्मक पोस्ट का मसौदा तैयार करें।"

यह एजेंटों के साथ मिलकर काम कर रहा है। मैं अपने डेस्क पर बैठता हूं और पूरे दिन उनके साथ काम करता हूं। व्यक्तिगत कार्य: मरम्मत का समय निर्धारित करना, ठेकेदार को भुगतान करना, कैलेंडर कार्यक्रमों का प्रबंधन करना। पेशेवर: पोस्ट लिखना, फीडबैक संसाधित करना, वेबसाइट तैनात करना, डोमेन प्रबंधित करना। एजेंट निष्पादन को संभालते हैं। मैं दिशानिर्देश प्रदान करता हूं, आउटपुट की समीक्षा करता हूं और उन कार्यों को मंजूरी देता हूं जिनके लिए लूप में एक मानव की आवश्यकता होती है।

प्रत्येक एजेंट सत्र में पूर्ण कार्यक्षेत्र संदर्भ होता है: प्रत्येक MCP सर्वर, प्रत्येक नियम, प्रत्येक कौशल। एजेंट मेरे जीमेल को पढ़ सकता है, मेरे कैलेंडर की जांच कर सकता है, पूर्व संदर्भ के लिए नियोटोमा से पूछताछ कर सकता है, नया डेटा संग्रहीत कर सकता है, छवियां उत्पन्न कर सकता है, कोड पुश कर सकता है और तैनाती को सत्यापित कर सकता है। इरादे का वर्णन करने और परिणामों की समीक्षा करने में मेरी भूमिका बढ़ती जा रही है।

नियोटोमा कैसे फिट बैठता है

संरचित मेमोरी के बिना, प्रत्येक एजेंट सत्र शून्य से शुरू होता है। एजेंट को यह नहीं पता होता है कि आपके संपर्क कौन से हैं, आपके पास कौन से कार्य खुले हैं, आपने कल क्या चर्चा की थी, या आपने पहले ही किसी को कितना भुगतान कर दिया है। आप प्रत्येक संकेत में संदर्भ चिपका सकते हैं, लेकिन यह कुछ सत्रों से आगे नहीं बढ़ता है। प्लेटफ़ॉर्म मेमोरी आपके वाइब को संग्रहीत करता है, आपके काम को नहीं। RAG कोड के साथ मदद करता है, लेकिन उन संरचित तथ्यों के साथ नहीं जो वर्कफ़्लो को संचालित करते हैं: आपको किसके पैसे देने हैं, आपको पिछले सप्ताह क्या फीडबैक मिला था, कौन से कार्य अभी भी खुले हैं।

मेरा नियोटोमा इंस्टेंस 1,000 से अधिक संपर्कों, 600 कार्यों, 140 वार्तालापों, 120 ब्लॉग पोस्टों और 170 इकाई प्रकारों को संग्रहीत करता है जिन्हें एजेंटों ने नई प्रकार की जानकारी का सामना करने के दौरान बनाया था: लेनदेन, स्थायी नियम, फीडबैक नोट्स, कैलेंडर ईवेंट, विवाद, चालान, कौशल, तैनाती परिणाम। जब कोई एजेंट एक नया सत्र शुरू करता है, तो उसे वह सब मिल जाता है जिसकी उसे आवश्यकता होती है। जब यह समाप्त हो जाता है, तो यह जो कुछ सीखा था उसे संग्रहीत करता है।

आज मेरे नियोटोमा इंस्टेंस में शीर्ष 20 इकाई प्रकार हैं, प्रत्येक के एक उदाहरण के साथ:

इकाई प्रकार	उदाहरण
एजेंट संदेश	"मेरे इनबॉक्स का परीक्षण करें और परीक्षक प्रतिक्रिया की प्रक्रिया करें"
प्रतिबद्धताएँ	यदि फंडिंग रणनीति बदलती है तो निवेशक को सूचित करें
कंपनियाँ	एक्मे डिज़ाइन स्टूडियो, acme-studio.com
संपर्क	सारा किम, [email protected], जीमेल से आयातित, फिर हर बार जब मैं उसके साथ बातचीत करता हूं तो उसे बढ़ाया जाता है
बातचीत	"ईमेल ट्राइएज 9 मार्च"
विवाद	रिफंड विवाद, 99 यूरो, समीक्षा में
ईमेल संदेश	"पुन: साझेदारी प्रस्ताव," 8 मार्च
घटनाएँ	स्कूल प्ले रिहर्सल, शनिवार सुबह 10 बजे, पोशाक लेकर आएं
फीडबैक नोट्स	"स्कीमा डिस्कवरी को बेहतर दस्तावेज़ों की आवश्यकता है," डेवलपर रिलीज़
चालान	चालान #2038, 1,450 यूरो, घर की मरम्मत
लिंक	लिंक्डइन, linksin.com/in/username, सोशल
स्थान	बार्सिलोना, स्पेन (घर)
पोस्ट	एजेंट मेमोरी को RAG से अधिक की आवश्यकता क्यों है, निबंध, प्रकाशित
प्राथमिकताएं	पिलेट्स क्लास भुगतान के लिए कभी भी मेमो फ़ील्ड शामिल न करें
स्थाई नियम	भुगतान पुष्टिकरण में हमेशा लेनदेन लिंक शामिल करें
कौशल	फिक्स-फ़ीचर-बग: त्रुटि वर्गीकृत करें, प्रतिगमन परीक्षण जोड़ें, सुइट चलाएँ; ईमेल-ट्राएज: प्रक्रिया इनबॉक्स, ड्राफ्ट उत्तर, संग्रह
कार्य	"प्रतिरोध बैंड खरीदें," तात्कालिकता स्तर, स्वास्थ्य डोमेन के साथ लंबित
समयरेखा प्रविष्टियाँ	टेकक्रंच में प्रोजेक्ट मैनेजर, 2007-2009
लेनदेन	मार्च सेवाओं के लिए कार्लोस को 0.0021 बीटीसी ($178) का भुगतान किया गया

इनमें से कोई भी स्कीमा पहले से डिज़ाइन नहीं किया गया था। एजेंट आवश्यकतानुसार स्कीमा बनाते और विस्तारित करते हैं क्योंकि उन्हें नई प्रकार की जानकारी मिलती है। सिस्टम में अब कुल 170 इकाई प्रकार हैं, जिनमें से अधिकांश में केवल कुछ मुट्ठी भर रिकॉर्ड हैं। लंबी पूंछ वह जगह है जहां एजेंट की स्मृति दिलचस्प हो जाती है: अपने पूर्ण बातचीत इतिहास के साथ एक एकल विवाद इकाई, यदि रणनीति बदलती है तो किसी के साथ अनुवर्ती कार्रवाई करने की एक एकल प्रतिबद्धता, एक विशिष्ट भुगतान को कैसे संभालना है इसके बारे में एक एकल प्राथमिकता।

व्यावहारिक अंतर यह है कि एजेंट पूर्व कार्य पर आधारित होते हैं। जब मैं किसी एजेंट से किसी को ईमेल करने के लिए कहता हूं, तो वह पहले संपर्क के लिए नियोटोमा खोजता है। जब मैं इसे फीडबैक संसाधित करने के लिए कहता हूं, तो यह मौजूदा फीडबैक इकाइयों को पुनः प्राप्त करता है और नई इकाइयों को लिंक करता है। जब मैं इसे बिटकॉइन में एक ठेकेदार को भुगतान करने के लिए कहता हूं, तो यह स्थायी नियम जानता है (इस व्यक्ति को हमेशा बीटीसी में भुगतान करें) और पुष्टिकरण में लेनदेन लिंक शामिल करता है क्योंकि एक अन्य स्थायी नियम कहता है।

भंडारण और पुनर्प्राप्ति करीब से

नियोटोमा एमसीपी उन उपकरणों को उजागर करता है जिन्हें एजेंट सीधे कॉल करते हैं। यहाँ वास्तविक भंडारण और पुनर्प्राप्ति व्यवहार में कैसी दिखती है।

जब किसी एजेंट को निकाली गई संस्थाओं के साथ बातचीत जारी रखने की आवश्यकता होती है, तो वह एकल पेलोड के साथ स्टोर को कॉल करता है:

स्टोर({
  "इकाइयाँ": [
    {
      "entity_type": "बातचीत",
      "शीर्षक": "ईमेल ट्राइएज 9 मार्च"
    },
    {
      "entity_type": "एजेंट_मैसेज",
      "भूमिका": "उपयोगकर्ता",
      "सामग्री": "मेरे इनबॉक्स को ट्राइएज करें",
      "टर्न_की": "कन्व-42:1"
    },
    {
      "entity_type": "संपर्क",
      "पूरा_नाम": "एलेक्स चेन",
      "ईमेल": "[email protected]",
      "स्रोत": "परीक्षक फीडबैक कॉल"
    },
    {
      "entity_type": "कार्य",
      "शीर्षक": "एलेक्स की प्रतिक्रिया का पालन करें",
      "स्थिति": "लंबित",
      "प्राथमिकता": "मध्यम"
    }
  ],
  "रिश्ते": [
    {
      "संबंध_प्रकार": "PART_OF",
      "स्रोत_सूचकांक": 1,
      "लक्ष्य_सूचकांक": 0
    },
    {
      "रिलेशनशिप_टाइप": "REFERS_TO",
      "स्रोत_सूचकांक": 1,
      "लक्ष्य_सूचकांक": 2
    },
    {
      "रिलेशनशिप_टाइप": "REFERS_TO",
      "स्रोत_सूचकांक": 1,
      "लक्ष्य_सूचकांक": 3
    }
  ],
  "idempotency_key": "conv-42-turn-1-triage"
})

एक कॉल में बातचीत, संदेश, एक नया संपर्क और एक कार्य संग्रहीत होता है, जो सभी टाइप किए गए रिश्तों से जुड़े होते हैं। एजेंट को पहले से संपर्क या कार्य के लिए स्कीमा परिभाषा की आवश्यकता नहीं थी। नियोटोमा मनमाने क्षेत्रों को स्वीकार करता है और संरचना का अनुमान लगाता है।

जब किसी एजेंट को प्रतिक्रिया देने से पहले संदर्भ की आवश्यकता होती है, तो वह पहचानकर्ता द्वारा पूछताछ करता है:

पुनर्प्राप्त_entity_by_identifier({
  "पहचानकर्ता": "एलेक्स चेन"
})

यह ईमेल, पूर्व वार्तालाप और प्रत्येक क्षेत्र की उत्पत्ति के साथ संपर्क रिकॉर्ड लौटाता है। यदि एजेंट को व्यापक संदर्भ की आवश्यकता है, तो वह प्रकार के आधार पर प्रश्न पूछता है:

पुनःप्राप्त_इकाईयाँ({
  "entity_type": "फीडबैक_नोट",
  "खोज": "डेवलपर रिलीज़",
  "सीमा": 10
})

यह डेवलपर रिलीज़ के बारे में दस सबसे प्रासंगिक फीडबैक नोट्स लौटाता है, जिनमें से प्रत्येक का पूरा स्नैपशॉट और अवलोकन इतिहास होता है।

स्थायी नियमों के लिए, एजेंट वर्कफ़्लो की शुरुआत में एक बार उन्हें पुनः प्राप्त करता है:

पुनःप्राप्त_इकाईयाँ({
  "इकाई_प्रकार": "स्थायी_नियम"
})

मेरा उदाहरण "हमेशा कार्लोस को बिटकॉइन में भुगतान करें" और "मार्कडाउन ब्लॉक में ड्राफ्ट किए गए संदेश प्रदान करें" जैसे नियम लौटाता है। एजेंट इन्हें शेष सत्र के लिए स्वचालित रूप से लागू करता है।

जब वर्कफ़्लो फ़ाइलों (रसीदें, स्क्रीनशॉट, दस्तावेज़) को छूता है, तो एजेंट उन्हें 'file_path' का उपयोग करके एक ही कॉल में इकाइयों के साथ संग्रहीत करता है:

स्टोर({
  "इकाइयाँ": [
    {
      "entity_type": "लेन-देन",
      "विक्रेता": "अमेज़ॅन",
      "राशि": 47.99,
      "मुद्रा": "EUR"
    }
  ],
  "file_path": "/path/to/receipt.pdf",
  "idempotency_key": "अमेज़ॅन-ऑर्डर-मार्च-9"
})

नियोटोमा का असंरचित भंडारण पथ वहां से फ़ाइल को संभालता है। कच्चे बाइट्स सामग्री-संबोधित (SHA-256) हैं इसलिए एक ही फ़ाइल को कभी भी दो बार संग्रहीत नहीं किया जाता है। एजेंट फ़ाइल को file_path (कर्सर जैसे स्थानीय वातावरण) या file_content (वेब-आधारित वातावरण के लिए बेस64) के माध्यम से वैसे ही पास करता है; यह भंडारण से पहले डेटा की व्याख्या या निष्कर्षण नहीं करता है। डिफ़ॉल्ट रूप से, नियोटोमा स्वचालित रूप से संग्रहीत फ़ाइल पर एआई व्याख्या चलाता है, संरचित इकाइयों को निकालता है और उन्हें ईएमबीईडीएस संबंध के साथ स्रोत से वापस जोड़ता है। interpret: true के साथ उसी फ़ाइल को दोबारा संग्रहीत करने से डुप्लिकेट बनाए बिना पुनर्व्याख्या शुरू हो जाती है। रसीद स्रोत के लिए संरक्षित मूल पीडीएफ के साथ पूछताछ योग्य संरचित डेटा बन जाती है। बैच प्रोसेसिंग या कोटा प्रबंधन के लिए व्याख्या को स्थगित भी किया जा सकता है (व्याख्या: गलत), फिर बाद में विभिन्न कॉन्फ़िगरेशन के साथ चलाया जा सकता है।

व्यवहार में कार्यप्रवाह

कुछ वर्कफ़्लोज़ पैटर्न दिखाते हैं।

ईमेल ट्राइएज। एजेंट जीमेल एमसीपी के माध्यम से अपठित ईमेल पढ़ता है, प्रत्येक प्रेषक के साथ मौजूदा संपर्क रिकॉर्ड और पूर्व संदर्भ के लिए नियोटोमा की जांच करता है, मेरे संचार शैली नियमों का उपयोग करके ड्राफ्ट उत्तर देता है, नए संपर्कों और कार्यों को संग्रहीत करता है, और संसाधित संदेशों को संग्रहीत करता है। एक एकल ट्राइएज रन में पांच नए संपर्क, तीन कार्य और एक दर्जन वार्तालाप मोड़ संग्रहीत हो सकते हैं।

ब्लॉग पोस्ट लेखन। कौशल स्वयं एक संरचित इकाई के रूप में नियोटोमा में रहता है। एजेंट इसे retrieve_entity_snapshot के साथ पुनः प्राप्त करता है। इसके बाद यह स्टाइल कैलिब्रेशन के लिए मौजूदा पोस्टों पर सवाल उठाता है, ड्राफ्ट लिखता है, पोस्ट इकाई को सभी मेटाडेटा के साथ संग्रहीत करता है, हीरो छवियां उत्पन्न करता है, ट्विटर और लिंक्डइन के लिए शेयर कॉपी बनाता है, नियोटोमा निर्यात से वेबसाइट कैश को पुन: उत्पन्न करता है, और तैनात करता है। यह पोस्ट इसी तरह लिखी गई थी.

बिटकॉइन भुगतान। मैं एक बीटीसी वॉलेट एमसीपी सर्वर का उपयोग करके बिटकॉइन में एक ठेकेदार को भुगतान करता हूं। नियोटोमा स्थायी नियम, संपर्क रिकॉर्ड और लेनदेन इतिहास को संग्रहीत करता है। एजेंट तीनों को पुनः प्राप्त करता है, भुगतान निष्पादित करता है, नए लेनदेन को ऑन-चेन लिंक के साथ संग्रहीत करता है, और पुष्टि करता है।

फीडबैक प्रोसेसिंग। जब परीक्षक नियोटोमा डेवलपर रिलीज पर फीडबैक देते हैं, तो एजेंट संरचित फीडबैक इकाइयां निकालते हैं, उन्हें परीक्षक के संपर्क रिकॉर्ड से जोड़ते हैं, फीडबैक को बकेट द्वारा वर्गीकृत करते हैं, और रिलीज चरण की बाधाओं के खिलाफ इसका आकलन करते हैं। पूर्व फीडबैक परीक्षक, बकेट या तिथि के अनुसार पुनर्प्राप्त किया जा सकता है।

वेबसाइट परिनियोजन। परिनियोजन कौशल स्थानीय मार्कडाउन संपादनों को नियोटोमा में सिंक करता है, संपूर्ण वेबसाइट डेटासेट निर्यात करता है, कैश को पुन: उत्पन्न करता है, वेबसाइट रेपो को पुश करता है, और बिल्ड सफल होने तक GitHub Actions की निगरानी करता है। यदि बिल्ड विफल हो जाता है, तो एजेंट लॉग पढ़ता है, समस्या को ठीक करता है, और फिर से चलाता है।

उन एजेंटों की ओर जो मेरे बिना चलते हैं

प्रत्येक वर्कफ़्लो मेरे द्वारा कर्सर एजेंट खोलने और एक निर्देश टाइप करने से शुरू होता है। मैं हर कार्य के लिए लूप में हूं। यह वर्तमान चरण के लिए ठीक है, लेकिन यह अंतिम स्थिति नहीं है।

मैं स्वचालित प्रक्रियाएं स्थापित कर रहा हूं ताकि एजेंट मेरी प्रत्यक्ष भागीदारी के बिना वर्कफ़्लो को संभाल सकें। टुकड़े पहले से ही मौजूद हैं: कौशल पूर्ण वर्कफ़्लो चरणों को परिभाषित करते हैं, नियोटोमा संदर्भ और नियमों को संग्रहीत करता है, एमसीपी सर्वर पहुंच प्रदान करते हैं। जो चीज़ गायब है वह है ऑर्केस्ट्रेशन जो शेड्यूल पर या घटनाओं के जवाब में वर्कफ़्लो को ट्रिगर करता है, और एक हल्का अनुमोदन इंटरफ़ेस है ताकि मैं अपने लैपटॉप पर बैठे बिना कार्यों की समीक्षा और अधिकृत कर सकूं।

नियोटोमा का लेयर्ड आर्किटेक्चर बिल्कुल इसी के लिए डिज़ाइन किया गया है। यह तीन चिंताओं को अलग करता है:

सत्य परत (नियोटोमा)। घटना-स्रोत, रेड्यूसर-चालित, नियतात्मक। सभी एजेंट इससे पढ़ते हैं। राज्य अद्यतन केवल रेड्यूसर द्वारा संसाधित डोमेन घटनाओं के माध्यम से प्रवाहित होते हैं। कोई भी एजेंट सत्य को सीधे तौर पर परिवर्तित नहीं करता।
रणनीति परत। नियोटोमा से वर्तमान विश्व स्थिति को पढ़ता है। प्राथमिकताओं, बाधाओं, जोखिम, प्रतिबद्धताओं और समय का मूल्यांकन करता है। आउटपुट निर्णय और आदेश। शुद्ध अनुभूति: अवस्था अंदर, निर्णय बाहर। कोई दुष्प्रभाव नहीं।
निष्पादन परत। रणनीति परत से आदेश लेता है। बाहरी एडेप्टर (ईमेल एपीआई, भुगतान सेवाएं, कैलेंडर, मैसेजिंग) के माध्यम से साइड इफेक्ट करता है। जो कुछ हुआ उसका वर्णन करते हुए डोमेन ईवेंट उत्सर्जित करता है। वे घटनाएँ स्थिति को अद्यतन करने के लिए रिड्यूसर के माध्यम से वापस प्रवाहित होती हैं। शुद्ध प्रभाव: आदेश अंदर, घटनाएँ बाहर।

लूप बंद है:

इनबाउंड सिग्नल (ईमेल, व्हाट्सएप, कैलेंडर, वित्तीय डेटा)
  -> सामान्यीकरण -> नियोटोमा स्थिति (इवेंट लॉग + रिड्यूसर)
  -> रणनीति टिक (प्राथमिकताओं, आउटपुट निर्णयों का मूल्यांकन करें)
  -> निष्पादन एजेंट (दुष्प्रभाव निष्पादित करें, घटनाओं का उत्सर्जन करें)
  -> रिड्यूसर -> अद्यतन स्थिति
  -> अगला टिक करें

आज, मैं रणनीति परत हूँ. मैं राज्य को देखता हूं, निर्णय लेता हूं कि क्या करना है, और एक एजेंट को कार्यान्वित करने के लिए कहता हूं। आर्किटेक्चर उस भूमिका को सॉफ़्टवेयर द्वारा प्रतिस्थापित करने योग्य बनाता है। एक रणनीति इंजन नियोटोमा को पढ़ता है, स्थायी नियमों और प्राथमिकताओं के आधार पर मूल्यांकन करता है कि किस चीज़ पर ध्यान देने की आवश्यकता है, और निष्पादन एजेंटों को आदेश जारी करता है। वे एजेंट एमसीपी सर्वर को कॉल करते हैं, परिणाम संग्रहीत करते हैं, और चक्र दोहराता है।

महत्वपूर्ण अपरिवर्तनीयता यह है कि कोई भी परत नियोटोमा के अंतर्निहित डेटा स्टोर को सीधे नहीं लिखती है। अपडेट केवल डोमेन इवेंट और रिड्यूसर के माध्यम से प्रवाहित होते हैं। यह सिस्टम को श्रवण योग्य और प्रतिवर्ती बनाता है। यदि कोई स्वायत्त एजेंट कोई बुरा निर्णय लेता है, तो मैं उस घटना का पता लगा सकता हूं जिसके कारण यह हुआ, राज्य अद्यतन वापस कर सकता हूं, और उस नियम को सही कर सकता हूं जिसके कारण यह हुआ।

लक्ष्य कंप्यूटर पर अपना दैनिक समय कम करना है। इसे खत्म मत करो. व्यावहारिक निष्पादन से समीक्षा और अनुमोदन की ओर बदलाव। मैं अपने एजेंटों द्वारा रात भर में किए गए कार्यों का सारांश जानना चाहता हूं: ईमेल का क्रमबद्ध, पोस्ट का मसौदा तैयार किया गया, तैनाती का सत्यापन किया गया, भुगतान कतारबद्ध किया गया। मैं अपनी Apple Watch से बिटकॉइन भुगतान स्वीकृत करना चाहता हूं। मैं चलते समय अपने फोन पर ड्राफ्ट किए गए ईमेल की समीक्षा करना चाहता हूं और भेजने के लिए टैप करना चाहता हूं। एजेंट 80% को संभालते हैं जो दोहराने योग्य है। मैं उस 20% को संभालता हूं जिसके लिए निर्णय की आवश्यकता है।

यहीं पर हार्डवेयर प्रश्न दिलचस्प हो जाता है। आज के फ़ोन और घड़ियाँ इस इंटरैक्शन पैटर्न के लिए डिज़ाइन नहीं किए गए हैं। आपको टाइपिंग या ब्राउज़िंग के लिए नहीं, बल्कि संक्षिप्त समीक्षा और अनुमोदन इशारों के लिए अनुकूलित डिवाइस की आवश्यकता है।

आज मौजूद उपकरणों में से, Apple Watch सही फॉर्म फैक्टर के सबसे करीब महसूस होता है: हमेशा आपकी कलाई पर, देखने योग्य, सरल टैप-टू-अनुमोदन इंटरैक्शन में सक्षम। लेकिन सॉफ्टवेयर परत अभी तक वहां नहीं है. एजेंट के सारांश और अनुमोदन अनुरोधों को घड़ी में उस तरह से भेजने का कोई तरीका नहीं है जो मूल लगे।

यह मेरे लिए किसी बिंदु पर प्रयोग करने का एक क्षेत्र हो सकता है, एक हल्का साथी ऐप बनाना जो नियोटोमा की स्थिति को कलाई-स्तरीय इंटरफ़ेस से जोड़ता है। चाहे सही सतह एक वॉच ऐप, एक समर्पित एआई डिवाइस, या कुछ ऐसा हो जो अभी तक मौजूद नहीं है, इंटरेक्शन मॉडल स्पष्ट है: एजेंट काम करते हैं, संरचित मेमोरी स्थिति रखती है, और मानव निष्पादन की गति के बजाय इरादे की गति से दिशा प्रदान करता है।

स्टैक को ओपन-सोर्स करना

यह स्टैक आज निजी है क्योंकि इसमें मेरा जीवन शामिल है: संपर्क, वित्त, स्वास्थ्य डेटा, व्यक्तिगत संचार, मैं अपना घर कैसे चलाता हूं इसके बारे में स्थायी नियम। इससे पहले कि मैं इसे ओपन-सोर्स कर सकूं, मुझे उन सभी को सुलझाना होगा।

रास्ता सीधा है. व्यक्तिगत डेटा पूरी तरह से नियोटोमा में चला जाता है, जो पहले से ही अधिकांश के लिए सत्य का स्रोत है। स्क्रिप्ट जो मेरे विशिष्ट खातों और पथों को संदर्भित करती हैं, उन्हें कॉन्फ़िगरेशन से पढ़ने के लिए दोबारा तैयार किया जाता है। एमसीपी सर्वर रैपर सामान्य हो जाते हैं। कौशल अपनी हार्डकोडेड धारणाएँ खो देते हैं।

जो बचता है वह एक पुन: प्रयोज्य एजेंटिक स्टैक है: एमसीपी सर्वर मचान के साथ एक मोनोरेपो टेम्पलेट, एक नियम और कौशल ढांचा, संरचित मेमोरी के लिए नियोटोमा एकीकरण, और उदाहरण वर्कफ़्लो जिसे कोई भी अनुकूलित कर सकता है। वास्तुकला दिलचस्प हिस्सा है. मेरा व्यक्तिगत डेटा नहीं है.

मेरे पास इसके लिए कोई समयसीमा नहीं है. रिफैक्टरिंग दैनिक उपयोग के साथ-साथ होती है। जब भी मैं किसी स्क्रिप्ट को छूता हूं, मैं उसे और अधिक सामान्य बना देता हूं। जब भी मैं डेटा को नियोटोमा में ले जाता हूं, मैं उसे रेपो से हटा देता हूं। प्रत्येक सत्र के साथ स्टैक अधिक पोर्टेबल हो जाता है।

नियोटोमा के बारे में इससे क्या सिद्ध होता है

मैंने यह स्टैक नियोटोमा के अस्तित्व में आने से पहले बनाया था। प्रारंभिक संस्करण में फ़्लैट फ़ाइलें और Parquet तालिकाओं का उपयोग किया गया था। इसने तब तक काम किया जब तक ऐसा नहीं हुआ।

[विफलता मोड](/ पोस्ट/ट्रुथ-लेयर-एजेंट-मेमोरी) विशिष्ट थे: एक एजेंट एक संपर्क को एक सत्र में "सारा किम" और दूसरे में "एस. किम" के रूप में संग्रहीत करेगा, डुप्लिकेट बनाएगा और उन्हें मर्ज करने का कोई तरीका नहीं होगा। कोई उद्गम नहीं था, इसलिए मैं यह नहीं बता सका कि किस एजेंट ने फ़ील्ड लिखी या कब।

प्रश्न एकल कॉलम पर सटीक मिलान तक सीमित थे, इसलिए यह पूछना कि "मुझे पिछले सप्ताह क्या प्रतिक्रिया मिली?" मतलब हर फ़ाइल को मैन्युअल रूप से स्कैन करना। कभी-कभी रिकॉर्ड को बुरी तरह से अधिलेखित कर दिया जाता था या पूरी तरह से हटा दिया जाता था, जिससे पुनर्प्राप्त करने के लिए कोई इवेंट लॉग नहीं होता था। और विभिन्न प्रकारों से जुड़ा हुआ कुछ भी नहीं है, इसलिए यह जानते हुए कि किसी लेन-देन से संबंधित संपर्क से संबंधित कार्य के लिए मुझे उस ग्राफ़ को अपने दिमाग में रखना होगा।

नियोटोमा ने उस परत को प्रतिस्थापित कर दिया। इसने एजेंटों को एक संरचित, क्वेरी करने योग्य, संबंध-जागरूक मेमोरी दी जो हर वर्कफ़्लो पर काम करती है। स्टैक में अब नियोटोमा में 170 इकाई प्रकार हैं, इसलिए नहीं कि मैंने 170 स्कीमा पहले से डिज़ाइन किए हैं, बल्कि इसलिए कि एजेंट इकाई प्रकार बनाते हैं क्योंकि उन्हें नई प्रकार की जानकारी मिलती है। एक फीडबैक नोट एक लेन-देन से अलग होता है, एक स्थायी नियम से अलग होता है, और सिस्टम उन सभी को संभालता है।

यह डॉगफ़ूडिंग है जो नियोटोमा को ईमानदार रखती है। जब पुनर्प्राप्ति धीमी होती है, तो मैं इसे प्रत्येक एजेंट सत्र में महसूस करता हूं। जब इकाई रिज़ॉल्यूशन विफल हो जाता है, तो मुझे डुप्लिकेट संपर्क मिलते हैं। जब भंडारण अविश्वसनीय होता है, तो वर्कफ़्लो टूट जाता है। हर बग और हर अंतर किसी और के काम में दिखने से पहले मेरे दैनिक काम में दिखता है।

स्मृति समस्या सार्वभौमिक है. एजेंटिक वर्कफ़्लो का निर्माण करने वाला प्रत्येक डेवलपर एक ही दीवार से टकराएगा: ऐसे एजेंट जो याद नहीं रख सकते, क्वेरी नहीं कर सकते, और पूर्व कार्य पर निर्माण नहीं कर सकते। अकेले पुनर्प्राप्ति पर्याप्त नहीं है; संरचना और उद्गम स्मृति को भरोसेमंद बनाते हैं। यह स्टैक इस बात का प्रमाण है कि संरचित मेमोरी वह परिवर्तन करती है जो एजेंट कर सकते हैं। नियोटोमा के माध्यम से मैं इसे हर किसी के लिए उपलब्ध करा रहा हूं।

डेवलपर रिलीज परीक्षण के लिए खुला है। यदि आप एजेंटिक वर्कफ़्लोज़ का निर्माण कर रहे हैं और नीचे संरचित मेमोरी चाहते हैं, तो यहीं से शुरुआत करें।

चाबी छीनना