[शुभम साबू](https://x.com/Saboo_Shubham_) (एक Google PM) [ऑलवेज-ऑन मेमोरी एजेंट को ओपन-सोर्स किया गया](https://github.com/GoogleCloudPlatform/generative-ai/tree/main/gemini/agents/always-on-memory-agent) पिछले हफ्ते GCP जेनरेटिव-एआई रेपो के हिस्से के रूप में। [वेंचरबीट ने इसे कवर किया](https://venture Beat.com/orchestration/google-pm-open-sources-always-on-memory-agent-ditching-vector-databases-for) एक संकेत के रूप में कि एजेंट इंफ्रास्ट्रक्चर किस ओर जा रहा है। यह एक स्थायी मेमोरी सिस्टम है जो पृष्ठभूमि प्रक्रिया के रूप में 24/7 चलता है, फाइलों को एकत्रित करता है, टाइमर पर समेकित करता है और प्रश्नों का उत्तर देता है। कोई वेक्टर डेटाबेस नहीं. कोई एम्बेडिंग नहीं. बस एक एलएलएम जो SQLite में संरचित मेमोरी को पढ़ता है, सोचता है और लिखता है।

यह परियोजना उस चीज़ को मान्य करती है जिसे मैं [नियोटोमा](https://github.com/markmhendrickson/neotoma) के साथ बना रहा हूं: एजेंटों के लिए लगातार मेमोरी एक वास्तविक और बढ़ती हुई आवश्यकता है। लेकिन दोनों परियोजनाएं विपरीत वास्तुशिल्प विकल्प बनाती हैं। यह पोस्ट उनकी तुलना करती है.

## ऑलवेज-ऑन मेमोरी एजेंट क्या है

प्रोजेक्ट एक संदर्भ कार्यान्वयन है जिसे [Google ADK (एजेंट डेवलपमेंट किट)](https://google.github.io/adk-docs/) और [Gemini 3.1 फ़्लैश-लाइट](https://ai.google.dev/gemini-api/docs/models) के साथ बनाया गया है। यह तीन विशेषज्ञ उप-एजेंटों के साथ एक हल्की पृष्ठभूमि प्रक्रिया के रूप में चलता है: एक अंतर्ग्रहण के लिए, एक समेकन के लिए, और एक क्वेरी के लिए।

1. **अंतर्ग्रहण।** एक फ़ाइल वॉचर एक इनबॉक्स निर्देशिका की निगरानी करता है। एक फ़ाइल डालें और एजेंट उसे उठा लेगा। यह HTTP POST के माध्यम से भी इनपुट स्वीकार करता है। यह टेक्स्ट, चित्र, ऑडियो, वीडियो और पीडीएफ को संभालता है। एलएलएम सारांश, संस्थाएं, विषय और महत्व स्कोर निकालता है।

2. **समेकन।** एक टाइमर पर, समेकन एजेंट सभी संग्रहीत यादों को पढ़ता है, उनमें कनेक्शन और पैटर्न ढूंढता है, संबंधित वस्तुओं को संपीड़ित करता है, और नई संश्लेषित अंतर्दृष्टि लिखता है। यह बिना संकेत दिए पृष्ठभूमि में चलता है।

3. **प्रश्न.** आप एक प्रश्न पूछें. क्वेरी एजेंट प्रासंगिक यादों और समेकित अंतर्दृष्टि को पढ़ता है, एक उत्तर को संश्लेषित करता है, और इसे विशिष्ट मेमोरी रिकॉर्ड में उद्धरणों के साथ लौटाता है।

भंडारण SQLite है. कोई वेक्टर डेटाबेस नहीं, कोई एम्बेडिंग इंडेक्स नहीं। आर्किटेक्चर शर्त लगाता है कि एलएलएम समानता खोज की आवश्यकता के बिना सीधे संरचित पाठ रिकॉर्ड पर पुनर्प्राप्ति को संभाल सकता है।

## जहां यह उत्कृष्ट है

**सरलता।** रेपो को क्लोन करें, जेमिनी एपीआई कुंजी सेट करें, इसे चलाएं। फ़ाइल वॉचर, HTTP एपीआई और एक स्ट्रीमलिट डैशबोर्ड। न्यूनतम निर्भरताएँ और एकल प्रक्रिया से परे प्रबंधन के लिए कोई बुनियादी ढाँचा नहीं। जेमिनी के साथ एजेंट मेमोरी की खोज करने वाले डेवलपर्स के लिए, यह कार्यशील डेमो का सबसे तेज़ मार्ग है।

**"नो वेक्टर डीबी" कथा।** वेक्टर डेटाबेस को हटाने से परिचालन और वैचारिक जटिलता कम हो जाती है। चुनने के लिए कोई एम्बेडिंग मॉडल नहीं, बनाए रखने के लिए कोई सूचकांक नहीं, कोई पुनर्प्राप्ति ट्यूनिंग नहीं। छोटे पैमाने पर तैनाती के लिए यह एक वास्तविक सरलीकरण है।

**सक्रिय समेकन।** टाइमर-आधारित समेकन सबसे विशिष्ट हिस्सा है। अधिकांश मेमोरी सिस्टम निष्क्रिय होते हैं: चीज़ों को संग्रहीत करते हैं, चीज़ों को पुनः प्राप्त करते हैं। यह सक्रिय रूप से जुड़ता है, संपीड़ित करता है और संश्लेषण करता है। यह ऐसे पैटर्न ढूंढता है जिनके बारे में आपने नहीं पूछा था। यह उस किसी के साथ प्रतिध्वनित होता है जो प्रतीक्षा करने वाली स्मृति के बजाय "सोचने वाली स्मृति" चाहता है।

## जहां दृष्टिकोण अलग हो जाते हैं

ऑलवेज-ऑन मेमोरी एजेंट और नियोटोमा एक लक्ष्य (परसिस्टेंट एजेंट मेमोरी) साझा करते हैं लेकिन लगभग हर डिज़ाइन निर्णय पर भिन्न होते हैं। मतभेद आकस्मिक नहीं हैं. वे इस बारे में अलग-अलग प्रारंभिक परिसरों को प्रतिबिंबित करते हैं कि मेमोरी को किसके लिए अनुकूलित किया जाना चाहिए।

### स्वचालित बनाम स्पष्ट अंतर्ग्रहण

फ़ाइल देखने वाला स्वचालित है. इनबॉक्स में जो भी भूमि आती है वह संसाधित हो जाती है। एलएलएम अर्क और भंडार से पहले कोई अनुमोदन चरण नहीं है, कोई स्कीमा-प्रथम सत्यापन नहीं है, कोई उपयोगकर्ता पुष्टि नहीं है। नियोटोमा विपरीत दृष्टिकोण अपनाता है: जब तक कोई एजेंट या उपयोगकर्ता इसे एमसीपी के माध्यम से स्पष्ट रूप से नहीं लिखता तब तक कुछ भी सिस्टम में प्रवेश नहीं करता है। व्यक्तिगत नोट्स के लिए, स्वचालित अंतर्ग्रहण सुविधाजनक है। गोपनीयता या अनुपालन आवश्यकताओं वाली किसी भी चीज़ के लिए, स्पष्ट नियंत्रण सुरक्षित डिफ़ॉल्ट है।

### यह कौन तय करता है कि क्या याद रखना है

नियोटोमा मेमोरी स्टोरेज को कॉल करने के लिए क्लाइंट एजेंट पर निर्भर करता है। जिस एजेंट से आप बात कर रहे हैं (चैटजीपीटी, क्लाउड, कर्सर) यह तय करता है कि क्या याद रखने लायक है और इसे कैसे संरचित किया जाए। जब यह निष्कर्ष निकलता है कि कोई तथ्य, संपर्क या कार्य जारी रहना चाहिए, तो यह एमसीपी के माध्यम से स्टोर ऑपरेशन को लागू करता है। "क्या याद रखना है" की ज़िम्मेदारी आपकी बातचीत की प्रक्रिया के समान ही एजेंट परत में रहती है।

ऑलवेज-ऑन मेमोरी एजेंट उस जिम्मेदारी को विशेषज्ञ उप-एजेंटों में विभाजित करता है। अंतर्ग्रहण एजेंट तय करता है कि फ़ाइलों से क्या निकालना है। समेकन एजेंट तय करता है कि क्या विलय करना है और क्या संबंध बनाना है। क्वेरी एजेंट तय करता है कि क्या लौटाना है। "क्या याद रखने योग्य है" और "कैसे" इन उप-एजेंटों में वितरित किए जाते हैं, जो बातचीत से स्वतंत्र रूप से चलते हैं। उपयोगकर्ता प्रत्येक निर्णय को स्वीकार नहीं करता. उप-एजेंट उन्हें पृष्ठभूमि में बनाते हैं।

### एलएलएम-संचालित बनाम नियतात्मक निष्कर्षण

ऑलवेज़-ऑन मेमोरी एजेंट हर चीज़ के लिए एलएलएम का उपयोग करता है: संस्थाओं को निकालना, महत्व निर्दिष्ट करना, सारांश तैयार करना। एक ही फ़ाइल पर एक ही निष्कर्षण दो बार चलाएँ और परिणाम भिन्न हो सकते हैं। नियोटोमा [स्कीमा-प्रथम नियतात्मक निष्कर्षण](/पोस्ट/सच्चाई-परत-एजेंट-मेमोरी) का उपयोग करता है। समान इनपुट समान इकाइयाँ, समान विहित आईडी, समान संबंध उत्पन्न करता है। वैकल्पिक एलएलएम व्याख्या उस नियतिवादी परत के शीर्ष पर चलती है, उसके स्थान पर नहीं।

### समेकन बनाम अपरिवर्तनीय सत्य

समेकन एजेंट तय करता है कि क्या विलय करना है, क्या कनेक्शन बनाना है और क्या संपीड़ित करना है। यह समय के साथ स्मृति को परिवर्तित करता है। पुरानी यादें नई संश्लेषित अंतर्दृष्टि में समाहित हो जाती हैं। नियोटोमा समेकित नहीं होता है. यह जुड़ता है. प्रत्येक अवलोकन अपरिवर्तनीय है. इतिहास घटना-स्रोत है। यदि आपको यह देखना है कि क्या, कब और क्यों बदला, तो पूरी जानकारी मौजूद है। कुछ भी अधिलेखित या संपीड़ित नहीं किया गया है।

### सिंगल-प्लेटफ़ॉर्म बनाम क्रॉस-प्लेटफ़ॉर्म

यह प्रोजेक्ट जेमिनी और गूगल एडीके पर बनाया गया है। मेमोरी एक स्थानीय SQLite फ़ाइल में रहती है जिसे केवल इस विशिष्ट एजेंट स्टैक के माध्यम से एक्सेस किया जा सकता है। नियोटोमा एमसीपी के माध्यम से मेमोरी को उजागर करता है, जिसका अर्थ है कि वही इकाइयां चैटजीपीटी, क्लाउड, कर्सर और किसी अन्य एमसीपी-संगत टूल से पहुंच योग्य हैं। एक मेमोरी परत, एकाधिक उपभोक्ता।

### कोई उद्गम बनाम पूर्ण वंशावली नहीं

ऑलवेज़-ऑन मेमोरी एजेंट में मेमोरी रिकॉर्ड में सारांश और निकाली गई इकाइयाँ शामिल होती हैं, लेकिन उन्हें बनाने वाली विशिष्ट फ़ाइल, लाइन या सत्र का पता नहीं लगाया जाता है। यदि समेकित अंतर्दृष्टि गलत है, तो अनुसरण करने के लिए कोई ऑडिट ट्रेल नहीं है। नियोटोमा में, प्रत्येक इकाई का प्रत्येक क्षेत्र एक स्रोत अवलोकन का पता लगाता है। आप किसी भी तथ्य का ऑडिट कर सकते हैं कि वह कहां से आया है।

### स्केल ट्रेडऑफ़

एम्बेडिंग या वेक्टर इंडेक्स के बिना, सिस्टम एलएलएम का उपयोग करके सीधे संरचित टेक्स्ट रिकॉर्ड पढ़ता है। यह छोटे स्तर पर काम करता है. जैसे-जैसे मेमोरी भंडार बढ़ता है, दृष्टिकोण कायम नहीं रह सकता है। वेक्टर DB को हटाने से पुनर्प्राप्ति डिज़ाइन नहीं हटता है। यह जटिलता को एलएलएम संदर्भ विंडो में ले जाता है। नियोटोमा टाइप की गई संस्थाओं पर संरचित क्वेरी का उपयोग करता है, जो एलएलएम संदर्भ सीमाओं से स्वतंत्र रूप से मापी जाती है।

## सब्सट्रेट बनाम एजेंट

सबसे स्पष्ट अंतर भूमिका है। ऑलवेज़-ऑन मेमोरी एजेंट एक एजेंट है। यह स्वचालित रूप से अंतर्ग्रहण करता है, एक शेड्यूल पर समेकित होता है, और उत्तरों को संश्लेषित करता है। इसका अपना तर्क चक्र है। यह तय करता है कि क्या विलय करना है, कौन से कनेक्शन बनाना है और कब संपीड़ित करना है।

नियोटोमा कोई एजेंट नहीं है. यह एक सब्सट्रेट है. यह टाइप की गई संस्थाओं को कैनोनिकल आईडी के साथ संग्रहीत करता है। यह उद्गम को बनाए रखता है। यह नियतिवादी प्रश्नों का उत्तर देता है। यह स्वयं कुछ भी निर्णय नहीं लेता। कोई पृष्ठभूमि अंतर्ग्रहण नहीं. कोई स्वचालित समेकन नहीं. कोई टाइमर-आधारित प्रसंस्करण नहीं। एजेंट इसे पढ़ते हैं और [एमसीपी](/पोस्ट/एजेंट-सर्च-एंड-द-ट्रुथ-लेयर) के माध्यम से इसे लिखते हैं। तर्क एजेंट परत में होता है। सत्य सब्सट्रेट में रहता है.

यह इसलिए मायने रखता है क्योंकि जब एजेंट गलत होता है तो क्या होता है। यदि ऑलवेज-ऑन मेमोरी एजेंट का समेकन एक खराब अंतर्दृष्टि उत्पन्न करता है, तो वह अंतर्दृष्टि अब मेमोरी का हिस्सा है। इसके विरुद्ध सत्यापन करने के लिए कोई अलग परत नहीं है। अभिकर्ता सत्य है.

नीचे एक सत्य परत के साथ, आप यह पता लगा सकते हैं कि एजेंट ने क्या पढ़ा, कब पढ़ा, और उसने वापस क्या लिखा। यदि नई अंतर्दृष्टि गलत है, तो आप वापस लौट सकते हैं। समेकन एजेंट का आउटपुट नियतात्मक स्थिति के शीर्ष पर एक अवलोकन है, न कि इसका उत्परिवर्तन।

| आयाम | ऑलवेज़-ऑन मेमोरी एजेंट | सत्य परत (नियोटोमा) |
|----|----|----|----|----|
| भूमिका | तर्क पाश के साथ एजेंट | बिना एजेंट व्यवहार वाला सब्सट्रेट |
| कौन तय करता है कि क्या संग्रहित करना है | विशेषज्ञ उप-एजेंट (अंतर्ग्रहण, समेकन) | ग्राहक एजेंट (एमसीपी के माध्यम से) |
| अंतर्ग्रहण | स्वचालित (फ़ाइल द्रष्टा, एपीआई) | केवल स्पष्ट (एमसीपी, सीएलआई, अपलोड) |
| निष्कर्षण | एलएलएम संचालित; संभाव्य | स्कीमा-प्रथम; नियतिवादी |
| समेकन | टाइमर-आधारित एलएलएम समेकन | कोई नहीं; अपरिवर्तनीय सत्य, घटना-स्रोत अद्यतन |
| उद्गम | बुनियादी (रिकॉर्ड में स्रोत/सारांश) | पूर्ण वंश; प्रत्येक फ़ील्ड स्रोत का पता लगाता है |
| प्लेटफार्म | केवल जेमिनी/Google ADK | एमसीपी (चैटजीपीटी, क्लाउड, कर्सर) के माध्यम से क्रॉस-प्लेटफ़ॉर्म |
| गोपनीयता | गोपनीयता-प्रथम के रूप में तैनात नहीं | उपयोगकर्ता-नियंत्रित; कोई प्रदाता पहुंच नहीं |
| रोलबैक | नहीं; स्मृति समेकन द्वारा उत्परिवर्तित होती है | हाँ; केवल-संलग्न, संस्करणित, वापस करने योग्य |
| स्केल मॉडल | एलएलएम सभी रिकॉर्ड पढ़ता है; संदर्भ से घिरा हुआ | टाइप की गई इकाइयों पर संरचित प्रश्न |

## वे एक साथ कैसे काम कर सकते थे

दोनों दृष्टिकोण परस्पर अनन्य नहीं हैं। एक समेकन एजेंट और एक सत्य परत विभिन्न समस्याओं का समाधान करती है। कोई पैटर्न ढूंढता है. दूसरा भरोसा कायम रखता है. दिलचस्प वास्तुकला दोनों को जोड़ती है।

रेखाचित्र सीधा है. एक समेकन एजेंट (ऑलवेज-ऑन मेमोरी एजेंट की तरह) एमसीपी के माध्यम से सत्य परत से संस्थाओं को पढ़ता है। इसकी पूर्ण संरचित स्थिति तक पहुंच है: टाइप की गई संस्थाएं, रिश्ते, समयरेखा, उद्गम। यह उस स्थिति पर अपना पैटर्न-फाइंडिंग लूप चलाता है, कनेक्शन, अंतराल या अंतर्दृष्टि की तलाश करता है जो उपयोगकर्ता ने नहीं मांगी है। जब इसे कुछ मिलता है, तो यह परिणाम को एक नए अवलोकन के रूप में सत्य परत पर वापस लिखता है, जिसे इसकी स्रोत संस्थाओं और तर्क के साथ टैग किया जाता है।

सत्य परत उस अंतर्दृष्टि के साथ उसी तरह व्यवहार करती है जैसे वह किसी अन्य लेखन के साथ करती है। यह इसे पूर्ण उद्गम के साथ एक अवलोकन के रूप में दर्ज करता है: एजेंट ने कौन सी संस्थाओं को पढ़ा, कब, क्या निष्कर्ष निकाला। अंतर्दृष्टि इकाई ग्राफ़ का हिस्सा बन जाती है। यदि अंतर्दृष्टि गलत है, तो आप देख सकते हैं कि एजेंट ने वास्तव में क्या खाया, तर्क का पता लगा सकते हैं, और अंतर्निहित संस्थाओं को प्रभावित किए बिना अवलोकन को वापस कर सकते हैं।

यह आज ऑलवेज-ऑन मेमोरी एजेंट में समेकन कैसे काम करता है उससे अलग है। वहां, समेकन एजेंट सीधे मेमोरी को परिवर्तित करता है। पुरानी यादें नए संश्लेषित रिकॉर्ड में समाहित हो जाती हैं। पिछली स्थिति चली गई है. यदि संश्लेषण गलत था, तो तुलना करने के लिए कोई अलग परत नहीं है।

नीचे सत्य परत के साथ, समेकन एक गैर-विनाशकारी ऑपरेशन बन जाता है। एजेंट नियतिवादी स्थिति के शीर्ष पर व्याख्या की एक परत जोड़ता है। राज्य स्वयं अपरिवर्तनीय रहता है। आपको ऑडिटेबिलिटी और रोलबैक (सत्य परत की ताकत) के लाभों के साथ सक्रिय पैटर्न खोज (ऑलवेज-ऑन मेमोरी एजेंट की ताकत) का लाभ मिलता है। बुद्धि ऊपर, भरोसा नीचे।

## यह क्या मान्य करता है

ऑलवेज-ऑन मेमोरी एजेंट एक संदर्भ कार्यान्वयन है, उत्पाद नहीं। यह पुष्टि करता है कि लगातार, गतिशील एजेंट मेमोरी की मांग वास्तविक है। "[वेक्टर डीबी प्लस आरएजी](/पोस्ट/क्यों-एजेंट-मेमोरी-नीड्स-मोर-दैन-रैग)" एकमात्र पुनर्प्राप्ति मॉडल नहीं है। इसे चलाने वाले [संरचनात्मक रुझान](/पोस्ट/छह-एजेंट-ट्रेंड-बेटिंग-ऑन) स्पष्ट हैं: एजेंट स्टेटफुल हो रहे हैं, त्रुटियों की कीमत बढ़ रही है, और प्लेटफ़ॉर्म अपारदर्शी बने हुए हैं। परियोजना संकेत देती है कि उद्योग हमेशा चालू रहने वाली मेमोरी प्रणालियों की ओर बढ़ रहा है जो सरल भंडारण और पुनर्प्राप्ति से परे हैं।

जहां दोनों परियोजनाएं सहमत हैं: निष्क्रिय मेमोरी पर्याप्त नहीं है। जहां वे असहमत हैं: क्या स्मृति परत को ही तर्क करना चाहिए, या क्या तर्क नियतिवादी स्थिति के शीर्ष पर एक अलग परत में होना चाहिए। यह अभी एजेंट मेमोरी आर्किटेक्चर में एक मुख्य प्रश्न है। बाज़ार संभवतः दोनों दृष्टिकोणों का समर्थन करेगा। मैं उम्मीद करता हूं कि वास्तुकला समेकन एजेंटों पर केंद्रित हो सकती है जो सोचते हैं, सत्य परतों के शीर्ष पर चल रहे हैं जिन पर आप भरोसा कर सकते हैं।

## मैं क्या निर्माण कर रहा हूं

मैं ट्रस्ट परत के रूप में [नियोटोमा](https://github.com/markmhendrickson/neotoma) का निर्माण कर रहा हूं। टाइप की गई इकाइयाँ, कैनोनिकल आईडी, नियतात्मक मर्ज, उद्गम, एमसीपी के माध्यम से क्रॉस-प्लेटफ़ॉर्म पहुंच। मैं इसे चैटजीपीटी, क्लाउड और कर्सर पर प्रतिदिन उपयोग करता हूं। [डेवलपर रिलीज़](/posts/neotoma-developer-release) अब [neotoma.io](https://neotoma.io) पर उपलब्ध है।

Google के नमूने से पता चलता है कि उद्योग निरंतर एजेंट मेमोरी पर केंद्रित हो रहा है। खुला सवाल यह नहीं है कि एजेंट याद रखेंगे या नहीं, बल्कि यह है कि कैसे। क्षमता या शासन. एजेंट या सब्सट्रेट. संभाव्य समेकन या नियतिवादी सत्य। मैं बाद वाले पर दांव लगा रहा हूं।