स्थानीय और ओपन एजेंट मेमोरी के लिए, पुनर्प्राप्ति डिफ़ॉल्ट है: आरएजी पाइपलाइन, एजेंटिक खोज, एम्बेडिंग स्टोर और ग्राफ़ ट्रैवर्सल वे हैं जिन तक अधिकांश बिल्डर्स पहले पहुंचते हैं। एक [2026 सर्वेक्षण](https://arxiv.org/abs/2602.19320) का निष्कर्ष है कि मेमोरी डिज़ाइन, मॉडल क्षमता नहीं, अब लंबे समय तक जीवित रहने वाले एजेंटों के लिए सीमित कारक है।

कोडिंग और अन्वेषण के लिए पुनर्प्राप्ति अच्छी तरह से काम करती है, लेकिन जब एजेंट चालू स्थिति को संभालते हैं तो यह टूट जाता है। प्रमुख परियोजनाएँ ([Zep](https://www.getzep.com/), [Mem0](https://mem0.ai/), [Letta](https://www.letta.com/), [LangMem](https://langchan-ai.github.io/langmem/)) इकाई रिज़ॉल्यूशन, दृढ़ता और ग्राफ़ संरचना को जोड़ रही हैं, लेकिन एक संरचित डिज़ाइन पर पूर्ण अभिसरण उन बाधाओं का सामना करता है जिन्हें दोबारा लगाना कठिन होता है: स्कीमा-प्रथम प्रश्न, नियतात्मक पहचान, परिशिष्ट-केवल उद्गम, और स्थानीय-प्रथम नियंत्रण।

## पुनर्प्राप्ति क्यों हावी है

पुनर्प्राप्ति उस उपयोग के मामले में फिट बैठती है जो एजेंटों को मानचित्र पर रखता है: कोडिंग। कोडबेस खोजपूर्ण हैं, आप अक्सर नहीं जानते कि चीजें कहां रहती हैं, और आप चाहते हैं कि "हम एक्स को कहां संभालें?" इसके बजाय "हर कार्य को उत्पत्ति के साथ सूचीबद्ध करें।" सिमेंटिक खोज और तदर्थ ट्रैवर्सल इसके लिए उपयुक्त हैं।

अधिकांश लोग एजेंट मेमोरी के बारे में अपना अंतर्ज्ञान कोडिंग से बनाते हैं, जहां पुनर्प्राप्ति पर्याप्त है। उससे परेशानी सामान्य हो रही है. कार्यों, संपर्कों, लेन-देन और प्रतिबद्धताओं जैसी परिचालन स्थिति के लिए, आपको अगले सप्ताह समान उत्तर, पूर्ण सेट और ऑडिट ट्रेल्स की आवश्यकता होगी।

पुनर्प्राप्ति जोड़ना भी सस्ता है। आप अपने डॉक्स को एम्बेड कर सकते हैं, एक वेक्टर स्टोर को वायर कर सकते हैं, और एक दोपहर में कार्यशील मेमोरी रख सकते हैं, बिना किसी स्कीमा डिज़ाइन, बिना किसी इकाई रिज़ॉल्यूशन और बिना किसी उद्गम ट्रैकिंग के। यह एक वास्तविक लाभ है, न कि केवल जड़ता।

## जहां पुनर्प्राप्ति टूट जाती है

जब आप सत्य के लिए एजेंट की स्मृति पर निर्भर होते हैं तो विराम दिखाई देता है।

**असंगत उत्तर।** "प्रोजेक्ट एक्स के लिए सभी कार्यों की सूची" पूछने पर एक दिन सात परिणाम और अगले दिन चार परिणाम मिलते हैं। पुनर्प्राप्ति हर बार पुन: अनुमान लगाती है। [शोध पुष्टि करता है](https://arxiv.org/abs/2512.12818) कि एजेंट सत्रों में जानकारी को मिलाते हैं और स्मृति बढ़ने पर अस्थायी रूप से असंगत उत्तर देते हैं।

**अधूरा रिकॉल।** 80% से कम रिकॉल रिकॉल वाले आरएजी सिस्टम [34% की मतिभ्रम दर, 90% रिकॉल से ऊपर सिस्टम के लिए 20% की तुलना में](https://www.ijmsrt.com/storages/download-paper/IJMSRT25SEP018) दिखाते हैं। एंबेडिंग-आधारित पुनर्प्राप्ति अस्थायी और संबंधपरक संरचना को त्याग देती है, और आपके पास जितनी अधिक इकाइयाँ होंगी, रिकॉल उतना ही खराब होगा।

**कोई उत्पत्ति नहीं।** जब आप पूछते हैं "यह संख्या कहां से आई?" पुनर्प्राप्ति आपको सामने आए टुकड़ों से एक अनुमानित उत्तर देती है। उत्तर से लेकर स्रोत रिकॉर्ड तक कोई वंशावली नहीं है।

**अपरिवर्तनीय लिखता है।** जब कोई एजेंट किसी संपर्क को अधिलेखित कर देता है या कार्यों को मर्ज कर देता है, तो पिछली स्थिति समाप्त हो जाती है। इसमें कोई वर्जनिंग और कोई रोलबैक नहीं है।

**क्रॉस-टूल ड्रिफ्ट.** चैटजीपीटी में बनाए गए कार्य को कर्सर में विश्वसनीय रूप से क्वेरी नहीं किया जा सकता है। प्रदाता मेमोरी [अप्रत्याशित रूप से असंगत](https://www.datastudios.org/post/can-chatgpt-remember-previous-conversations-memory-behavior-session-limits-and-persistence) है, और ओपन पुनर्प्राप्ति सेटअप डिफ़ॉल्ट रूप से क्रॉस-टूल भी नहीं हैं।

## संरचित राज्य क्या प्रदान करता है

संरचित स्थिति का अर्थ है टाइप की गई इकाइयाँ, स्थिर आईडी, रिश्ते और समयसीमा वाला एक स्टोर। एक ही क्वेरी हर बार एक ही परिणाम देती है, और आपको उत्पत्ति और रोलबैक मिलता है।

| आवश्यकता है | संरचित स्टोर | पुनर्प्राप्ति |
|------|------------------|----||
| पूरा सेट ("प्रोजेक्ट एक्स में सभी कार्य") | हाँ, स्कीमा और रिश्तों द्वारा | आंशिक या अनुमानित |
| अगले सप्ताह वही उत्तर | हाँ | नहीं |
| स्रोत का पता लगाएं | हाँ, उद्गम श्रृंखला | नहीं |
| ख़राब लेखन से उबरें | हाँ, यदि केवल परिशिष्ट | आमतौर पर नहीं |
| क्रॉस-टूल संगति | हाँ, यदि क्रॉस-प्लेटफ़ॉर्म | केवल तभी जब सभी उपकरण समान बैकएंड साझा करें |
| अज्ञात का अन्वेषण करें | संभव है लेकिन उसकी ताकत नहीं | हाँ, यह वह जगह है जहाँ पुनर्प्राप्ति उत्कृष्टता प्राप्त करती है |
| एकमुश्त सारांश | ओवरकिल | हाँ |

एक संरचित स्टोर ग्राफ-आकार का हो सकता है, और जो मैं बना रहा हूं, [नियोटोमा](https://neotoma.io), वह है: एक स्थानीय, एमसीपी-संगत मेमोरी परत जो एजेंटों को संस्थाओं, रिश्तों और वंश के लिए सच्चाई का एक एकल स्रोत देती है। जो चीज़ इसे पुनर्प्राप्ति में सामान्य "ग्राफ़ सेटअप" से अलग करती है वह है दृढ़ता, विहित आईडी और उद्गम। मैंने [एजेंट मेमोरी को सत्य परत की आवश्यकता क्यों है](/पोस्ट/ट्रुथ-लेयर-एजेंट-मेमोरी) के बारे में कहीं और लिखा है।

## जहां क्षेत्र घूम रहा है

प्रमुख परियोजनाएँ पुनर्प्राप्ति पक्ष से संरचित स्थिति की ओर परिवर्तित हो रही हैं।

**[Zep](https://www.getzep.com/)/[Graphiti](https://www.getzep.com/)** एक [अस्थायी ज्ञान ग्राफ](https://arxiv.org/abs/2501.13956) बनाता है जो MemGPT पर 18.5% सटीकता लाभ और 90% विलंबता में कमी प्राप्त करता है, और एक MCP सर्वर शिप करता है। यह वर्तमान पारिस्थितिकी तंत्र में संरचित अवस्था के सबसे करीब है।

**Mem0** एक [दो-चरण निष्कर्षण और समेकन पाइपलाइन](https://mem0.ai/research) का उपयोग करता है जो इकाई संबंधों के लिए एक ग्राफ़ संस्करण के साथ, OpenAI की मेमोरी की तुलना में 26% अधिक सटीकता की रिपोर्ट करता है। यह अभी भी मुख्य रूप से पुनर्प्राप्ति-प्रथम है, और संरचित परत योगात्मक है।

**[लेट्टा](https://www.letta.com/)** (पूर्व में [MemGPT](https://docs.letta.com/guides/legacy/memgpt-agents-legacy)) [डेटाबेस में सभी स्थिति बनी रहती है](https://docs.letta.com/guides/agents/context-engineeering) संपादन योग्य मेमोरी ब्लॉक के साथ। यह पुनर्प्राप्ति-उत्पत्ति परियोजनाओं की सबसे स्पष्ट रूप से "संरचित स्थिति" है।

**[LangMem](https://langchan-ai.github.io/langmem/)/[LangGraph](https://langchan-ai.github.io/langgraph/)** सिमेंटिक, एपिसोडिक और प्रक्रियात्मक प्रकार और मेमोरी समेकन के साथ एक [लगातार मेमोरी SDK](https://blog.langchan.com/langmem-sdk-launch/) प्रदान करता है। दृढ़ता परत वास्तविक है, लेकिन प्राथमिक पहुंच पैटर्न अभी भी खोज को एम्बेड कर रहा है।

**[Hindsight](https://arxiv.org/abs/2512.12818)** ([2025 शोध](https://arxiv.org/abs/2512.12818)) मेमोरी को चार तार्किक नेटवर्क में व्यवस्थित करता है और लंबे-क्षितिज बेंचमार्क पर 83-91% सटीकता प्राप्त करता है। यह दिशा दिखाता है: स्पष्ट इकाई नेटवर्क के साथ संरचित मेमोरी फ्लैट पुनर्प्राप्ति से बेहतर प्रदर्शन करती है।

## क्या पुनर्प्राप्ति प्रणालियाँ पूरी तरह से एकाग्र हो सकती हैं?

कुछ चीजें स्वाभाविक रूप से मिलती हैं, लेकिन अन्य को संरचनात्मक रूप से पुनः स्थापित करना कठिन होता है।

**जो पहले से ही अभिसरण कर रहा है।** Zep और [Mem0g](https://mem0.ai/) में इकाई निष्कर्षण और ग्राफ संरचना वास्तविक हैं। लेट्टा और लैंगग्राफ में डेटाबेस दृढ़ता वास्तविक है। ग्राफिटी में टेम्पोरल ट्रैकिंग वास्तविक है। ये अंतर को पाट रहे हैं.

**समानता-प्रथम बनाम स्कीमा-प्रथम।** पुनर्प्राप्ति का डिफ़ॉल्ट एक्सेस पैटर्न "समान चीजें ढूंढें" है। एक संरचित स्टोर का डिफ़ॉल्ट "प्रकार, आईडी, संबंध या समय के आधार पर क्वेरी" होता है। पुनर्प्राप्ति प्रणाली को स्कीमा-प्रथम बनाने का अर्थ है एपीआई सतह और उपयोगकर्ता अपेक्षाओं को बदलना, न कि केवल एक सुविधा जोड़ना।

**अंतर्निहित बनाम स्पष्ट पहचान।** पुनर्प्राप्ति दो हिस्सों को एक ही इकाई के रूप में मानती है यदि उनके एम्बेडिंग करीब हैं। यदि दो रिकॉर्ड एक विहित आईडी साझा करते हैं तो संरचित स्थिति उन्हें एक ही इकाई के रूप में मानती है। नियतात्मक पहचान को पुनः स्थापित करने का अर्थ है प्रत्येक अंतर्ग्रहण पथ को बदलना।

**अप्सर्ट बनाम एपेंड-ओनली।** पुनर्प्राप्ति प्रणालियाँ आम तौर पर अधिलेखित कर देती हैं, जबकि केवल एपेंड-स्टोरेज इतिहास को सुरक्षित रखता है। लेट्टा परिवर्तनशील मेमोरी ब्लॉक का उपयोग करता है, और जेप अस्थायी विकास को ट्रैक करता है, जो करीब है। अधिकांश पुनर्प्राप्ति प्रणालियों में इतिहास लिखने की कोई अवधारणा नहीं होती है।

**समेकन के माध्यम से उद्गम।** जब मेम0 तथ्यों को समेकित करता है या लैंगमेम संबंधित यादों को मर्ज करता है, तो मूल स्रोतों से उद्गम आमतौर पर खो जाता है। विलय से बचे रहने वाले उद्गम को शुरू से ही इसका समर्थन करने के लिए भंडारण मॉडल की आवश्यकता होती है।

**नियतिवाद।** पुनर्प्राप्ति में रैंकिंग शामिल है, और परिणाम रन-टू-रन भिन्न होते हैं। संरचित क्वेरीज़ नियतात्मक होती हैं: एक ही क्वेरी एक ही परिणाम देती है। रैंकिंग फ़ंक्शन को हटाने से पुनर्प्राप्ति को उपयोगी बनाने वाली चीज़ कमज़ोर हो जाती है। ये मौलिक रूप से भिन्न क्वेरी अनुबंध हैं।

**स्थानीय-प्रथम नियंत्रण।** किसी सिस्टम को वास्तव में स्थानीय बनाना, बिना क्लाउड निर्भरता और बिना टेलीमेट्री के, अधिकांश मेमोरी कंपनियों के व्यवसाय मॉडल के साथ टकराव होता है। यह कोई तकनीकी बाधा नहीं है; यह एक संरचनात्मक प्रोत्साहन समस्या है।

पुनर्प्राप्ति प्रणालियाँ एक संरचित स्टोर तक आंशिक रूप से पहुँच सकती हैं, लेकिन अंतिम मील के लिए स्कीमा-प्रथम क्वेरीज़, नियतात्मक पहचान, परिशिष्ट-केवल उद्गम, नियतात्मक परिणाम और स्थानीय-प्रथम डिफ़ॉल्ट की आवश्यकता होती है। वे विकल्प पुनर्प्राप्ति-प्रथम वास्तुकला के मूल के विरुद्ध चलते हैं।

## क्या पुनर्प्राप्ति अभी भी बेहतर करती है

**अन्वेषण।** जब आप बार्सिलोना अपार्टमेंट के बारे में अपने नोट्स में कुछ भी खोजना चाहते हैं, तो आप स्कीमा या इकाई प्रकार को नहीं जानते हैं। पुनर्प्राप्ति अग्रिम मॉडलिंग के बिना प्रासंगिक बिट्स को सामने लाती है।

**सारांशीकरण।** जब आप पूछते हैं कि आपने ठेकेदार के साथ क्या निर्णय लिया, तो पुनर्प्राप्ति एक सत्र में खोज, निष्कर्षण और सारांशित कर सकती है। आपको अगली बार उस उत्तर के बने रहने या बिल्कुल मेल खाने की आवश्यकता नहीं है।

**तदर्थ ट्रैवर्सल।** जब आप पूछते हैं कि स्ट्राइप वेबहुक को कहां प्रबंधित किया जाता है, तो लेआउट कोडबेस और दस्तावेज़ों में भिन्न होता है। पुनर्प्राप्ति एक एकीकृत ग्राफ़ के बिना अनुकूलित होती है।

**कम अग्रिम लागत।** आपके पास दोपहर में कार्यशील मेमोरी हो सकती है। ऐसी किसी भी चीज़ के लिए जिसे पूर्णता, निरंतरता या उद्गम की आवश्यकता नहीं है, पुनर्प्राप्ति पर्याप्त और सस्ती है।

## संरचित अवस्था में अंतराल और नियोटोमा उन्हें कैसे संबोधित करता है

**स्कीमा ओवरहेड।** नियोटोमा एक विकसित स्कीमा रजिस्ट्री का उपयोग करता है जहां एलएलएम-सहायता प्राप्त निष्कर्षण अंतर्ग्रहण के दौरान प्रकार और संबंधों का प्रस्ताव करता है। इससे अग्रिम लागत कम हो जाती है लेकिन खत्म नहीं होती। व्यवहार में, एजेंट समय के साथ निष्कर्षण परिणामों की समीक्षा करता है और उन्हें सुधारता है क्योंकि उसे विसंगतियों का सामना करना पड़ता है।

**अंतर्ग्रहण जटिलता।** नियोटोमा गुणों की पहचान से हैश-आधारित कैनोनिकल आईडी की गणना करता है, इसलिए स्रोत की परवाह किए बिना एक ही इकाई को एक ही आईडी मिलती है। यह एम्बेडिंग-आधारित समानता की तुलना में अधिक अनुमानित है, लेकिन यह निष्कर्षण गुणवत्ता पर निर्भर करता है: "मार्क" और "मार्क हेंड्रिकसन" हैश अलग-अलग होते हैं जब तक कि आप उन्हें मर्ज नहीं करते।

**ठंडी शुरुआत।** नियोटोमा दोहरे पथ अंतर्ग्रहण का समर्थन करता है: आप बैच निष्कर्षण के लिए फ़ाइलें अपलोड कर सकते हैं या एजेंट वार्तालापों के माध्यम से क्रमिक रूप से स्थिति जमा कर सकते हैं। यह तत्काल नहीं है, लेकिन उपयोगी ग्राफ़ बनाने के लिए पर्याप्त बातचीत की प्रतीक्षा करने से तेज़ है।

**केवल-परिशिष्ट लागत।** प्रत्येक सुधार के साथ भंडारण बढ़ता है, जो रोलबैक और उद्गम को संभव बनाता है। व्यक्तिगत और परिचालन स्तर पर यह प्रबंधनीय है, लेकिन यह एक वास्तविक समझौता है: वर्तमान स्थिति को हल करने के लिए प्रश्न अधिक जटिल हैं।

**पुनर्प्राप्ति का प्रतिस्थापन नहीं।** नियोटोमा प्रकार, आईडी, संबंध, समय सीमा और ग्राफ़ पड़ोस द्वारा संरचनात्मक पुनर्प्राप्ति प्रदान करता है, और अन्वेषण को संभालने के लिए एजेंटिक खोज और एम्बेडिंग खोज जैसे पुनर्प्राप्ति टूल की अपेक्षा करता है। यह पूरक है, विकल्प नहीं।

## मैं नियोटोमा का निर्माण क्यों कर रहा हूं

मैं अभ्यास में पुनर्प्राप्ति सीमा तक पहुंच गया हूं। कार्यों, संपर्कों और लेनदेन के लिए कैनोनिकल आईडी, वंशावली और क्रॉस-टूल एक्सेस की आवश्यकता होती है। डिज़ाइन विकल्प ऊपर वर्णित अभिसरण बाधाओं पर सीधे प्रतिक्रिया करते हैं।

**स्कीमा-प्रथम.** क्वेरीज़ इकाई प्रकार, आईडी, संबंध या समय सीमा के अनुसार होती हैं। क्वेरी पथ में कोई एम्बेडिंग समानता नहीं है, और परिणाम नियतात्मक हैं।

**हैश-आधारित पहचान।** एक ही इकाई को एक ही आईडी मिलती है, भले ही इसे किस स्रोत या सत्र ने पेश किया हो।

**केवल-जोड़ें।** प्रत्येक तथ्य अपने स्रोत का पता लगाता है। सुधार से नए रिकॉर्ड बनते हैं और रोलबैक संभव है।

**एमसीपी के माध्यम से क्रॉस-टूल।** एक मेमोरी परत किसी भी एमसीपी क्लाइंट से पहुंच योग्य है: कर्सर, चैटजीपीटी, क्लाउड, या क्लाउड कोड। हर जगह एक ही डेटा और एक ही आईडी उपलब्ध है.

**स्थानीय-प्रथम.** सभी डेटा SQLite और स्थानीय फ़ाइलों में रहता है। कोई क्लाउड निर्भरता नहीं है और कोई टेलीमेट्री नहीं है। आप सिस्टम द्वारा की जाने वाली हर चीज़ को सत्यापित कर सकते हैं।

[नियोटोमा](https://neotoma.io) जल्दी है। यह एक [डेवलपर रिलीज़](/पोस्ट/नियोटोमा-डेवलपर-रिलीज़) है: स्थानीय-केवल, सीएलआई-प्रथम, अनुमानी इकाई रिज़ॉल्यूशन, मैन्युअल स्कीमा विकास और कोई वेब यूआई नहीं। यह जो प्रदान करता है वह अनुबंध है, और तर्क यह है कि यह अनुबंध उन एजेंटों के लिए आवश्यक है जो चल रही स्थिति को संभालते हैं, और केवल पुनर्प्राप्ति इसे प्रदान नहीं कर सकती है।

फ़ील्ड संरचित मेमोरी पर एकत्रित हो रही है। सवाल यह है कि आपके डेटा को लेकर जिस परत पर आप भरोसा करते हैं, उसका निर्माण कौन करता है और यह क्या गारंटी प्रदान करता है। मैं चाहता हूं कि उस परत को शुरू से ही संरचित किया जाए, न कि इस तथ्य के बाद उस पर दबाव डाला जाए। स्थानीय-प्रथम, खुला, निरीक्षण योग्य और उपयोगकर्ता के नियंत्रण में।