مقامی اور اوپن ایجنٹ میموری کے لیے، بازیافت پہلے سے طے شدہ ہے: RAG پائپ لائنز، ایجنٹ کی تلاش، ایمبیڈنگ اسٹورز، اور گراف ٹراورسل وہ چیزیں ہیں جن تک زیادہ تر بلڈرز پہلے پہنچتے ہیں۔ ایک [2026 سروے](https://arxiv.org/abs/2602.19320) یہ نتیجہ اخذ کرتا ہے کہ میموری ڈیزائن، ماڈل کی صلاحیت نہیں، اب طویل عرصے تک رہنے والے ایجنٹوں کے لیے محدود عنصر ہے۔

بازیافت کوڈنگ اور ایکسپلوریشن کے لیے اچھی طرح سے کام کرتا ہے، لیکن جب ایجنٹ جاری حالت کو سنبھالتے ہیں تو یہ ٹوٹ جاتا ہے۔ بڑے پروجیکٹس ([Zep](https://www.getzep.com/)، [Mem0](https://mem0.ai/)، [Letta](https://www.letta.com/)، [LangMem](https://langchain-ai.github.io/langmem/)) ہستی کی ریزولوشن، استقامت، اور مکمل ڈھانچے کو جوڑ رہے ہیں، لیکن گراف کے ڈھانچے کے مطابق ڈھانچہ سخت ہے۔ ریٹروفٹ کے لیے: اسکیما فرسٹ سوالات، تعییناتی شناخت، صرف ضمیمہ، اور مقامی-پہلا کنٹرول۔

## بازیافت کا غلبہ کیوں ہے۔

بازیافت اس استعمال کے معاملے میں فٹ بیٹھتا ہے جو نقشے پر ایجنٹوں کو رکھتا ہے: کوڈنگ۔ کوڈبیس تحقیقی ہیں، آپ اکثر نہیں جانتے کہ چیزیں کہاں رہتی ہیں، اور آپ چاہتے ہیں کہ "ہم X کو کہاں سنبھالیں؟" بجائے اس کے کہ "ہر فنکشن کو پرواننس کے ساتھ درج کریں۔" سیمنٹک سرچ اور ایڈہاک ٹراورسل اس کے لیے موزوں ہیں۔

زیادہ تر لوگ کوڈنگ سے ایجنٹ میموری کے بارے میں اپنی بصیرت بناتے ہیں، جہاں بازیافت کافی ہے۔ اس سے پریشانی عام ہو رہی ہے۔ آپریشنل حالت جیسے کاموں، رابطوں، لین دین اور وعدوں کے لیے، آپ کو اگلے ہفتے ایک ہی جواب، مکمل سیٹس، اور آڈٹ ٹریلز کی ضرورت ہے۔

بازیافت بھی شامل کرنا سستا ہے۔ آپ اپنے دستاویزات کو سرایت کر سکتے ہیں، ویکٹر اسٹور کو وائر کر سکتے ہیں، اور دوپہر میں ورکنگ میموری حاصل کر سکتے ہیں، بغیر کسی سکیما ڈیزائن، کوئی ہستی ریزولوشن، اور کوئی پرووینس ٹریکنگ۔ یہ ایک حقیقی فائدہ ہے، نہ صرف جڑنا۔

## جہاں بازیافت ٹوٹ جاتی ہے۔

جب آپ سچائی کے لیے ایجنٹ کی یادداشت پر انحصار کرتے ہیں تو وقفے ظاہر ہوتے ہیں۔

**متضاد جوابات۔** "پروجیکٹ X کے تمام کاموں کی فہرست" پوچھنے سے ایک دن سات اور اگلے چار نتائج ملتے ہیں۔ بازیافت ہر بار دوبارہ اندازہ لگاتی ہے۔ [تحقیق اس بات کی تصدیق کرتی ہے](https://arxiv.org/abs/2512.12818) کہ ایجنٹ تمام سیشنز میں معلومات کو آپس میں ملاتے ہیں اور میموری بڑھنے کے ساتھ وقتی طور پر متضاد جوابات تیار کرتے ہیں۔

**نامکمل یاد۔** 80% سے کم بازیافت والے RAG سسٹم دکھاتے ہیں [34% کی ہیلوسینیشن کی شرح، 90% سے اوپر کے سسٹمز کے لیے 20% کے مقابلے](https://www.ijmsrt.com/storages/download-paper/IJMSRT25SEP018)۔ ایمبیڈنگ پر مبنی بازیافت وقتی اور رشتہ دار ڈھانچے کو مسترد کرتی ہے، اور آپ کے پاس جتنی زیادہ ہستییں ہوں گی، اتنی ہی بدتر یاد آتی جاتی ہے۔

**کوئی ثبوت نہیں۔** جب آپ پوچھتے ہیں "یہ نمبر کہاں سے آیا؟" بازیافت آپ کو جو بھی ٹکڑوں کے سامنے آئے اس سے ایک تخمینہ شدہ جواب دیتا ہے۔ جواب سے ماخذ کے ریکارڈ تک کوئی نسب نہیں ہے۔

**ناقابل بازیافت تحریر۔** جب کوئی ایجنٹ کسی رابطے کو اوور رائٹ کرتا ہے یا کاموں کو ضم کرتا ہے تو پچھلی حالت ختم ہوجاتی ہے۔ کوئی ورژن نہیں ہے اور کوئی رول بیک نہیں ہے۔

**Cross-tool drift.** ChatGPT میں بنائے گئے کام کو کرسر میں قابل اعتماد طریقے سے استفسار نہیں کیا جا سکتا۔ فراہم کنندہ کی میموری [غیر متوقع طور پر متضاد] ہے (https://www.datastudios.org/post/can-chatgpt-remember-previous-conversations-memory-behavior-session-limits-and-persistence)، اور کھلے بازیافت سیٹ اپ بھی ڈیفالٹ کے ذریعے کراس ٹول نہیں ہیں۔

## ساختی ریاست کیا فراہم کرتی ہے۔

سٹرکچرڈ اسٹیٹ کا مطلب ہے ٹائپ شدہ ہستیوں، مستحکم IDs، تعلقات اور ٹائم لائنز والا اسٹور۔ ایک ہی سوال ہر بار ایک ہی نتیجہ لوٹاتا ہے، اور آپ کو پرووینس اور رول بیک ملتا ہے۔

| ضرورت | سٹرکچرڈ اسٹور | بازیافت |
|------|------|------------|
| مکمل سیٹ ("پروجیکٹ X میں تمام کام") | جی ہاں، اسکیما اور رشتوں سے | جزوی یا قیاس |
| اگلے ہفتے ایک ہی جواب | جی ہاں | نہیں |
| ماخذ تک کا پتہ لگائیں | جی ہاں، پروونانس چین | نہیں |
| خراب لکھنے سے بازیافت | ہاں، اگر صرف ضمیمہ | عام طور پر نہیں |
| کراس ٹول مستقل مزاجی | ہاں، اگر کراس پلیٹ فارم | صرف اس صورت میں جب تمام ٹولز ایک ہی بیک اینڈ کا اشتراک کریں۔
| نامعلوم کو دریافت کریں | ممکن ہے لیکن اس کی طاقت نہیں | جی ہاں، یہ وہ جگہ ہے جہاں بازیافت کا سبقت حاصل ہوتا ہے |
| یک طرفہ خلاصہ | Overkill | جی ہاں |

ایک سٹرکچرڈ اسٹور گراف کی شکل کا ہو سکتا ہے، اور جسے میں بنا رہا ہوں، [Neotoma](https://neotoma.io)، یہ ہے: ایک مقامی، MCP سے مطابقت رکھنے والی میموری لیئر جو ایجنٹوں کو اداروں، رشتوں اور نسب کے لیے سچائی کا واحد ذریعہ فراہم کرتی ہے۔ بازیافت میں جو چیز اسے "گراف سیٹ اپ" سے الگ کرتی ہے وہ ہے استقامت، کینونیکل IDs، اور پرووینس۔ میں نے اس بارے میں مزید لکھا ہے کہ [ایجنٹ میموری کو سچائی پرت کی ضرورت کیوں ہے](/posts/truth-layer-agent-memory) کہیں اور۔

## جہاں میدان چل رہا ہے۔

بڑے منصوبے بازیافت کی طرف سے تشکیل شدہ ریاست کی طرف تبدیل ہو رہے ہیں۔

**[Zep](https://www.getzep.com/)/[Graphiti](https://www.getzep.com/)** ایک [دنیاوی علم کا گراف](https://arxiv.org/abs/2501.13956) بناتا ہے جو MemGPT اور 9%slatency کی خدمت پر 18.5% درستگی حاصل کرتا ہے۔ یہ موجودہ ماحولیاتی نظام میں ساختی حالت کے قریب ترین ہے۔

**Mem0** ایک [دو فیز ایکسٹرکشن اور کنسولیڈیشن پائپ لائن](https://mem0.ai/research) کا استعمال کرتا ہے جو ہستی کے تعلقات کے لیے گراف ویرینٹ کے ساتھ OpenAI کی میموری سے 26% زیادہ درستگی کی اطلاع دیتا ہے۔ یہ اب بھی بنیادی طور پر بازیافت ہے، اور ساختی پرت اضافی ہے۔

**[Letta](https://www.letta.com/)** (سابقہ ​​[MemGPT](https://docs.letta.com/guides/legacy/memgpt-agents-legacy)) [ڈیٹا بیس میں تمام حالتوں کو برقرار رکھتا ہے](https://docs.letta.com/guides/agents/context-engineering کے ساتھ قابل تدوین میموری)۔ یہ بازیافت کے اصل منصوبوں کی سب سے واضح طور پر "ساختہ حالت" ہے۔

**[LangMem](https://langchain-ai.github.io/langmem/)/[LangGraph](https://langchain-ai.github.io/langgraph/)** ایک [مستقل میموری SDK](https://blog.langchain.com/langmem-sdk-launch/) پیش کرتا ہے، ecedication and consistent memory and consolidation. استقامت کی پرت اصلی ہے، لیکن بنیادی رسائی کا نمونہ اب بھی تلاش کو سرایت کر رہا ہے۔

**[Hindsight](https://arxiv.org/abs/2512.12818)** ([2025 تحقیق](https://arxiv.org/abs/2512.12818)) میموری کو چار منطقی نیٹ ورکس میں منظم کرتا ہے اور لانگ مارک بینچ پر 83-91% درستگی حاصل کرتا ہے۔ یہ سمت دکھاتا ہے: واضح ہستی کے نیٹ ورک کے ساتھ ساختی میموری فلیٹ بازیافت سے بہتر کارکردگی کا مظاہرہ کرتی ہے۔

## کیا بازیافت کے نظام مکمل طور پر مل سکتے ہیں؟

کچھ چیزیں قدرتی طور پر مل جاتی ہیں، لیکن دیگر ساختی طور پر دوبارہ تیار کرنا مشکل ہیں۔

**جو پہلے سے تبدیل ہو رہا ہے۔** زیپ اور [Mem0g](https://mem0.ai/) میں ہستی نکالنا اور گراف کا ڈھانچہ حقیقی ہے۔ لیٹا اور لینگ گراف میں ڈیٹا بیس کی استقامت حقیقی ہے۔ وقتی ٹریکنگ گرافٹی میں حقیقی ہے۔ یہ خلا کو ختم کر رہے ہیں۔

**مماثلت اول بمقابلہ اسکیما فرسٹ۔** بازیافت کا ڈیفالٹ رسائی پیٹرن ہے "ملتی جلتی چیزیں تلاش کریں۔" ایک سٹرکچرڈ اسٹور کا ڈیفالٹ "قسم، ID، رشتہ، یا وقت کے لحاظ سے استفسار" ہے۔ بازیافت سسٹم کو اسکیما فرسٹ بنانے کا مطلب ہے API کی سطح اور صارف کی توقعات کو تبدیل کرنا، نہ کہ صرف ایک خصوصیت شامل کرنا۔

**مضمون بمقابلہ واضح شناخت۔** بازیافت دو حصوں کو ایک ہی ہستی کے طور پر مانتی ہے اگر ان کے سرایت قریب ہوں۔ سٹرکچرڈ اسٹیٹ دو ریکارڈز کو ایک ہی ہستی کے طور پر مانتی ہے اگر وہ ایک کینونیکل ID کا اشتراک کرتے ہیں۔ ڈیٹرمنسٹک شناخت کو دوبارہ تیار کرنے کا مطلب ہے ادخال کے ہر راستے کو تبدیل کرنا۔

**اپسرٹ بمقابلہ صرف ضمیمہ۔** بازیافت کے نظام عام طور پر اوور رائٹ کرتے ہیں، جبکہ صرف اپینڈ اسٹوریج تاریخ کو محفوظ رکھتا ہے۔ لیٹا متغیر میموری بلاکس کا استعمال کرتا ہے، اور Zep وقتی ارتقاء کو ٹریک کرتا ہے، جو قریب تر ہے۔ زیادہ تر بازیافت کے نظام میں تاریخ لکھنے کا کوئی تصور نہیں ہے۔

**استحکام کے ذریعے ثابت ہونا۔** جب Mem0 حقائق کو یکجا کرتا ہے یا LangMem متعلقہ یادوں کو ضم کرتا ہے، تو اصل ماخذ سے اصلیت عام طور پر ختم ہوجاتی ہے۔ ضم ہونے سے بچ جانے والے ثبوت کے لیے سٹوریج ماڈل کی ضرورت ہوتی ہے کہ وہ شروع سے اس کی حمایت کرے۔

**Determinism.** بازیافت میں درجہ بندی شامل ہوتی ہے، اور نتائج دوڑتے وقت مختلف ہوتے ہیں۔ سٹرکچرڈ استفسارات تعییناتی ہیں: ایک ہی سوال وہی نتیجہ دیتا ہے۔ رینکنگ فنکشن کو ہٹانا اس چیز کو نقصان پہنچاتا ہے جو بازیافت کو مفید بناتا ہے۔ یہ بنیادی طور پر مختلف استفسار کے معاہدے ہیں۔

**مقامی-پہلا کنٹرول۔** کلاؤڈ پر انحصار اور ٹیلی میٹری کے بغیر، زیادہ تر میموری کمپنیوں کے کاروباری ماڈل سے متصادم نظام کو حقیقی معنوں میں مقامی بنانا۔ یہ کوئی تکنیکی رکاوٹ نہیں ہے۔ یہ ایک ساختی ترغیب کا مسئلہ ہے۔

بازیافت کے نظام جزوی طور پر ایک ساختی اسٹور تک پہنچ سکتے ہیں، لیکن آخری میل کے لیے اسکیما فرسٹ استفسارات، تعییناتی شناخت، صرف ضمیمہ کی شناخت، تعییناتی نتائج، اور مقامی-پہلے ڈیفالٹس کی ضرورت ہوتی ہے۔ وہ انتخاب دوبارہ حاصل کرنے والے پہلے فن تعمیر کے اناج کے خلاف چلتے ہیں۔

## کیا بازیافت اب بھی بہتر کرتی ہے۔

**تجارت۔** جب آپ بارسلونا اپارٹمنٹ کے بارے میں اپنے نوٹ میں کچھ بھی تلاش کرنا چاہتے ہیں، تو آپ کو اسکیما یا ہستی کی قسم کا علم نہیں ہوتا ہے۔ اپ فرنٹ ماڈلنگ کے بغیر متعلقہ بٹس کی بازیافت۔

**خلاصہ۔** جب آپ پوچھتے ہیں کہ آپ نے ٹھیکیدار کے ساتھ کیا فیصلہ کیا ہے، تو بازیافت ایک سیشن میں تلاش، نچوڑ، اور خلاصہ کر سکتی ہے۔ آپ کو اس جواب کو برقرار رکھنے یا اگلی بار بالکل مماثل ہونے کی ضرورت نہیں ہے۔

**ایڈہاک ٹراورسل۔** جب آپ پوچھتے ہیں کہ اسٹرائپ ویب ہکس کہاں سنبھالے جاتے ہیں، تو لے آؤٹ کوڈ بیسز اور دستاویزات میں مختلف ہوتا ہے۔ بازیافت ایک متحد گراف کے بغیر موافقت کرتا ہے۔

**کم پیشگی قیمت۔** آپ ایک دوپہر میں ورکنگ میموری حاصل کرسکتے ہیں۔ کسی بھی چیز کے لیے جس کے لیے مکمل، مستقل مزاجی، یا اصلیت کی ضرورت نہ ہو، بازیافت کافی اور سستی ہے۔

## ساختی حالت میں خلاء اور نیوٹوما ان کو کیسے دور کرتا ہے۔

**Schema overhead.** Neotoma ایک ابھرتی ہوئی اسکیما رجسٹری کا استعمال کرتی ہے جہاں LLM کی مدد سے نکالنے کے دوران انضمام کے دوران اقسام اور تعلقات تجویز کیے جاتے ہیں۔ یہ پیشگی لاگت کو کم کرتا ہے لیکن اسے ختم نہیں کرتا ہے۔ عملی طور پر، ایجنٹ وقت کے ساتھ ساتھ نکالنے کے نتائج کا جائزہ لیتا اور درست کرتا ہے کیونکہ اس میں تضادات کا سامنا ہوتا ہے۔

**انجیکشن کی پیچیدگی۔** Neotoma خصوصیات کی شناخت سے ہیش پر مبنی کینونیکل IDs کی گنتی کرتا ہے، لہذا ایک ہی ہستی کو ماخذ سے قطع نظر ایک ہی ID ملتی ہے۔ یہ سرایت پر مبنی مماثلت سے زیادہ پیش گوئی ہے، لیکن یہ نکالنے کے معیار پر منحصر ہے: "مارک" اور "مارک ہینڈرکسن" اس وقت تک مختلف طریقے سے ہیش کرتے ہیں جب تک کہ آپ ان کو ضم نہیں کرتے ہیں۔

**کولڈ اسٹارٹ۔** نیوٹوما دوہری راستے کے ادخال کو سپورٹ کرتا ہے: آپ بیچ نکالنے کے لیے فائلیں اپ لوڈ کرسکتے ہیں یا ایجنٹ کی بات چیت کے ذریعے بتدریج اسٹیٹ جمع کرسکتے ہیں۔ یہ فوری نہیں ہے، لیکن یہ ایک مفید گراف بنانے کے لیے کافی بات چیت کا انتظار کرنے سے زیادہ تیز ہے۔

**صرف ضمیمہ کی لاگت۔** ہر تصحیح کے ساتھ اسٹوریج میں اضافہ ہوتا ہے، یہی وجہ ہے کہ رول بیک اور پرووینس ممکن ہے۔ ذاتی اور آپریشنل پیمانے پر یہ قابل انتظام ہے، لیکن یہ ایک حقیقی تجارت ہے: موجودہ حالت کو حل کرنے کے سوالات زیادہ پیچیدہ ہیں۔

** بازیافت کا متبادل نہیں ہے۔ ** نیوٹوما قسم، ID، تعلق، وقت کی حد، اور گراف پڑوس کے لحاظ سے ساختی بازیافت فراہم کرتا ہے، اور دریافت کو سنبھالنے کے لیے ایجنٹ کی تلاش اور سرایت تلاش جیسے بازیافت کے ٹولز کی توقع کرتا ہے۔ یہ ایک تکمیلی چیز ہے، متبادل نہیں۔

## میں Neotoma کیوں بنا رہا ہوں۔

میں عملی طور پر بازیافت کی حدوں کو مارتا ہوں۔ کاموں، رابطوں اور لین دین کے لیے کیننیکل IDs، نسب، اور کراس ٹول تک رسائی کی ضرورت ہوتی ہے۔ ڈیزائن کے انتخاب اوپر بیان کردہ کنورجنسی رکاوٹوں کا براہ راست جواب دیتے ہیں۔

**Schema-first.** استفسارات ہستی کی قسم، ID، تعلق، یا وقت کی حد کے لحاظ سے ہیں۔ استفسار کے راستے میں سرایت کرنے والی کوئی مماثلت نہیں ہے، اور نتائج تعییناتی ہیں۔

**ہیش پر مبنی شناخت۔** ایک ہی ہستی کو ایک ہی ID ملتی ہے اس سے قطع نظر کہ اسے کس ذریعہ یا سیشن نے متعارف کرایا ہے۔

**صرف ضمیمہ۔** ہر حقیقت اپنے ماخذ کی طرف اشارہ کرتی ہے۔ اصلاحات نئے ریکارڈ بناتے ہیں، اور رول بیک ممکن ہے۔

**کراس ٹول بذریعہ MCP۔** کسی بھی MCP کلائنٹ سے ایک میموری لیئر قابل رسائی ہے: کرسر، چیٹ جی پی ٹی، کلاڈ، یا کلاڈ کوڈ۔ ایک ہی ڈیٹا اور ایک جیسی آئی ڈی ہر جگہ دستیاب ہیں۔

**مقامی پہلے۔** تمام ڈیٹا SQLite اور مقامی فائلوں میں رہتا ہے۔ کوئی کلاؤڈ انحصار نہیں ہے اور کوئی ٹیلی میٹری نہیں ہے۔ آپ سسٹم کی ہر چیز کی تصدیق کر سکتے ہیں۔

[Neotoma](https://neotoma.io) ابتدائی ہے۔ یہ ایک [ڈیولپر ریلیز](/posts/neotoma-developer-release): صرف مقامی، CLI-پہلے، ہیورسٹک ہستی کے حل کے ساتھ، دستی اسکیما ارتقاء، اور کوئی ویب UI نہیں ہے۔ یہ جو کچھ فراہم کرتا ہے وہ معاہدہ ہے، اور دلیل یہ ہے کہ یہ معاہدہ ان ایجنٹوں کے لیے ضروری ہے جو جاری حالت کو ہینڈل کرتے ہیں، اور صرف بازیافت اسے فراہم نہیں کر سکتی۔

فیلڈ سٹرکچرڈ میموری پر تبدیل ہو رہا ہے۔ سوال یہ ہے کہ آپ کے ڈیٹا کے ساتھ اس پرت کو کون بناتا ہے جس پر آپ اعتماد کرتے ہیں اور یہ کیا ضمانت دیتا ہے۔ میں چاہتا ہوں کہ اس پرت کو شروع سے ہی تشکیل دیا جائے، اس حقیقت کے بعد بولٹ نہ ہو۔ مقامی - سب سے پہلے، کھلا، قابل معائنہ، اور صارف کے کنٹرول میں۔