بالنسبة لذاكرة الوكيل المحلية والمفتوحة، يكون الاسترجاع هو الإجراء الافتراضي: خطوط أنابيب RAG، والبحث الوكيل، ومخازن التضمين، واجتياز الرسم البياني هي ما يصل إليه معظم المنشئين أولاً. خلص [مسح عام 2026](https://arxiv.org/abs/2602.19320) إلى أن تصميم الذاكرة، وليس قدرة النموذج، هو الآن العامل المحدد للعوامل طويلة العمر.

يعمل الاسترجاع بشكل جيد للتشفير والاستكشاف، ولكنه يتعطل عندما يتعامل الوكلاء مع الحالة المستمرة. تضيف المشاريع الكبرى ([Zep](https://www.getzep.com/)، [Mem0](https://mem0.ai/)، [Letta](https://www.letta.com/)، [LangMem](https://langchain-ai.github.io/langmem/)) دقة الكيان، والثبات، وبنية الرسم البياني، ولكن التقارب الكامل في التصميم المنظم يواجه عوائق يصعب تعديلها: استعلامات المخطط أولاً، والهوية الحتمية، ومصدر الإلحاق فقط، والتحكم المحلي أولاً.

## لماذا يهيمن الاسترجاع

يناسب الاسترجاع حالة الاستخدام التي تضع الوكلاء على الخريطة: الترميز. تعتبر قواعد التعليمات البرمجية استكشافية، وغالبًا ما لا تعرف أين تعيش الأشياء، وتريد "أين نتعامل مع X؟" بدلاً من "سرد كل وظيفة بمصدرها". البحث الدلالي والاجتياز المخصص مناسبان تمامًا لذلك.

يكوّن معظم الناس حدسهم حول الذاكرة الوسيطة من خلال البرمجة، حيث يكون الاسترجاع كافيًا. والمشكلة هي التعميم من ذلك. بالنسبة للحالة التشغيلية مثل المهام وجهات الاتصال والمعاملات والالتزامات، فإنك تحتاج إلى نفس الإجابة في الأسبوع القادم والمجموعات الكاملة ومسارات التدقيق.

يعد الاسترجاع أيضًا رخيصًا للإضافة. يمكنك تضمين مستنداتك، وإنشاء مخزن متجه، والحصول على ذاكرة عاملة في فترة ما بعد الظهر، بدون تصميم مخطط، أو تحليل للكيان، أو تتبع المصدر. وهذه ميزة حقيقية، وليس مجرد الجمود.

## حيث فواصل الاسترجاع

تظهر الفواصل عندما تعتمد على ذاكرة الوكيل للحصول على الحقيقة.

**إجابات غير متناسقة.** يؤدي طلب "إدراج كافة المهام للمشروع X" إلى إرجاع سبع نتائج في يوم واحد وأربعة في اليوم التالي. استرجاع يستنتج في كل مرة. [يؤكد البحث](https://arxiv.org/abs/2512.12818) أن الوكلاء يخلطون المعلومات عبر الجلسات وينتجون إجابات غير متسقة مؤقتًا مع نمو الذاكرة.

**استدعاء غير مكتمل.** تُظهر أنظمة RAG ذات استدعاء الاسترجاع أقل من 80% [معدلات هلوسة تبلغ 34%، مقارنة بـ 20% للأنظمة التي تزيد عن 90% من الاستدعاء](https://www.ijmsrt.com/storages/download-paper/IJMSRT25SEP018). يتجاهل الاسترجاع القائم على التضمين البنية الزمنية والعلائقية، وكلما زاد عدد الكيانات لديك، أصبح الاسترجاع أسوأ.

**بدون مصدر.** عندما تسأل "من أين أتى هذا الرقم؟" يمنحك الاسترجاع إجابة مستنبطة من أي أجزاء ظهرت على السطح. لا يوجد نسب من الإجابة إلى السجلات المصدر.

**عمليات الكتابة غير القابلة للاسترداد.** عندما يقوم الوكيل بالكتابة فوق جهة اتصال أو دمج المهام، تختفي الحالة السابقة. لا يوجد إصدار ولا التراجع.

**الانجراف عبر الأدوات.** لا يمكن الاستعلام عن المهمة التي تم إنشاؤها في ChatGPT بشكل موثوق في المؤشر. ذاكرة الموفر [غير متناسقة بشكل غير متوقع](https://www.datastudios.org/post/can-chatgpt-remember-previous-conversations-memory-behavior-session-limits-and-persistence)، كما أن إعدادات الاسترجاع المفتوحة ليست أدوات مشتركة بشكل افتراضي أيضًا.

## ما توفره الحالة المنظمة

الحالة المنظمة تعني مخزنًا يحتوي على كيانات مكتوبة ومعرفات ثابتة وعلاقات وجداول زمنية. يقوم نفس الاستعلام بإرجاع نفس النتيجة في كل مرة، وتحصل على المصدر والتراجع.

| بحاجة | متجر منظم | استرجاع |
|------|------------------|----------|
| المجموعة الكاملة ("جميع المهام في المشروع X") | نعم، بالمخطط والعلاقات | جزئي أو مستدل |
| نفس الإجابة الأسبوع القادم | نعم | لا |
| تتبع للمصدر | نعم سلسلة المصدر | لا |
| التعافي من الكتابة السيئة | نعم، إذا كان الإلحاق فقط | عادة لا |
| الاتساق عبر الأدوات | نعم، إذا كان عبر منصة | فقط إذا كانت جميع الأدوات تشترك في نفس الواجهة الخلفية |
| اكتشف المجهول | ممكن ولكن ليس قوته | نعم، هذا هو المكان الذي يتفوق فيه الاسترجاع |
| تلخيص لمرة واحدة | مبالغة | نعم |

يمكن أن يكون المتجر المنظم على شكل رسم بياني، والمخزن الذي أقوم بإنشائه، [Neotoma](https://neotoma.io)، هو: طبقة ذاكرة محلية متوافقة مع MCP تمنح الوكلاء مصدرًا واحدًا للحقيقة للكيانات والعلاقات والنسب. ما يفصلها عن "إعدادات الرسم البياني" الشائعة في الاسترجاع هو الثبات والمعرفات الأساسية والمصدر. لقد كتبت المزيد عن [لماذا تحتاج ذاكرة الوكيل إلى طبقة الحقيقة](/posts/truth-layer-agent-memory) في مكان آخر.

## حيث يتحرك المجال

تتقارب المشاريع الكبرى نحو الحالة المنظمة من جانب الاسترجاع.

**[Zep](https://www.getzep.com/)/[Graphiti](https://www.getzep.com/)** ينشئ [رسمًا بيانيًا للمعرفة المؤقتة](https://arxiv.org/abs/2501.13956) يحقق زيادة في الدقة بنسبة 18.5% عبر MemGPT وتقليل زمن الوصول بنسبة 90%، ويشحن خادم MCP. إنها الأقرب إلى الحالة المنظمة في النظام البيئي الحالي.

**Mem0** يستخدم [خط أنابيب الاستخراج والدمج على مرحلتين](https://mem0.ai/research) الذي يقدم دقة أعلى بنسبة 26% من ذاكرة OpenAI، مع متغير رسم بياني لعلاقات الكيانات. لا يزال الاسترجاع أولًا في المقام الأول، والطبقة المنظمة مضافة.

**[Letta](https://www.letta.com/)** (المعروف سابقًا باسم [MemGPT](https://docs.letta.com/guides/legacy/memgpt-agents-legacy)) [يستمر في كل الحالة في قاعدة البيانات](https://docs.letta.com/guides/agents/context-engineering) مع كتل ذاكرة قابلة للتحرير. إنها "الحالة المنظمة" الأكثر وضوحًا لمشاريع أصل الاسترجاع.

**[LangMem](https://langchain-ai.github.io/langmem/)/[LangGraph](https://langchain-ai.github.io/langgraph/)** يقدم [SDK للذاكرة المستمرة](https://blog.langchain.com/langmem-sdk-launch/) مع أنواع وذاكرة دلالية وعرضية وإجرائية التوحيد. طبقة الثبات حقيقية، لكن نمط الوصول الأساسي لا يزال يقوم بتضمين البحث.

**[بعد فوات الأوان](https://arxiv.org/abs/2512.12818)** ([بحث 2025](https://arxiv.org/abs/2512.12818)) ينظم الذاكرة في أربع شبكات منطقية ويحقق دقة تتراوح بين 83-91% وفقًا للمعايير طويلة المدى. إنه يوضح الاتجاه: تتفوق الذاكرة المنظمة ذات شبكات الكيان الواضحة على الاسترجاع المسطح.

## هل يمكن أن تتقارب أنظمة الاسترجاع بشكل كامل؟

تتقارب بعض الأشياء بشكل طبيعي، لكن البعض الآخر يصعب تعديله من الناحية الهيكلية.

**ما يتقارب بالفعل.** استخراج الكيان وبنية الرسم البياني حقيقيان في Zep و[Mem0g](https://mem0.ai/). يعد استمرار قاعدة البيانات أمرًا حقيقيًا في Letta وLangGraph. التتبع الزمني حقيقي في Graphiti. هذه هي سد الفجوة.

**التشابه أولاً مقابل المخطط أولاً.** نمط الوصول الافتراضي للاسترجاع هو "البحث عن أشياء مماثلة". الافتراضي للمتجر المنظم هو "الاستعلام حسب النوع أو المعرف أو العلاقة أو الوقت". إن جعل مخطط نظام الاسترجاع أولاً يعني تغيير سطح واجهة برمجة التطبيقات (API) وتوقعات المستخدم، وليس مجرد إضافة ميزة.

**الهوية الضمنية مقابل الهوية الصريحة.** يعامل الاسترجاع قطعتين على أنهما نفس الكيان إذا كانت عمليات التضمين الخاصة بهما قريبة. تعامل الحالة المنظمة سجلين على أنهما نفس الكيان إذا كانا يشتركان في المعرف الأساسي. التعديل التحديثي للهوية الحتمية يعني تغيير كل مسار الاستيعاب.

**التحديث مقابل الإلحاق فقط.** عادةً ما تقوم أنظمة الاسترجاع بالكتابة فوق، بينما يحافظ تخزين الإلحاق فقط على السجل. يستخدم Letta كتل ذاكرة قابلة للتغيير، ويتتبع Zep التطور الزمني الأقرب. معظم أنظمة الاسترجاع ليس لديها مفهوم لكتابة التاريخ.

**المصدر من خلال الدمج.** عندما تقوم Mem0 بدمج الحقائق أو دمج LangMem الذكريات ذات الصلة، عادةً ما يتم فقدان المصدر من المصادر الأصلية. يتطلب المصدر الذي ينجو من الدمج أن يدعمه نموذج التخزين منذ البداية.

**الحتمية.** يتضمن الاسترجاع الترتيب، وتختلف النتائج من تشغيل إلى آخر. الاستعلامات المنظمة حتمية: نفس الاستعلام يُرجع نفس النتيجة. تؤدي إزالة وظيفة التصنيف إلى تقويض ما يجعل الاسترجاع مفيدًا. هذه عقود استعلام مختلفة بشكل أساسي.

**التحكم المحلي أولاً.** إن جعل النظام محليًا حقًا، دون الاعتماد على السحابة وعدم القياس عن بعد، يتعارض مع نموذج الأعمال الخاص بمعظم شركات الذاكرة. وهذا ليس عائقا تقنيا؛ إنها مشكلة الحوافز الهيكلية.

يمكن أن تصل أنظمة الاسترجاع جزئيًا إلى مخزن منظم، لكن الميل الأخير يتطلب استعلامات المخطط الأول، والهوية الحتمية، ومصدر الإلحاق فقط، والنتائج الحتمية، والافتراضيات المحلية الأولى. تتعارض هذه الاختيارات مع بنية الاسترجاع أولاً.

## ما هو الاسترجاع الذي لا يزال أفضل

**الاستكشاف.** عندما تريد العثور على أي شيء في ملاحظاتك حول شقة في برشلونة، فأنت لا تعرف المخطط أو نوع الكيان. يقوم استرجاع الأسطح بتات ذات صلة دون النمذجة المسبقة.

**التلخيص.** عندما تسأل عما قررته مع المقاول، يمكن للاسترجاع البحث والاستخراج والتلخيص في جلسة واحدة. لا تحتاج إلى هذه الإجابة لتستمر أو تتطابق تمامًا في المرة القادمة.

**الاجتياز المخصص.** عندما تسأل عن مكان التعامل مع خطافات الويب الشريطية، يختلف التخطيط عبر قواعد التعليمات البرمجية والمستندات. يتكيف الاسترجاع بدون رسم بياني موحد.

**تكلفة أولية منخفضة.** يمكنك الحصول على ذاكرة عاملة في فترة ما بعد الظهر. بالنسبة لأي شيء لا يتطلب الاكتمال أو الاتساق أو المصدر، فإن الاسترجاع يكون كافيا وأرخص.

## الثغرات في الحالة المنظمة وكيفية معالجة نيوتوما لها

**عبء المخطط.** يستخدم Neotoma سجل مخطط متطور حيث يقترح الاستخراج بمساعدة LLM الأنواع والعلاقات أثناء الاستيعاب. وهذا يقلل من التكلفة الأولية ولكنه لا يلغيها. ومن الناحية العملية، يقوم الوكيل بمراجعة نتائج الاستخراج وتصحيحها بمرور الوقت عندما يواجه تناقضات.

**تعقيد الاستيعاب.** يحسب Neotoma المعرفات الأساسية المستندة إلى التجزئة من خصائص التعريف، بحيث يحصل نفس الكيان على نفس المعرف بغض النظر عن المصدر. يعد هذا أكثر قابلية للتنبؤ به من التشابه القائم على التضمين، ولكنه يعتمد على جودة الاستخراج: يتم تجزئة "Mark" و"Mark Hendrickson" بشكل مختلف حتى يتم دمجهما.

**بداية باردة.** يدعم Neotoma استيعاب المسار المزدوج: يمكنك تحميل الملفات لاستخراج الدُفعات أو تجميع الحالة بشكل متزايد من خلال محادثات الوكيل. وهذا ليس فوريًا، ولكنه أسرع من انتظار ما يكفي من المحادثات لإنشاء رسم بياني مفيد.

**تكلفة الإلحاق فقط.** يتزايد حجم التخزين مع كل تصحيح، وهو ما يجعل التراجع والمصدر ممكنين. يمكن التحكم في هذا الأمر على المستوى الشخصي والتشغيلي، ولكنه يمثل مقايضة حقيقية: فالاستعلامات لحل الحالة الحالية أكثر تعقيدًا.

**ليس بديلاً عن الاسترجاع.** يوفر Neotoma استرجاعًا هيكليًا حسب النوع والمعرف والعلاقة والنطاق الزمني ومنطقة الرسم البياني، ويتوقع أدوات استرجاع مثل البحث الوكيل وبحث التضمين للتعامل مع الاستكشاف. فهو مكمل وليس بديلا.

## لماذا أقوم ببناء نيوتوما

لقد وصلت إلى حدود الاسترجاع في الممارسة العملية. تحتاج المهام وجهات الاتصال والمعاملات إلى المعرفات الأساسية والنسب والوصول عبر الأدوات. تستجيب خيارات التصميم بشكل مباشر لعوائق التقارب الموضحة أعلاه.

**المخطط أولاً.** تكون الاستعلامات حسب نوع الكيان أو المعرف أو العلاقة أو النطاق الزمني. لا يوجد أي تشابه في التضمين في مسار الاستعلام، والنتائج حتمية.

**الهوية المستندة إلى التجزئة.** يحصل الكيان نفسه على نفس المعرف بغض النظر عن المصدر أو الجلسة التي قدمته.

**إلحاق فقط.** كل حقيقة تعود إلى مصدرها. تعمل التصحيحات على إنشاء سجلات جديدة، ومن الممكن التراجع.

**أداة مشتركة عبر MCP.** يمكن الوصول إلى طبقة ذاكرة واحدة من أي عميل MCP: Cursor أو ChatGPT أو Claude أو Claude Code. نفس البيانات ونفس المعرفات متاحة في كل مكان.

**المحلية أولاً.** جميع البيانات موجودة في ملفات SQLite والملفات المحلية. لا يوجد تبعية سحابية ولا قياس عن بعد. يمكنك التحقق من كل ما يفعله النظام.

[نيوتوما](https://neotoma.io) مبكرًا. إنه [إصدار للمطورين](/posts/neotoma-developer-release): محلي فقط، CLI-first، مع دقة كيان إرشادية، وتطور مخطط يدوي، ولا توجد واجهة مستخدم ويب. ما يقدمه هو العقد، والحجة هي أن هذا العقد ضروري للوكلاء الذين يتعاملون مع الحالة المستمرة، وهذا الاسترجاع وحده لا يمكن أن يوفره.

المجال يتقارب على الذاكرة المنظمة. السؤال هو من الذي يبني الطبقة التي تثق بها مع بياناتك وما هي الضمانات التي تقدمها. أريد أن تكون هذه الطبقة منظمة منذ البداية، وليس مثبتة بمسامير بعد وقوعها. محلي أولاً، ومفتوح، وقابل للفحص، وتحت سيطرة المستخدم.