[RAG (جيل الاسترجاع المعزز)](https://en.wikipedia.org/wiki/Retrieval-augmented_generation) يعزز LLM عن طريق استرداد المقاطع ذات الصلة من مجموعة خارجية، غالبًا عبر التضمينات والبحث عن التشابه، ثم تغذيتها كسياق حتى يتمكن النموذج من الإجابة من بيانات محدثة أو خاصة بالمجال.

إنه يعمل بشكل جيد للبحث عن المستندات. بالنسبة لذاكرة الوكيل، فإنها تنهار.

هناك ورقة بحثية جديدة بعنوان "Beyond RAG for Agent Memory: Retrieval by Decoupling and Aggregation" (هو وآخرون، فبراير 2026؛ [انظر الورقة](https://arxiv.org/abs/2602.02007)))، من King's College London ومعهد Alan Turing، تشرح السبب وتشير إلى نهج أفضل.

## لماذا لا تكفي RAG لذاكرة الوكيل

تفترض RAG القياسية مجموعة كبيرة ومختلطة: تضمين النص، واسترجاع [top-k](https://en.wikipedia.org/wiki/Nearest_neighbor_search) عن طريق التشابه، والتسلسل كسياق.

الذاكرة الفاعلة هي العكس: تيار متماسك ومحدود حيث تظهر الحقيقة نفسها في العديد من العبارات. يؤدي تطبيق RAG هنا إلى خلق ثلاث مشكلات:

1. ** أعلى زائدة عن الحاجة ** أنت تسأل "متى رأيت طبيب الأسنان آخر مرة؟" في مجموعة المستندات، قد يقوم top-k بإرجاع بعض الفقرات ذات الصلة من مصادر مختلفة. في ذاكرة الوكيل، تقول العديد من المقاطع نفس الشيء تقريبًا ("طبيب الأسنان المحدد في 15 مارس"، "موعد طبيب الأسنان في 15 مارس"، "طبيب الأسنان المحجوز في 15 مارس"). يملأ Top-k بالتكرار. وتطلق الورقة على هذا اسم "الانهيار في منطقة واحدة كثيفة". يفشل التشابه في فصل ما هو *مطلوب* عما هو مجرد *مشابه*.
2. **التقليم يكسر سلاسل الأدلة.** أنت تسأل "هل قمنا بحل النزاع بشأن الفاتورة؟" تعتمد الإجابة على سلسلة: "تم الاعتراض على الفاتورة رقم 123"، ثم "اتفقنا على استرداد جزء من المبلغ"، ثم "دفعنا المبلغ المتفق عليه". قد يؤدي التقليم اللاحق إلى الاحتفاظ بـ "الفاتورة المدفوعة رقم 123" وإسقاط المنعطفات السابقة. ثم يجيب النموذج بـ "نعم، تم الحل" دون معرفة وجود نزاع. يؤدي التقليم إلى تشتيت الأدلة المرتبطة مؤقتًا وينتج إجابات خاطئة.
3. **التشابه يتجاهل البنية.** أنت تسأل "ما هو وضع رحلة برشلونة؟" أنت بحاجة إلى المشروع والمهمة (مثل حجز رحلات الطيران) والنتيجة. يُرجع التشابه الأجزاء التي تشير إلى "برشلونة" أو "رحلة": ربما إشارة عشوائية، أو رحلة سابقة، أو مهمة من مشروع مختلف. كنت بحاجة إلى مسار هيكلي (هذا المشروع، هذه المهام، هذه النتائج). التشابه لا يرمز لذلك. الهيكل يفعل.

## البنية فوق التشابه

الطريقة الأفضل هي استخدام البنية لتوجيه ما يتم تحميله، وليس التشابه. اكتب الكيانات (المهام وجهات الاتصال والمعاملات والأحداث) واسترجعها حسب المخطط ومعرفات الكيانات والعلاقات والمخططات الزمنية. الاحتفاظ بالملاحظات والمخرجات المشتقة كوحدات كاملة؛ لا تقليم داخل كتل الأدلة. نفس المدخلات ونفس المخطط ينتج عنه نفس المخرجات. لا يوجد LLM في المسار الحرج.

## ما تظهره الورقة

يبني نظام الورقة (xMemory) تسلسلًا هرميًا من أربعة مستويات (رسائل إلى الحلقات إلى دلالات إلى موضوعات) مع التضمينات وملخصات LLM. إنه يتفوق على خمسة أنظمة أخرى (Naive RAG[^1] وA-Mem[^2] وMemoryOS[^3] وLightMem[^4] وNemori[^5]) على LoCoMo وPerLTQA، مجموعات البيانات المعيارية لذاكرة المحادثة الطويلة والإجابة على الأسئلة الشخصية طويلة المدى. لا يتطلب الورق التضمين أو LLMs؛ يتطلب الهيكل. يمكنك الوصول إلى هناك من خلال التسلسل الهرمي المكتسب (xMemory) أو من خلال التصميم الحتمي للمخطط أولاً. توثق الورقة أيضًا هشاشة البنية التي تم إنشاؤها بواسطة LLM (A-Mem، MemoryOS): انحرافات التنسيق، والتحديثات الفاشلة. تعتبر البنية الحتمية ذات المخطط الأول بمثابة قاعدة أكثر موثوقية.

## xMemory vs Neotoma

Neotoma هي [طبقة الذاكرة المنظمة](/posts/truth-layer-agent-memory) التي أقوم بإنشائها: المخطط أولاً، حتمي، مصمم للمصدر وإعادة التشغيل. كلا النظامين يتجاوزان RAG؛ أنها تختلف في كيفية بناء الهيكل.

**xMemory** يبني تسلسلًا هرميًا من أربعة مستويات (الرسائل إلى الحلقات إلى الدلالات إلى السمات) مع التضمينات وملخصات LLM. الحلقات عبارة عن كتل متجاورة. الدلالات هي حقائق قابلة لإعادة الاستخدام؛ دلالات مجموعة المواضيع للوصول عالي المستوى. يوازن هدف دلالات التناثر حجم الموضوع. يؤدي الحجم الكبير جدًا إلى استرجاع زائد عن الحاجة؛ أجزاء صغيرة جدًا من الأدلة. يتم الاسترجاع من أعلى إلى أسفل: حدد مجموعة مدمجة من السمات والدلالات، ثم قم بالتوسيع إلى الحلقات السليمة (والرسائل اختياريًا) فقط عندما يؤدي ذلك إلى تقليل عدم اليقين لدى نموذج القارئ. لا يوجد تشذيب داخل الوحدات. وفقًا لتلك المعايير، فإنه يتفوق على خطوط الأساس الخمسة المتعلقة بالجودة واستخدام الرمز المميز. تشير الورقة إلى أن البنية التي تم إنشاؤها بواسطة LLM (على سبيل المثال في A-Mem، MemoryOS) هشة: انحرافات التنسيق، والتحديثات الفاشلة. نظرًا لأن xMemory يبني تسلسله الهرمي باستخدام ملخصات LLM، فإنه يتبنى نفس الهشاشة.

** الورم العصبي ** يبني الهيكل دون وجود ماجستير في القانون في المسار الحرج. يتم كتابة الكيانات؛ العلاقات والجداول الزمنية واضحة؛ يستخدم الاسترجاع المخطط ومعرفات الكيانات والعلاقات والنطاقات الزمنية. نفس المدخلات والمخطط يؤدي إلى نفس المخرجات. المخططات لا تزال تتطور. الحقول غير المعروفة تهبط في طبقة الحفظ. يمكن لخط الأنابيب الحتمي تعزيز الحقول عالية الثقة في المخطط. يمكن لـ LLM اقتراح مجالات أو أنواع جديدة كتوصيات معلقة، ويتم تطبيقها فقط من خلال الأدوات أو الموافقة البشرية. يظل الاستدلال استشاريًا: تمر تغييرات المخطط من خلال الأدوات أو الموافقة البشرية؛ يبقى الاستخراج والتخفيض حتميًا؛ يبقى المخطط مصدر الحقيقة. ينطبق نقد الورقة عندما يحرك النموذج البنية، وليس عندما يقترح ويطبق البشر أو الأدوات. يظل الاستيعاب من أجل الاسترداد أمرًا حتميًا.

### المقارنة

| | ذاكرة x | ورم نيوتوما |
|--|--------|--------|
| مصدر الهيكل | التضمينات + ملخصات LLM (الحلقات، الدلالات، المواضيع) | المخطط الأول، الاستخراج الحتمي والمخفضات |
| التسلسل الهرمي | أربعة مستويات (الرسائل، الحلقات، الدلالات، المواضيع)، تسترشد بالهدف الدلالي المتناثر | الكيانات المكتوبة والعلاقات والجداول الزمنية (لا توجد "مستويات" ثابتة) |
| استرجاع | من أعلى إلى أسفل: اختيار تمثيلي على الرسم البياني، ثم توسيع بوابات عدم اليقين إلى حلقات/رسائل سليمة | حسب المخطط ومعرفات الكيانات والعلاقات والجداول الزمنية |
| التحكم في التكرار | اختيار ممثل + توسيع فقط عندما ينخفض ​​عدم اليقين | تقوم الاستعلامات الهيكلية بإرجاع ما تطلبه؛ لا انهيار التشابه |
| وحدات سليمة | نعم (لا يوجد تشذيب داخل الحلقات/الرسائل) | نعم (الملاحظات والكيانات تبقى كاملة) |
| الحتمية | لا (يختلف الهيكل الذي تم إنشاؤه بواسطة LLM) | نعم (نفس الإدخال، نفس المخطط، نفس الإخراج) |
| هشاشة | يستشهد الورق بانحرافات تنسيق LLM والتحديثات الفاشلة في أنظمة مماثلة | المخطط والرمز واضحان؛ لا يوجد LLM في المسار الحرج |

### المزايا النسبية

**xMemory** يتفوق عندما يكون الإدخال عبارة عن دفق محادثة وتريد بنية دون تحديد المخططات. على سبيل المثال: محادثة طويلة مع أحد المساعدين حيث تسأل "ماذا قررنا بشأن الرحلة؟" أو "متى آخر مرة ذكرت فيها الميزانية؟" تقوم xMemory ببناء الحلقات والدلالات والموضوعات؛ يعتبر الاسترجاع فعالاً في استخدام الرمز المميز. كما أنه يناسب النماذج الأولية السريعة (تذاكر الدعم، وملاحظات الاجتماع) حيث لا ترغب في تأليف المخططات بعد. أنت تقبل الانحراف في التسلسل الهرمي ولا تحتاج إلى إمكانية التدقيق أو الاستعلام من الدرجة الأولى حسب الكيان.

**Neotoma** تتفوق عندما تحتاج إلى إمكانية التتبع أو عندما تكون بياناتك منظمة بالفعل. مثال: القرارات القابلة للتدقيق (المدفوعات والاتفاقيات ونتائج المهام) حيث يجب أن تؤدي نفس المدخلات والمخطط إلى نفس اللقطة. يتم إصدار تغييرات المخطط وتطبيقها بشكل حتمي؛ لا يوجد LLM في المسار. كما أنه مناسب تمامًا للكيانات المكتوبة (المهام وجهات الاتصال والمعاملات والأحداث) ذات العلاقات والجداول الزمنية. الاستعلام حسب نوع الكيان أو المعرف أو العلاقة أو النطاق الزمني. يعامل نيوتوما هؤلاء على أنهم مواطنون؛ قد يتطلب xMemory إجراء تسلسل إلى نص ويفقد إمكانية الوصول من الدرجة الأولى.

## الهيكلة التكرارية في المحادثة

غالبًا ما يظهر الهيكل في الحوار: "أضف مهمة لذلك"، "سجل أننا اتفقنا على دفع 500"، ويتصرف الوكيل. يتعامل النظامان مع ذلك بشكل مختلف.

**xMemory:** المحادثة هي الكائن الأساسي. ما يفعله الوكيل (على سبيل المثال، "لقد قمت بإنشاء مهمة لطبيب الأسنان") يبقى في تدفق الرسائل ويتدفق إلى الحلقات والدلالات والموضوعات. يمكنك الحصول على تسلسل هرمي متعلم بشكل أفضل ولكن لا يوجد رسم بياني منفصل للكيان يمكن الاستعلام عنه. الهيكل يعيش داخل التسلسل الهرمي.

**نيوتوما:** المحادثة هي أحد مصادر الملاحظات. عندما يقوم الوكيل بإنشاء أو تحديث مهمة أو جهة اتصال أو معاملة، فإن هذه العمليات تنتج ملاحظات ولقطات للكيان. يمكن أن يتم وضع الحقول الجديدة من الحوار في طبقة الحفظ ويتم ترقيتها إلى المخطط عندما تكون الثقة عالية. يظل الحوار والرسم البياني المنظم متزامنين لأن كلاهما يكتبان في نفس المتجر.

**استرجاع مختلف.** يدعم xMemory الاسترجاع الدلالي عبر التسلسل الهرمي. أسئلة اللغة الطبيعية ("ماذا قررنا بشأن طبيب الأسنان؟") ترجع موضوعات أو دلالات أو حلقات سليمة. لا يدعم الاسترجاع الهيكلي (لا توجد أنواع كيانات بمعرفات وعلاقات). ويؤدي ذلك إلى الفشل المتوقع في ثلاثة أنواع من الحالات:

- **الأدلة منتشرة عبر المنعطفات.** "هل تمكنا من حل النزاع بشأن الفاتورة؟" قد يكون النزاع والتفاوض والدفع في حلقات أو موضوعات مختلفة؛ يمكن أن يظهر الاسترجاع واحدًا أو اثنين ويفوت الباقي، لذلك يجيب النموذج بشكل غير صحيح أو غير كامل.
- **تعيين الاستعلامات.** "ما المهام المستحقة قبل يوم الجمعة؟" أو "إظهار كافة المدفوعات للاتصال بـ X." لا توجد كيانات مهام أو معاملات لتصفيتها؛ تحصل على مطابقات دلالية (رسائل تشير إلى "مهمة" و"الجمعة" أو "جهة اتصال X")، وليست قائمة نهائية، لذا تكون النتائج جزئية أو مشوشة.
- **اجتياز العلاقة.** "ما هي المهام في المشروع ص التي لا تزال معلقة؟" بدون رسم بياني لمهمة المشروع، يؤدي الاسترجاع إلى إرجاع مقتطفات المحادثة التي قد تحذف بعض المهام أو المشاريع؛ لا يمكنك التعداد بشكل موثوق حسب العلاقة.

نيوتوما يدعم كليهما. يمكنك طرح أسئلة ذات نمط دلالي عندما تكون البيانات موجودة في المتجر. يمكنك أيضًا الحصول على استرجاع هيكلي حسب نوع الكيان والمعرف والعلاقة والنافذة الزمنية، لذلك يقوم تعيين الاستعلامات واجتياز العلاقة بإرجاع نتائج كاملة من الدرجة الأولى. المقايضة هي أنك تحتاج إلى مخططات ومتجر يقبل تلك الملاحظات.

## البنية فوق التشابه، المخطط أولاً فوق الهشاشة

بالنسبة لذاكرة الوكيل، يفشل التشابه في النص الخام. يجب أن يكون الاسترجاع مدفوعًا بالبنية: كيفية تحليل الدفق وتنظيمه، وليس عدد القطع التي تطابق الاستعلام. توضح الورقة أن التسلسل الهرمي المكتسب (xMemory) يتفوق على RAG الساذج وأن البنية التي تم إنشاؤها بواسطة LLM هشة.

ومع ذلك، فإن المسار الحتمي الذي يعتمد على المخطط أولاً يمنحك نفس الميزة الهيكلية دون تلك الهشاشة. أنا أقوم بإنشاء [Neotoma](https://github.com/markmhendrickson/neotoma) على الأخير، لذا يظل الاستيعاب والاسترجاع قابلين للتكرار ويظل المخطط مصدرًا للحقيقة.

[^1]: **Naive RAG:** تضمين الذكريات، واسترداد الجزء العلوي الثابت من خلال التشابه، بدون تسلسل هرمي. لا يوجد مشروع منفصل. خط الأساس المحدد في [الورقة](https://arxiv.org/abs/2602.02007).
[^2]: **A-Mem:** الذاكرة الوكيلة لوكلاء LLM؛ روابط على نمط Zettelkasten وتحديثات يحركها الوكيل لشبكة الذاكرة. [المشروع](https://github.com/agiresearch/A-mem).
[^3]: **MemoryOS:** تخزين هرمي قصير/متوسط/طويل الأجل مع وحدات التحديث والاسترجاع والإنشاء للوكلاء المخصصين. [المشروع](https://github.com/BAI-LAB/MemoryOS).
[^4]: **LightMem:** ذاكرة خفيفة الوزن مستوحاة من مراحل أتكينسون-شيفرين؛ الدمج المدرك للموضوع والتحديثات طويلة المدى دون اتصال بالإنترنت. [المشروع](https://github.com/zjunlp/LightMem).
[^5]: **نيموري:** ذاكرة عرضية ذاتية التنظيم مع تجزئة الأحداث ومعايرة التنبؤ للمعرفة التكيفية. [المشروع](https://github.com/nemori-ai/nemori).