[غرد بوريس تشيرني (مبتكر Claude Code في Anthropic)](https://x.com/bcherny/status/2017824286489383315) أن Claude Code انتقل من RAG بالإضافة إلى قاعدة بيانات المتجهات المحلية إلى البحث الوكيل. وقال إنه يعمل بشكل أفضل وأبسط، مع وجود عدد أقل من المشكلات المتعلقة بالأمن والخصوصية. أدوات أخرى تأخذ مسارا مختلفا. يستخدم المؤشر، على سبيل المثال، عمليات التضمين السحابية لفهرسة قاعدة التعليمات البرمجية والبحث عن طريق التشابه الدلالي.

لذلك لدينا نموذجان للاسترجاع على الأقل: البحث القائم على التضمين (تشابه المتجهات المفهرس مسبقًا) والبحث الوكيل (استخدام الأداة عند الطلب). إنهم ليسوا نفس الشيء. ولكل منها مقايضات مختلفة. كلاهما استراتيجيات استرجاع. طبقة الحقيقة شيء آخر. إنها تحافظ على الكيانات الأساسية، وتحافظ على المصدر، وتدعم الاستعلامات الحتمية. يتعلق الأمر بالحالة وليس الاسترجاع. يقارن هذا المنشور طبقة الحقيقة بكلا نموذجي الاسترجاع. كما أنه يرتبط أيضًا بالحدود التي وصلت إليها عند الاعتماد على الاسترجاع وحده.

## حيث وصلت إلى الحدود

أستخدم المؤشر كواجهة مركزية لجميع عمليات سير العمل الرقمية الخاصة بي، وليس فقط البرمجة. فرز البريد الإلكتروني، وإدارة المهام، والاستعلامات المالية، وتخطيط المحتوى، والمعاملات، وجهات الاتصال. يتم تشغيلهم جميعًا من خلال نفس الوكيل مع إمكانية الوصول إلى نفس الريبو. غالبًا ما يعمل البحث الوكيل عبر الملفات بشكل جيد. يجد الوكيل السياق، ويستنتج الاتصالات، وينجز الأمور.

لكنني وصلت إلى الحدود. يستنتج الوكيل؛ لا يضمن. إليك ما يبدو عليه الأمر:

- **مجموعات بيانات كبيرة، استرجاع غير مكتمل.** يؤدي البحث عند الطلب إلى فقدان أشياء أو اقتطاع عبر آلاف المعاملات أو مئات جهات الاتصال. يتم إعادة الاسترجاع في كل مرة. لا يوجد متجر منظم للاستعلام عن النتائج الكاملة.
- **عمليات الكتابة الفوقية غير القابلة للاسترداد.** يقوم الوكيل بالكتابة فوق جهة اتصال أو مهمة وتختفي الحالة السابقة. لا التراجع. الكتابات في مكانها. لا يوجد إصدار أو مسار إلحاقي فقط لتتبعه واسترجاعه.
- **لا يوجد وصول عبر الأدوات.** لا أستطيع استخدام نفس السجلات من Claude.ai أو ChatGPT. الاسترجاع مرتبط بالمزود.
- **إجابات غير قابلة للتكرار.** نفس السؤال، وإجابة مختلفة. لا يمكنني إعادة إنتاج نتيجة للتحقق أو تصحيح الأخطاء. الاسترجاع غير حتمي.
- **لا يمكن التتبع.** عندما يقدم الوكيل رقمًا أو مطالبة خاطئة، لا يمكنني تتبعه مرة أخرى إلى الملفات أو السجلات المصدر. الاسترجاع ليس له مصدر.
- **الهوية الأساسية غير المستقرة.** قد يتعامل الوكيل مع "Acme Corp" و"ACME CORP" على أنهما نفس الشيء في جلسة واحدة ويختلفان في الجلسة التالية. استرجاع يستنتج في كل مرة. لا توجد معرفات أساسية ثابتة أو قواعد دمج.

## نموذجان للاسترجاع ونموذج حالة واحد

يقوم كل من البحث القائم على التضمين والبحث الوكيل بالحصول على المعلومات إلى الوكيل. إنهم ليسوا نفس الشيء. يقوم البحث القائم على التضمين (مثل المؤشر) بفهرسة المجموعة مسبقًا والإجابات عبر تشابه المتجهات. يمكن استضافة الفهرس وتحديثه على السحابة. يتخطى البحث الوكيل (مثل Claude Code) الفهرس المستمر ويستخدم أدوات للبحث والقراءة عند الطلب. تطبيقات مختلفة، ومقايضات مختلفة: الخصوصية، والجمود، والبساطة.

ما يشاركونه هو الاسترجاع. يجد الوكيل الأشياء في وقت الاستعلام. طبقة الحقيقة ليست استرجاعا. إنها حالة مستمرة ومنظمة: كيانات قانونية، ومصدر، واستعلامات حتمية.

نحن نقارن نموذج حالة واحد (طبقة الحقيقة) بنموذجين من نماذج الاسترجاع (القائم على التضمين والوكيل). الجدول أدناه يلخص الثلاثة. عندما يتشارك عمودا الاسترجاع في حد (على سبيل المثال، لا يوجد مصدر)، فهذا تشابه بينهما بالنسبة لطبقة الحقيقة. إنها ليست معادلة بين الاثنين.

| المجال | البحث القائم على التضمين | بحث الوكيل | طبقة الحقيقة |
|--------|----------------------------------------|------------|
| استرجاع الوثائق | التشابه المفهرس مسبقًا، التطابق الدلالي | البحث حسب الطلب والاستدلال | تحليل الكيان، الحذف، المصدر |
| تجميع متعدد المصادر | يعتمد نطاق الفهرس ونضارته على البنية | بحث مباشر عبر المصادر | رسم بياني موحد، دمج حتمي |
| بحث عن الكيان | التشابه على التضمين. لا يوجد معرف أساسي | الاستدلال لكل جلسة | المعرفات الأساسية، الدمج القائم على القواعد |
| استعلامات الجدول الزمني | فقط في حالة فهرستها؛ لا يوجد نموذج التوقيت الأصلي | التجميع حسب الطلب | محسوبة مسبقًا ومبنية على المخطط |
| المصدر والتدقيق | لا شيء | لا شيء | مسار التدقيق غير القابل للتغيير |
| عبر منصة | مرتبط بالموفر/الفهرس | أدوات خاصة بالموفر | نفس البيانات عبر الأدوات |

يعمل كلا أسلوبي الاسترجاع على تحسين الراحة والمرونة. تعمل طبقة الحقيقة على تحسين الاتساق وإمكانية التحقق.

## ما توفره طبقة الحقيقة

يتم بناء طبقة الذاكرة المنظمة حول أساسيات مختلفة:

1. **الهوية الأساسية الثابتة.** معرفات الكيانات الثابتة عبر الجلسات والأدوات.
2. ** منطق الدمج الحتمي. ** مجموعة من الملاحظات القائمة على القواعد، وليس استنتاج LLM لكل جلسة.
3. ** المصدر والتدقيق. ** نسب يمكن تتبعه من المصدر إلى الإجابة.
4. ** العجز. ** نفس المدخلات تؤدي إلى نفس المخرجات.
5. ** الحقيقة عبر الأنظمة الأساسية. ** نفس الذاكرة عبر ChatGPT وClaude وCursor.
6. **نموذج خصوصية واضح.** تحكم المستخدم، عدم استخدام تدريب مقدمي الخدمة، حدود بيانات واضحة.

هذه ليست تحسينات تدريجية على البحث الوكيل. هم تصميم مختلف. أفضل جهد في الاسترجاع والتنسيق مقابل الحالة التي يمكن التحقق منها والقابلة لإعادة التشغيل. الاختيار يعتمد على ما تحتاجه.

## ما يمكن أن تقريبه عملية الاسترجاع (الوكيل أو القائم على التضمين)

تظهر ثلاثة أمثلة أن الاسترجاع (الوكيل أو القائم على التضمين) يقارب الإمكانيات المذكورة أعلاه. في كل مثال، يحصل الوكيل على شيء يبدو مناسبًا في الوقت الحالي. في كل منها، تظهر نفس الحدود: لا توجد هوية أساسية ثابتة، ولا مصدر، ولا يوجد ضمان بأن "نفس الاستعلام" يؤدي إلى "نفس النتيجة" عبر الجلسات أو عمليات إعادة بناء الفهرس. تستخدم الأمثلة أدناه مصطلحات الوكيل (الأدوات، البحث حسب الطلب). يمكن للاسترجاع القائم على التضمين أن يقارب نفس السلوكيات عبر البحث الدلالي عبر الفهرس ويصل إلى نفس الحدود.

**المثال 1: تحليل الكيان على مستوى الجلسة.** يمتلك الوكيل أدوات للبحث في الملفات والبريد الإلكتروني والسحابة. يحتوي على تعليمات للتعامل مع الإشارات إلى نفس الكيان على أنه كيان واحد. أنت تسأل: "ما هو إجمالي إنفاقي مع شركة Acme Corp؟" يقوم الوكيل بالبحث عن صادرات البنك والإيصالات والفواتير. يجد "Acme Corp"، "ACME CORP"، "Acme Corporation"، ويستنتج نفس الكيان، ويجمع المبالغ. يبدو ذلك بمثابة تحليل الكيان لهذا الاستعلام والجلسة. ما الخطأ: اسأل مرة أخرى غدًا وقد يختلف الرقم. قد يفوتك الوكيل ملفًا (بحث مقطوع، مسار خاطئ) وعدد أقل من الملف. أو قد تتعامل مع "Acme Corp" و"Acme Industries" على أنهما نفس الشيء ويتجاوزان العدد. لا توجد وسيلة للتحقق. لا يوجد مسار تدقيق، ولا معرفات مستقرة. قد تختلف الجلسات المختلفة.

**المثال 2: تجميع المخطط الزمني حسب الطلب.** يتمتع الوكيل بإمكانية الوصول إلى الملفات والتاريخ على نطاق واسع. أنت تسأل: "ما هي نفقاتي الرئيسية في الربع الثالث من عام 2024؟" يقوم الوكيل بالبحث، وتحليل التواريخ، وتجميع قائمة مرتبة ترتيبًا زمنيًا، والتصفية حسب "التخصص". يمكنك الحصول على إجابة تشبه الجدول الزمني بدون نظام جدول زمني مخصص. ما الخطأ: يتم استنتاج "الرائد" في كل مرة. جلسة واحدة لا تشمل عنصرًا بقيمة 500 يورو. التالي يتضمن ذلك. يتم إسقاط المستندات ذات تنسيقات التاريخ غير القياسية أو ترتيبها بشكل خاطئ. قد يقوم الوكيل باقتطاع ("إليك أهم 10") عندما يكون هناك 15. نفس الاستعلام، ونتائج مختلفة، في كل مرة.

**المثال 3: طبقة الذاكرة الهجينة.** يقدم الموفر بحثًا وكيلًا بالإضافة إلى ذاكرة خفيفة الوزن. يقوم الوكيل باستخراج المقتطفات المنظمة وتخزينها واستعادتها لاحقًا. يقوم بمعالجة إيصال، ويخزن `{vendor: "Acme Corp"، المبلغ: 150، التاريخ: "2024-07-15"}`. تسترد جلسة لاحقة هذا وتدمج مع نتائج البحث المباشرة. هذا يبدو وكأنه ذاكرة منظمة. الخطأ الذي يحدث: يؤدي الاستخراج اللاحق إلى الكتابة فوق المقتطف. لا الإصدارات، لا التراجع. يظهر نفس البائع باسم "Acme Corp" في الذاكرة المخزنة و"ACME CORP" في البحث الجديد. تتراكم التكرارات. يقوم الموفر بتغيير الميزة أو المخطط وتختفي المقتطفات المخزنة لديك. لا توجد طريقة لتتبع رقم خاطئ إلى مصدره.

في كل مثال، يقترب السلوك مما توفره طبقة الحقيقة. الحدود متأصلة في الاسترجاع. سواء كان الوكيل يستخدم بحث التضمين أو بحث الوكيل، فستظل تحصل على نطاق الجلسة والدمج القائم على الاستدلال. لا تزال لا تحصل على أي مصدر أو ضمان عبر الأنظمة الأساسية. تعالج طبقة الحقيقة تلك الحالات من خلال استمرار الحالة بدلاً من إعادة استعادتها.

## عندما يتفوق الاسترجاع (الوكيل أو القائم على التضمين)

**اكتشاف استكشافي.** "ابحث عن أي شيء في التنزيلات أو الملاحظات الخاصة بي حول شقة برشلونة." أنت لا تعرف أين يعيش أو ما اسمه. يعرض البحث الوكيل عبر الملفات والمجلدات والتنسيقات المقتطفات ذات الصلة. لا يوجد مخطط مطلوب. الفاعل يستنتج ويجمع.

**تلخيص سريع عبر المصادر.** "ماذا قررنا في آخر ثلاث رسائل بريد إلكتروني مع المقاول؟" البحث في البريد الوارد، واستخراج الموضوع، وتلخيص. جلسة واحدة، إجابة واحدة. لا تحتاج إلى أن يستمر هذا الملخص أو يتطابق تمامًا في المرة القادمة.

**الكود المخصص واجتياز المستندات.** "أين نتعامل مع خطافات الويب الشريطية؟" ابحث في قاعدة التعليمات البرمجية، التمهيدي، المستندات الداخلية. يختلف التخطيط حسب الريبو. بحث الوكيل يتكيف. لا حاجة إلى رسم بياني موحد.

**فرز مستند واحد أو سلسلة واحدة.** "تلخيص ملف PDF هذا" أو "ما هو السؤال في هذه الرسالة الإلكترونية؟" السياق محدود. الاستدلال كاف. لا يوجد حل للكيان أو حالة الجلسة المشتركة.

## عندما تتفوق طبقة الحقيقة

**استدعاء كامل لمجموعات البيانات الكبيرة.** "أدرج كل معاملة مع المورد X في العامين الماضيين." مع آلاف الصفوف، قد يؤدي البحث الوكيل إلى فقدان السجلات أو اقتطاع المجاميع أو الهلوسة. تستعلم طبقة الحقيقة عن متجر منظم. يمكنك الحصول على كافة السجلات المطابقة أو العد الدقيق.

**التناسق بين الجلسات.** يقوم الوكيل بإنشاء مهمة متابعة في الجلسة الأولى. تفتح جلسة جديدة غدا. يجب أن تكون المهمة موجودة، مرتبطة بجهة الاتصال الصحيحة والبريد الإلكتروني. لا يحتوي بحث الوكيل على رسم بياني مستمر. طبقة الحقيقة تفعل ذلك.

**التدقيق والمصدر.** "من أين أتى هذا الرقم؟" تتبعه إلى السجلات المصدر وتواريخ الاستيراد وقواعد الاشتقاق. يقوم بحث الوكيل بإرجاع الإجابات المستنتجة. تقوم طبقة الحقيقة بإرجاع الإجابات مع النسب.

**تحليل الكيان على نطاق واسع.** مئات جهات الاتصال، وبعض التكرارات (أسماء مختلفة، شركات مدمجة). آلاف المعاملات تشير إلى نفس البائع تحت تهجئات مختلفة. تحافظ طبقة الحقيقة على المعرفات الأساسية وقواعد الدمج. يعيد البحث الوكيل استنتاج كل جلسة وقد يختلف.

**الإعادة الحتمية.** نفس الاستعلام، نفس النتيجة، في كل مرة. ضروري لإعداد التقارير أو الامتثال أو تصحيح الأخطاء. البحث الوكيل غير حتمي. طبقة الحقيقة عاجزة.

**قابلية الاسترداد من عمليات الكتابة السيئة.** يقوم الوكيل بالكتابة فوق جهة اتصال، أو دمج مهمتين في مهمة واحدة، أو "تصحيح" معاملة بناءً على استنتاج خاطئ. مع البحث الوكيل وكتابة الملف المباشر، تختفي الحالة السابقة. لا التراجع. تستخدم طبقة الحقيقة عمليات الكتابة الإلحاقية فقط أو ذات الإصدار. يمكنك تتبع ما تغير والتراجع. الطفرات هي عمليات صريحة، وليست عمليات كتابة صامتة.

## لماذا يهم التمييز

يكون الاسترجاع (القائم على التضمين أو الوكيل) مرتبطًا بالجلسة. إنه لا يمنحك في حد ذاته هوية ثابتة أو مصدرًا أو اتساقًا بين الجلسات. قيمته مرنة، والوصول عند الطلب. قيمة طبقة الحقيقة هي الحقيقة المستمرة عبر الجلسات. إن حل الكيان الحتمي والقابل للتدقيق أمر صعب. لا يتساوى تضمين التشابه ولا البحث الوكيل المخصص. يواجه الوكلاء الذين يستضيفهم الموفرون حوافز تتعارض مع الذاكرة التي تعطي الأولوية للخصوصية والتي يتحكم فيها المستخدم. تميل ذاكرتهم وأدواتهم إلى أن تكون خاصة بالمنتج.

تعكس تغريدة تشيرني تحولاً حقيقياً. كان RAG plus Vector DB معقدًا وكان له آثار على الخصوصية. بحث وكيل استرجاع مبسط لكلود كود. يتخذ المؤشر وغيره مسار استرجاع مختلف (التضمينات السحابية). كلا نموذجي الاسترجاع يحلان "كيف يجد الوكيل الأشياء؟" ولا يحل أي منهما "كيف نحصل على هوية مستقرة ومصدر وتحقق؟" طبقة الحقيقة تستهدف الأخير. سوف تتعايش طبقات الاسترجاع والحالة. يحلون مشاكل مختلفة.

## ما أقوم ببنائه

أنا أقوم ببناء [Neotoma](https://github.com/markmhendrickson/neotoma)، وهي طبقة ذاكرة منظمة تتبع نهج طبقة الحقيقة: تحليل الكيان، والجداول الزمنية، والمصدر، والحتمية، والنظام الأساسي عبر MCP. أنا أقوم بتجربته في مجموعة الوكلاء الخاصة بي لمعرفة مدى أهمية هذه البدائيات في الممارسة العملية. البحث القائم على التضمين والبحث الوكيل هما استراتيجيتان للاسترجاع. ولا يمنحك أي منهما هوية ثابتة أو حالة يمكن التحقق منها. طبقة الحقيقة تفعل ذلك. أنا أقوم ببناء الأخير.