[Shubham Saboo](https://x.com/Saboo_Shubham_) (Google PM) [وكيل ذاكرة مفتوح المصدر دائمًا](https://github.com/GoogleCloudPlatform/geneative-ai/tree/main/gemini/agents/always-on-memory-agent) الأسبوع الماضي كجزء من GCP geneative-ai repo. [قامت شركة VentureBeat بتغطيتها](https://venturebeat.com/orchestration/google-pm-open-sources-always-on-memory-agent-ditching-vector-databases-for) كإشارة حول الاتجاه الذي تتجه إليه البنية التحتية للوكيل. إنه نظام ذاكرة مستمر يعمل على مدار الساعة طوال أيام الأسبوع كعملية خلفية، ويستوعب الملفات، ويدمجها على مؤقت، ويجيب على الاستفسارات. لا توجد قاعدة بيانات المتجهات. لا التضمين. مجرد ماجستير في القانون يقرأ ويفكر ويكتب الذاكرة المنظمة إلى SQLite.

يتحقق المشروع من صحة شيء كنت أعمل على تحقيقه باستخدام [Neotoma](https://github.com/markmhendrickson/neotoma): الذاكرة المستمرة للوكلاء هي حاجة حقيقية ومتنامية. لكن المشروعين يتخذان خيارات معمارية متعارضة. هذا المنصب يقارن لهم.

## ما هو عامل الذاكرة الذي يعمل دائمًا؟

المشروع عبارة عن تطبيق مرجعي تم إنشاؤه باستخدام [Google ADK (Agent Development Kit)](https://google.github.io/adk-docs/) و[Gemini 3.1 Flash-Lite](https://ai.google.dev/gemini-api/docs/models). يتم تشغيله كعملية خلفية خفيفة الوزن مع ثلاثة وكلاء فرعيين متخصصين: واحد للعرض، وواحد للدمج، وواحد للاستعلام.

1. **الابتلاع.** يقوم مراقب الملفات بمراقبة دليل البريد الوارد. قم بإسقاط ملف وسيقوم الوكيل باستلامه. كما يقبل الإدخال عبر HTTP POST. يتعامل مع النصوص والصور والصوت والفيديو وملفات PDF. يستخرج LLM الملخصات والكيانات والموضوعات ودرجات الأهمية.

2. **الدمج.** في المؤقت، يقرأ وكيل الدمج جميع الذكريات المخزنة، ويبحث عن الروابط والأنماط عبرها، ويضغط العناصر ذات الصلة، ويكتب رؤى مركبة جديدة. يتم تشغيل هذا في الخلفية دون مطالبة.

3. **استعلام.** أنت تطرح سؤالاً. يقرأ وكيل الاستعلام الذكريات ذات الصلة والرؤى الموحدة، ويجمع الإجابة، ويعيدها مع الاستشهادات إلى سجلات ذاكرة محددة.

التخزين هو SQLite. لا توجد قاعدة بيانات متجهة، ولا يوجد فهرس للتضمين. تراهن البنية على أن LLM يمكنه التعامل مع الاسترجاع مباشرة عبر السجلات النصية المنظمة دون الحاجة إلى البحث عن التشابه.

## حيث تتفوق

**البساطة.** استنساخ الريبو، وتعيين مفتاح Gemini API، وتشغيله. مراقب الملفات، HTTP API، ولوحة تحكم Streamlit. الحد الأدنى من التبعيات ولا توجد بنية تحتية للإدارة خارج نطاق العملية الواحدة. بالنسبة للمطورين الذين يستكشفون ذاكرة الوكيل باستخدام Gemini، فهذا هو أسرع مسار للعرض التجريبي العملي.

**السرد "لا توجد قاعدة بيانات متجهة".** تؤدي إزالة قاعدة بيانات المتجهات إلى تقليل التعقيد التشغيلي والمفاهيمي. لا توجد نماذج تضمين للاختيار، ولا يوجد فهرس للمحافظة عليه، ولا يوجد ضبط للاسترجاع. بالنسبة لعمليات النشر على نطاق صغير، يعد هذا تبسيطًا حقيقيًا.

**الدمج النشط.** يعد الدمج المعتمد على المؤقت هو الجزء الأكثر تميزًا. معظم أنظمة الذاكرة سلبية: تقوم بتخزين الأشياء واسترجاعها. يقوم هذا الجهاز بالاتصال والضغط والتركيب بشكل نشط. يجد الأنماط التي لم تسأل عنها. وهذا يتردد صداه مع أي شخص يريد "الذاكرة التي تفكر" بدلاً من الذاكرة التي تنتظر.

##حيث تتباعد المقاربات

يتشارك وكيل الذاكرة Always-On وNeotoma في الهدف (ذاكرة الوكيل المستمرة) ولكنهما يختلفان في كل قرار تصميم تقريبًا. الاختلافات ليست عرضية. إنها تعكس مقدمات انطلاق مختلفة حول الذاكرة التي يجب تحسينها.

### العرض التلقائي مقابل العرض الصريح

مراقب الملفات تلقائي. تتم معالجة كل ما يصل إلى البريد الوارد. لا توجد خطوة موافقة، ولا تحقق من صحة المخطط أولاً، ولا يوجد تأكيد للمستخدم قبل استخراج LLM وتخزينه. يأخذ Neotoma النهج المعاكس: لا شيء يدخل النظام ما لم يكتبه الوكيل أو المستخدم صراحةً من خلال MCP. بالنسبة للملاحظات الشخصية، يعد الإدخال التلقائي أمرًا ملائمًا. بالنسبة لأي شيء يتعلق بمتطلبات الخصوصية أو الامتثال، فإن التحكم الصريح هو الخيار الافتراضي الأكثر أمانًا.

### من يقرر ما يجب تذكره

يعتمد Neotoma على وكيل العميل للاتصال بتخزين الذاكرة. يقرر الوكيل الذي تتحدث إليه (ChatGPT، Claude، Cursor) ما يستحق التذكر وكيفية تنظيمه. عندما يستنتج أن حقيقة أو جهة اتصال أو مهمة يجب أن تستمر، فإنه يستدعي عملية المتجر عبر MCP. تبقى مسؤولية "ما يجب تذكره" في طبقة الوكيل، في نفس عملية محادثتك.

يقوم عامل الذاكرة الذي يعمل دائمًا بتقسيم هذه المسؤولية عبر الوكلاء الفرعيين المتخصصين. يقرر وكيل الاستيعاب ما سيتم استخراجه من الملفات. يقرر وكيل الدمج ما سيتم دمجه وما هي الاتصالات التي سيتم رسمها. يقرر وكيل الاستعلام ما سيتم إرجاعه. يتم توزيع "ما يستحق التذكر" و"كيف" عبر هذه الوكلاء الفرعيين، الذين يعملون بشكل مستقل عن المحادثة. لا يوافق المستخدم على كل قرار. الوكلاء الفرعيون يصنعونها في الخلفية.

### يحركها LLM مقابل الاستخراج الحتمي

يستخدم Always-On Memory Agent LLM في كل شيء: استخراج الكيانات، وتعيين الأهمية، وإنشاء الملخصات. قم بإجراء نفس الاستخراج على نفس الملف مرتين وقد تختلف النتائج. يستخدم نيوتوما [الاستخراج الحتمي للمخطط الأول](/posts/truth-layer-agent-memory). نفس المدخلات تنتج نفس الكيانات، نفس المعرفات الأساسية، نفس العلاقات. يعمل التفسير الاختياري LLM فوق تلك الطبقة الحتمية، وليس بدلاً منها.

### التوحيد مقابل الحقيقة الثابتة

يقرر عامل الدمج ما سيتم دمجه، وما هي الاتصالات التي سيتم رسمها، وما الذي سيتم ضغطه. إنه يغير الذاكرة بمرور الوقت. يتم استيعاب الذكريات القديمة في رؤى مركبة جديدة. الورم نيوتوما لا يتماسك. فإنه يلحق. كل ملاحظة غير قابلة للتغيير. التاريخ مصدره الأحداث. إذا كنت بحاجة إلى معرفة ما الذي تغير ومتى ولماذا، فإن المسار الكامل موجود. لا يتم الكتابة فوق أي شيء أو ضغطه.

### منصة واحدة مقابل منصة مشتركة

المشروع مبني على Gemini و Google ADK. تعيش الذاكرة في ملف SQLite محلي لا يمكن الوصول إليه إلا من خلال مكدس الوكيل المحدد هذا. يعرض Neotoma الذاكرة من خلال MCP، مما يعني أنه يمكن الوصول إلى نفس الكيانات من خلال ChatGPT وClaude وCursor وأي أداة أخرى متوافقة مع MCP. طبقة ذاكرة واحدة ومستهلكون متعددون.

### لا يوجد أصل مقابل النسب الكامل

تحتوي سجلات الذاكرة في Always-On Memory Agent على ملخصات وكيانات مستخرجة ولكنها لا ترجع إلى الملف أو السطر أو الجلسة المحددة التي أنتجتها. إذا كانت الرؤية الموحدة خاطئة، فلن يكون هناك أي مسار تدقيق يجب اتباعه. في نيوتوما، كل حقل في كل كيان يتتبع إلى ملاحظة المصدر. يمكنك تدقيق أي حقيقة من حيث أتت.

### المقايضات على نطاق واسع

بدون التضمين أو فهرس المتجهات، يقرأ النظام سجلات النص المنظم مباشرة باستخدام LLM. وهذا يعمل على نطاق صغير. ومع نمو مخازن الذاكرة، قد لا يصمد هذا النهج. لا تؤدي إزالة قاعدة بيانات المتجهات إلى إزالة تصميم الاسترجاع. إنه ينقل التعقيد إلى نافذة سياق LLM. يستخدم Neotoma استعلامات منظمة عبر الكيانات المكتوبة، والتي تتوسع بشكل مستقل عن حدود سياق LLM.

## الركيزة مقابل الوكيل

أوضح تمييز هو الدور. عامل الذاكرة Always-On هو عامل. فهو يستوعب تلقائيًا ويدمج وفقًا لجدول زمني ويجمع الإجابات. لديها حلقة المنطق الخاصة بها. فهو يقرر ما سيتم دمجه، وما هي الاتصالات التي سيتم رسمها، ومتى سيتم ضغطها.

نيوتوما ليس وكيلا. إنها الركيزة. يقوم بتخزين الكيانات المكتوبة بمعرفات أساسية. ويحافظ على مصدره. يجيب على الاستفسارات الحتمية. ولا يقرر أي شيء من تلقاء نفسه. لا استيعاب الخلفية. لا يوجد توحيد تلقائي. لا توجد معالجة تعتمد على المؤقت. يقرأ الوكلاء منه ويكتبون إليه من خلال [MCP](/posts/agentic-search-and-the-truth-layer). يحدث المنطق في طبقة الوكيل. الحقيقة تعيش في الركيزة.

وهذا مهم بسبب ما يحدث عندما يكون الوكيل مخطئًا. إذا أدى دمج عامل الذاكرة الذي يعمل دائمًا إلى الحصول على رؤية سيئة، فإن هذه الرؤية أصبحت الآن جزءًا من الذاكرة. لا توجد طبقة منفصلة للتحقق منها. الوكيل هو الحقيقة.

باستخدام طبقة الحقيقة بالأسفل، يمكنك تتبع ما قرأه الوكيل ومتى قرأه وما كتبه مرة أخرى. إذا كانت الرؤية الجديدة خاطئة، فيمكنك الرجوع. إن مخرجات عامل الدمج عبارة عن ملاحظة فوق الحالة الحتمية، وليست طفرة لها.

| البعد | عامل الذاكرة الذي يعمل دائمًا | طبقة الحقيقة (Neotoma) |
|-----------|---------------------------------------|--------|
| الدور | وكيل مع حلقة المنطق | الركيزة بدون سلوك الوكيل |
| من يقرر ما يجب تخزينه | وكلاء فرعيون متخصصون (ابتلاع، وتوحيد) | وكيل العميل (عبر MCP) |
| ابتلاع | تلقائي (مراقب الملفات، API) | صريح فقط (MCP، CLI، تحميل) |
| استخراج | يحركها LLM. احتمالية | المخطط أولاً؛ حتمية |
| التوحيد | توحيد LLM القائم على الموقت | لا أحد؛ الحقيقة الثابتة، التحديثات من مصادر الحدث |
| المصدر | الأساسية (المصدر/الملخص في السجلات) | نسب كامل؛ كل حقل يتتبع المصدر |
| منصة | الجوزاء/جوجل ADK فقط | عبر النظام الأساسي عبر MCP (ChatGPT، Claude، Cursor) |
| الخصوصية | لم يتم وضعها على أنها الخصوصية أولاً | تسيطر عليها المستخدم. لا يوجد وصول لموفر |
| التراجع | لا؛ يتم تحور الذاكرة عن طريق الدمج | نعم؛ إلحاق فقط، إصدار، قابل للرجوع |
| نموذج مقياس | LLM يقرأ كافة السجلات؛ يحدها السياق | استعلامات منظمة على الكيانات المكتوبة |

## كيف يمكنهم العمل معًا

النهجان لا يستبعد أحدهما الآخر. يعمل عامل الدمج وطبقة الحقيقة على حل المشكلات المختلفة. يجد المرء الأنماط. والآخر يحافظ على الثقة. تجمع الهندسة المعمارية المثيرة للاهتمام بين الاثنين.

الرسم واضح ومباشر. يقوم وكيل الدمج (مثل الوكيل الموجود في Always-On Memory Agent) بقراءة الكيانات من طبقة الحقيقة عبر MCP. لديه إمكانية الوصول إلى الحالة المنظمة الكاملة: الكيانات المكتوبة، والعلاقات، والجداول الزمنية، والمصدر. فهو يدير حلقة البحث عن الأنماط الخاصة به على تلك الحالة، ويبحث عن الاتصالات أو الفجوات أو الأفكار التي لم يطلبها المستخدم. عندما يعثر على شيء ما، فإنه يكتب النتيجة مرة أخرى إلى طبقة الحقيقة كملاحظة جديدة، موسومة بكياناتها المصدرية ومنطقها.

تتعامل طبقة الحقيقة مع هذه الرؤية بنفس الطريقة التي تتعامل بها مع أي كتابة أخرى. ويسجلها كملاحظة ذات مصدر كامل: ما هي الكيانات التي قرأها الوكيل، ومتى، وما خلص إليه. تصبح الرؤية جزءًا من الرسم البياني للكيان. إذا كانت الرؤية خاطئة، فيمكنك رؤية ما استهلكه الوكيل بالضبط، وتتبع المنطق، وإرجاع الملاحظة دون التأثير على الكيانات الأساسية التي تقرأ منها.

وهذا يختلف عن كيفية عمل الدمج في Always-On Memory Agent اليوم. هناك، يقوم عامل الدمج بتحويل الذاكرة مباشرة. يتم استيعاب الذكريات القديمة في سجلات مركبة جديدة. لقد انتهت الحالة السابقة. إذا كان التركيب خاطئًا، فلا توجد طبقة منفصلة للمقارنة بها.

مع وجود طبقة الحقيقة تحتها، يصبح الدمج عملية غير مدمرة. يضيف الوكيل طبقة من التفسير فوق الحالة الحتمية. والدولة نفسها تبقى ثابتة. يمكنك الحصول على فوائد اكتشاف النمط النشط (قوة وكيل الذاكرة الدائم) مع فوائد إمكانية التدقيق والتراجع (قوة طبقة الحقيقة). الذكاء في الأعلى، والثقة في الأسفل.

## ما يؤكده هذا

يعتبر Always-On Memory Agent تطبيقًا مرجعيًا، وليس منتجًا. ما يؤكده هو أن الطلب على ذاكرة الوكيل الديناميكية المستمرة أمر حقيقي. "[Vector DB plus RAG](/posts/why-agent-memory-needs-more-than-rag)" ليس نموذج الاسترداد الوحيد. إن [الاتجاهات الهيكلية التي تحرك هذا](/posts/six-agentic-trends-betting-on) واضحة: فقد أصبح الوكلاء معتمدين على الحالة، ويتم تسعير الأخطاء، وتظل المنصات مبهمة. يشير المشروع إلى أن الصناعة تتجه نحو أنظمة الذاكرة التي تعمل دائمًا والتي تتجاوز مجرد التخزين والاسترجاع البسيط.

حيث يتفق المشروعان: الذاكرة السلبية ليست كافية. حيث يختلفون: ما إذا كان يجب على طبقة الذاكرة نفسها أن تفكر، أو ما إذا كان يجب أن يحدث التفكير في طبقة منفصلة فوق الحالة الحتمية. هذا هو السؤال الأساسي في بنية ذاكرة الوكيل في الوقت الحالي. ومن المرجح أن يدعم السوق كلا النهجين. أتوقع أن تتقارب البنية مع وكلاء الدمج الذين يفكرون، ويعملون فوق طبقات الحقيقة التي يمكنك الوثوق بها.

## ما أقوم ببنائه

أقوم ببناء [Neotoma](https://github.com/markmhendrickson/neotoma) كطبقة الثقة. الكيانات المكتوبة، والمعرفات الأساسية، والدمج الحتمي، والمصدر، والوصول عبر الأنظمة الأساسية عبر MCP. أستخدمه يوميًا عبر ChatGPT وClaude وCursor. [إصدار المطور](/posts/neotoma-developer-release) متاح الآن على [neotoma.io](https://neotoma.io).

تُظهر عينة Google أن الصناعة تتقارب مع ذاكرة الوكيل الدائمة. والسؤال المطروح ليس ما إذا كان العملاء سيتذكرون، بل كيف. القدرة أو الحكم. الوكيل أو الركيزة. التوحيد الاحتمالي أو الحقيقة الحتمية. وأنا أراهن على هذا الأخير.