ما يفعله مكدس الوكيل الخاص بي بالفعل
لقد قمت ببناء مجموعة وكيلة لتطبيق Neotoma التجريبي وتسريع عملي. monorepo خاص يضم أكثر من 12 خادم MCP حيث أتعاون مع وكلاء الذكاء الاصطناعي يوميًا. يوفر Neotoma الذاكرة المنظمة الموجودة بالأسفل، مما يسمح للعملاء بالبناء على العمل السابق خلال كل جلسة.
الوجبات السريعة الرئيسية
- مكدس الوكيل الخاص بي عبارة عن monorepo خاص يحتوي على أكثر من 12 خادم MCP وقواعد ثابتة ومهارات قابلة لإعادة الاستخدام. أنا أعمل مع وكلاء الذكاء الاصطناعي في Cursor طوال اليوم، وأفتح جلسات للمهام بدءًا من فرز البريد الإلكتروني إلى مدفوعات Bitcoin إلى عمليات نشر مواقع الويب.
- توفر Neotoma طبقة الذاكرة المنظمة الموجودة أسفلها: أكثر من 1000 جهة اتصال، و600 مهمة، و170 نوعًا من الكيانات. يقوم الوكلاء بتخزين الكيانات والعلاقات في كل منعطف واسترداد السياق السابق قبل الاستجابة.
- تُظهر مكالمات MCP الحقيقية النمط: مكالمة "متجر" واحدة تستمر في المحادثة وجهات الاتصال المستخرجة والمهام والعلاقات المكتوبة في حمولة واحدة. تمنح مكالمات الاسترجاع الوكلاء السياق قبل أن يتصرفوا.
- تفصل بنية نيوتوما متعددة الطبقات بين الحقيقة (حالة مصدر الحدث)، والاستراتيجية (الإدراك الخالص، والقرارات الصادرة)، والتنفيذ (الآثار الجانبية، وإرجاع الأحداث). اليوم أنا طبقة الاستراتيجية. تجعل البنية هذا الدور قابلاً للاستبدال بالبرمجيات.
- الهدف هو التحول من التنفيذ العملي إلى المراجعة والموافقة، حيث يتعامل الوكلاء مع سير العمل القابل للتكرار بشكل مستقل. ستكون الحزمة مفتوحة المصدر بمجرد ترحيل البيانات الشخصية إلى Neotoma وإعادة هيكلة البرامج النصية لتكون عامة.

مجموعتي الوكيلة هي الطريقة التي أستخدم بها الطعام التجريبي Neotoma. وهو أيضًا نظام التشغيل الشخصي الخاص بي. وحدة monorepo خاصة حيث يتعامل وكلاء الذكاء الاصطناعي مع كل شيء بدءًا من فرز البريد الإلكتروني وحتى مدفوعات البيتكوين وحتى عمليات نشر مواقع الويب، مع استخدام Neotoma كذاكرة منظمة تحتها.
يتم التحقق من صحة كل ميزة أقوم بشحنها في Neotoma هنا أولاً، بشكل أساسي في Cursor وثانيًا عبر وكلاء المحطة الطرفية مثل Claude Code، وCodex، وCursor CLI. كل فجوة أجدها في ذاكرة العميل تظهر هنا أولاً. المكدس هو الطريقة التي أدير بها حياتي اليومية وعملي. الاحتكاك الذي أواجهه، بالإضافة إلى تعليقات المستخدمين، هو ما يدفع خريطة طريق Neotoma.
أنوي فتح المصدر المكدس. لكن الريبو جمع شهورًا من البيانات الشخصية، والنصوص البرمجية المشفرة في حساباتي، والتكوين المرتبط بالإعداد الخاص بي. قبل أن يتم طرحها للعامة، أحتاج إلى دفع هذه البيانات بالكامل إلى Neotoma وإعادة تصميم الأدوات لتكون عامة. وهذا العمل مستمر.
يشرح هذا المنشور ماهية المكدس، وكيف أستخدمه، وما يكشفه حول ما يجب أن تفعله ذاكرة الوكيل المنظمة.
ما هو المكدس
المكدس عبارة عن نظام أحادي يحتوي على أكثر من عشرة خوادم MCP وواجهة سطر الأوامر، كل منها يربط عملاء الذكاء الاصطناعي بخدمة مختلفة: Gmail، Google Calendar، WhatsApp، محفظة بيتكوين، Instagram، Asana، HomeKit، DNSimple، Google Search Console، 1Password، والويب مكشطة، والمزيد. بعضها عبارة عن خوادم MCP يطلق عليها الوكلاء كأدوات. البعض الآخر عبارة عن CLIs التي يستدعيها الوكلاء من المحطة. كلاهما يمنح الوكلاء نفس الشيء: الوصول إلى الخدمات الخارجية.
على رأس خوادم MCP توجد القواعد والمهارات. القواعد هي تعليمات سلوكية ثابتة تعيش في الريبو، وليس في Neotoma: قم دائمًا بتخزين جهات الاتصال في Neotoma قبل الرد، ولا تلتزم أبدًا بالأسرار، واستخدم حالة الجملة في العناوين، وقم بإجراء الاختبارات بعد تغييرات التعليمات البرمجية، وفضل واجهة سطر الأوامر (CLI) على لوحة القيادة للسجلات والتكوين، واربط أول ذكر لأسماء المنتجات. المهارات عبارة عن مسارات عمل متعددة الخطوات: فرز صندوق الوارد الخاص بي، وصياغة منشور مدونة، ونشر موقع ويب، ومعالجة التعليقات على المنتج، واستخراج طلب أمازون من البريد الإلكتروني، والدفع للمقاول بعملة البيتكوين.
وتحت كل شيء يوجد Neotoma كطبقة الذاكرة المنظمة. وكل وكيل يقرأ منه ويكتب إليه. وهذا ما يجعل المكدس يتراكم بمرور الوقت بدلاً من إعادة التعيين في كل جلسة.
كيف أعمل معها
أنا أعيش في المؤشر. يومي عبارة عن سلسلة من جلسات الوكيل. أفتح وكيلًا جديدًا، وأصف ما أريد القيام به، ويقوم الوكيل بالتنفيذ باستخدام خوادم MCP وقواعدها ومهاراتها الموجودة في مساحة العمل. بعض الجلسات سريعة: "الرد على هذا البريد الإلكتروني". بعضها طويل: "فرز البريد الوارد الخاص بي، ومعالجة أحدث تعليقات المختبرين، ثم صياغة مشاركة مقارنة حول وكيل ذاكرة Google."
إنه العمل المشترك مع الوكلاء. أجلس على مكتبي وأعمل معهم طوال اليوم. المهام الشخصية: جدولة الإصلاح، ودفع أجور المقاول، وإدارة أحداث التقويم. الاحترافية: كتابة المشاركات ومعالجة التعليقات ونشر مواقع الويب وإدارة المجالات. الوكلاء يتولىون التنفيذ. أقوم بتقديم التوجيه ومراجعة المخرجات والموافقة على الإجراءات التي تحتاج إلى إنسان في الحلقة.
تحتوي كل جلسة وكيل على سياق مساحة العمل الكامل: كل خادم MCP، وكل قاعدة، وكل مهارة. يمكن للوكيل قراءة Gmail الخاص بي، والتحقق من التقويم الخاص بي، والاستعلام عن Neotoma للسياق السابق، وتخزين البيانات الجديدة، وإنشاء الصور، ودفع التعليمات البرمجية، والتحقق من عمليات النشر. ويتمثل دوري بشكل متزايد في وصف النوايا ومراجعة النتائج.
كيف يناسب نيوتوما
بدون الذاكرة المنظمة، تبدأ كل جلسة وكيل من الصفر. لا يعرف الوكيل من هم جهات الاتصال الخاصة بك، أو ما هي المهام المفتوحة لديك، أو ما ناقشته بالأمس، أو ما دفعته لشخص ما بالفعل. يمكنك لصق السياق في كل مطالبة، لكن هذا لا يتجاوز بضع جلسات. [ذاكرة النظام الأساسي] (/posts/your-ai-remembers-your-vibe-but-not-your-work) تخزن طاقتك الحيوية، وليس عملك. RAG يساعد في التعليمات البرمجية، ولكن ليس مع الحقائق المنظمة التي تقود سير العمل: لمن تدين له بالمال، وما هي التعليقات التي تلقيتها الأسبوع الماضي، وما هي المهام التي لا تزال مفتوحة.
يقوم مثيل Neotoma الخاص بي بتخزين أكثر من 1000 جهة اتصال، و600 مهمة، و140 محادثة، و120 مشاركة مدونة، و170 نوعًا من الكيانات التي أنشأها الوكلاء عندما واجهوا أنواعًا جديدة من المعلومات: المعاملات، والقواعد الدائمة، وملاحظات التعليقات، وأحداث التقويم، والنزاعات، والفواتير، والمهارات، ونتائج النشر. عندما يبدأ الوكيل جلسة جديدة، فإنه يسترد ما يحتاج إليه. وعندما ينتهي، فإنه يخزن ما تعلمه.
فيما يلي أفضل 20 نوعًا من الكيانات في مثيل Neotoma الخاص بي اليوم، مع مثال لكل منها:
لم يتم تصميم أي من هذه المخططات مقدمًا. يقوم الوكلاء بإنشاء المخططات وتوسيعها حسب الحاجة عندما يواجهون أنواعًا جديدة من المعلومات. يحتوي النظام الآن على إجمالي 170 نوعًا من أنواع الكيانات، معظمها يحتوي على عدد قليل من السجلات فقط. الذيل الطويل هو المكان الذي تصبح فيه ذاكرة الوكيل مثيرة للاهتمام: كيان نزاع واحد له تاريخه الكامل في المفاوضات، والتزام واحد بالمتابعة مع شخص ما إذا تغيرت الإستراتيجية، وتفضيل واحد حول كيفية التعامل مع دفعة معينة.
والفرق العملي هو أن الوكلاء يعتمدون على العمل السابق. عندما أطلب من أحد الوكلاء إرسال بريد إلكتروني إلى شخص ما، فإنه يبحث في Neotoma عن جهة الاتصال أولاً. عندما أطلب منه معالجة التعليقات، فإنه يسترد كيانات التعليقات الموجودة ويربط كيانات جديدة. عندما أطلب منه أن يدفع لمقاول بالبيتكوين، فإنه يعرف القاعدة الدائمة (الدفع دائمًا لهذا الشخص بالبيتكوين) ويتضمن رابط المعاملة في التأكيد لأن هناك قاعدة دائمة أخرى تنص على ذلك.
التخزين والاسترجاع عن قرب
يكشف Neotoma MCP عن الأدوات التي يتصل بها الوكلاء مباشرة. إليك ما يبدو عليه التخزين والاسترجاع الحقيقي في الممارسة العملية.
عندما يحتاج الوكيل إلى الاستمرار في تحويل المحادثة مع الكيانات المستخرجة، فإنه يستدعي "store" بحمولة واحدة:
متجر({
"الكيانات": [
{
"entity_type": "محادثة",
"title": "فرز البريد الإلكتروني في 9 مارس"
},
{
"entity_type": "agent_message",
"الدور": "المستخدم"،
"المحتوى": "فرز البريد الوارد الخاص بي"،
"turn_key": "conv-42:1"
},
{
"entity_type": "جهة اتصال"،
"الاسم الكامل": "أليكس تشين"،
"البريد الإلكتروني": "alex@example.com"،
"المصدر": "مكالمة تعليقات المختبر"
},
{
"entity_type": "مهمة"،
"title": "متابعة تعليقات أليكس"،
"الحالة": "معلق"،
"الأولوية": "متوسطة"
}
]،
"العلاقات": [
{
"نوع_العلاقة": "PART_OF"،
"مؤشر_المصدر": 1،
"مؤشر_الهدف": 0
},
{
"نوع_العلاقة": "REFERS_TO"،
"مؤشر_المصدر": 1،
"target_index": 2
},
{
"نوع_العلاقة": "REFERS_TO"،
"مؤشر_المصدر": 1،
"target_index": 3
}
]،
"idempotency_key": "conv-42-turn-1-triage"
})
تقوم مكالمة واحدة بتخزين المحادثة والرسالة وجهة اتصال جديدة ومهمة، وكلها مرتبطة بعلاقات مكتوبة. لم يكن الوكيل بحاجة إلى تعريف مخطط لـ "جهة الاتصال" أو "المهمة" مسبقًا. يقبل Neotoma الحقول العشوائية ويستنتج البنية.
عندما يحتاج الوكيل إلى سياق قبل الاستجابة، فإنه يستعلم حسب المعرف:
استرداد_entity_by_identifier({
"المعرف": "أليكس تشين"
})
يؤدي ذلك إلى إرجاع سجل جهة الاتصال مع البريد الإلكتروني والمحادثات السابقة ومصدر كل حقل. إذا كان الوكيل يحتاج إلى سياق أوسع، فإنه يستعلم حسب النوع:
استرداد_الكيانات({
"نوع_الكيان": "ملاحظة_ملاحظات"،
"بحث": "إصدار المطور"،
"الحد": 10
})
يؤدي هذا إلى إرجاع الملاحظات العشرة الأكثر صلة بإصدار المطور، كل منها مع لقطة كاملة وسجل المراقبة.
بالنسبة للقواعد الدائمة، يقوم الوكيل باستعادتها مرة واحدة في بداية سير العمل:
استرداد_الكيانات({
"نوع_الكيان": "قاعدة_الوضع"
})
يُرجع المثيل الخاص بي قواعد مثل "الدفع دائمًا لكارلوس بالبيتكوين" و"تقديم رسائل مسودة في كتل تخفيض السعر". يقوم الوكيل بتطبيق هذه الأمور تلقائيًا لبقية الجلسة.
عندما تلامس عمليات سير العمل الملفات (الإيصالات ولقطات الشاشة والمستندات)، يقوم الوكيل بتخزينها جنبًا إلى جنب مع الكيانات في نفس المكالمة باستخدام "مسار_الملف":
متجر({
"الكيانات": [
{
"entity_type": "معاملة"،
"البائع": "أمازون"،
"المبلغ": 47.99,
"العملة": "يورو"
}
]،
"file_path": "/path/to/receipt.pdf",
"idempotency_key": "amazon-order-march-9"
})
يتعامل [مسار التخزين غير المنظم] الخاص بـ Neotoma (https://github.com/markmhendrickson/neotoma) مع الملف من هناك. يتم معالجة وحدات البايت الأولية بالمحتوى (SHA-256)، لذا لا يتم تخزين نفس الملف مرتين أبدًا. يقوم الوكيل بتمرير الملف كما هو عبر "file_path" (البيئات المحلية مثل Cursor) أو "file_content" (base64، للبيئات المستندة إلى الويب)؛ ولا يقوم بتفسير أو استخراج البيانات قبل تخزينها. افتراضيًا، يقوم Neotoma بتشغيل تفسير الذكاء الاصطناعي على الملف المخزن تلقائيًا، واستخراج الكيانات المنظمة وربطها مرة أخرى بالمصدر من خلال علاقة EMBEDS. تؤدي إعادة تخزين نفس الملف باستخدام interpret: true إلى إعادة التفسير دون إنشاء نسخة مكررة. يصبح الإيصال بيانات منظمة قابلة للاستعلام عنها مع الاحتفاظ بملف PDF الأصلي للمصدر. يمكن أيضًا تأجيل التفسير ("التفسير: خطأ") لمعالجة الدُفعات أو إدارة الحصص، ثم تشغيله لاحقًا بتكوين مختلف.
سير العمل في الممارسة العملية
تظهر بعض عمليات سير العمل النمط.
فرز البريد الإلكتروني. يقرأ الوكيل رسائل البريد الإلكتروني غير المقروءة عبر Gmail MCP، ويتحقق من Neotoma بحثًا عن سجلات جهات الاتصال الحالية والسياق السابق مع كل مرسل، ويقوم بصياغة الردود باستخدام قواعد أسلوب الاتصال الخاص بي، ويخزن جهات الاتصال والمهام الجديدة، ويؤرشف الرسائل المعالجة. قد تؤدي عملية فرز واحدة إلى تخزين خمس جهات اتصال جديدة وثلاث مهام وعشرات المحادثات.
كتابة منشور المدونة. المهارة نفسها تعيش في نيوتوما ككيان منظم. يقوم الوكيل باستعادتها باستخدام retrieve_entity_snapshot. ثم يقوم بعد ذلك بالاستعلام عن المنشورات الموجودة لمعايرة النمط، وكتابة المسودة، وتخزين كيان المنشور بكل البيانات التعريفية، وإنشاء صور رئيسية، وإنشاء نسخة مشاركة لـ Twitter وLinkedIn، وتجديد ذاكرة التخزين المؤقت لموقع الويب من تصدير Neotoma، والنشر. تمت كتابة هذا المنصب بهذه الطريقة.
مدفوعات البيتكوين. أدفع للمقاول بعملة البيتكوين باستخدام خادم MCP لمحفظة BTC. يقوم Neotoma بتخزين القاعدة الدائمة وسجل جهات الاتصال وسجل المعاملات. يقوم الوكيل باسترداد الثلاثة، وتنفيذ الدفع، وتخزين المعاملة الجديدة باستخدام الرابط الموجود على السلسلة، ثم التأكيد.
معالجة التعليقات. عندما يقدم المختبرون تعليقات حول إصدار مطور Neotoma، يستخرج الوكلاء كيانات التعليقات المنظمة، ويربطونها بسجل جهات اتصال المختبر، ويصنفون التعليقات حسب المجموعة، ويقيمونها مقابل قيود مرحلة الإصدار. يمكن استرجاع التعليقات السابقة عن طريق المختبر، أو عن طريق المجموعة، أو عن طريق التاريخ.
نشر موقع الويب. تعمل مهارة النشر على مزامنة تعديلات تخفيض السعر المحلية مع Neotoma، وتصدير مجموعة بيانات موقع الويب الكاملة، وإعادة إنشاء ذاكرة التخزين المؤقت، ودفع repo موقع الويب، ومراقبة إجراءات GitHub حتى نجاح البناء. إذا فشل الإنشاء، يقرأ الوكيل السجلات ويصلح المشكلة ويعيد التشغيل.
تجاه العملاء الذين يركضون بدوني
يبدأ كل سير عمل بفتح وكيل المؤشر وكتابة التعليمات. أنا على اطلاع بكل مهمة. وهذا جيد بالنسبة للمرحلة الحالية، لكنه ليس الوضع النهائي.
أقوم بإعداد عمليات تلقائية حتى يتمكن الوكلاء من التعامل مع سير العمل دون مشاركتي المباشرة. القطع موجودة بالفعل: تحدد المهارات خطوات سير العمل الكاملة، ويقوم Neotoma بتخزين السياق والقواعد، وتوفر خوادم MCP إمكانية الوصول. ما هو مفقود هو التنسيق الذي يؤدي إلى تشغيل سير العمل في الموعد المحدد أو استجابة للأحداث، وواجهة موافقة خفيفة الوزن حتى أتمكن من مراجعة الإجراءات والترخيص بها دون الجلوس أمام الكمبيوتر المحمول الخاص بي.
تم تصميم [بنية الطبقات] (https://github.com/markmhendrickson/neotoma/blob/dev/docs/foundation/layered_architecture.md) لهذا الغرض بالضبط. ويفصل بين ثلاثة اهتمامات:
- طبقة الحقيقة (الورم الورمي الحديث). مصدرها الحدث، ومعتمد على المخفض، وحتمية. يقرأ جميع الوكلاء منه. تتدفق تحديثات الحالة فقط من خلال أحداث المجال التي تتم معالجتها بواسطة المخفضات. لا يوجد وكيل يحول الحقيقة مباشرة.
- طبقة الإستراتيجية. تقرأ حالة العالم الحالية من نيوتوما. يقيم الأولويات والقيود والمخاطر والالتزامات والوقت. مخرجات القرارات والأوامر. الإدراك النقي: الدولة في القرارات خارج. لا توجد آثار جانبية.
- طبقة التنفيذ. تتلقى الأوامر من طبقة الإستراتيجية. ينفذ تأثيرات جانبية من خلال محولات خارجية (واجهات برمجة تطبيقات البريد الإلكتروني وخدمات الدفع والتقويم والمراسلة). تنبعث أحداث المجال التي تصف ما حدث. تتدفق هذه الأحداث مرة أخرى من خلال المخفضات لتحديث الحالة. التأثير النقي: الأوامر الواردة، الأحداث الخارجة.
الحلقة مغلقة:
الإشارات الواردة (البريد الإلكتروني، الواتساب، التقويم، البيانات المالية)
-> التطبيع -> حالة الورم العصبي (سجل الأحداث + المخفضات)
-> علامة الاستراتيجية (تقييم الأولويات وقرارات المخرجات)
-> وكلاء التنفيذ (تنفيذ الآثار الجانبية، تنبعث الأحداث)
-> المخفضات -> الحالة المحدثة
-> العلامة التالية
اليوم، أنا طبقة الإستراتيجية. ألقي نظرة على الولاية، وأقرر ما يجب فعله، وأطلب من أحد الوكلاء تنفيذ الأمر. تجعل البنية هذا الدور قابلاً للاستبدال بالبرمجيات. يقرأ محرك الإستراتيجية Neotoma، ويقيم ما يحتاج إلى الاهتمام بناءً على القواعد والأولويات الدائمة، ويصدر الأوامر إلى وكلاء التنفيذ. يتصل هؤلاء الوكلاء بخوادم MCP، ويخزنون النتائج، وتتكرر الدورة.
والثابت الحاسم هو أنه لا توجد طبقة تكتب إلى مخزن البيانات الأساسي لـ Neotoma مباشرة. تتدفق التحديثات فقط من خلال أحداث المجال ومخفضات السرعة. وهذا يجعل النظام قابلاً للتدقيق والعكس. إذا اتخذ وكيل مستقل قرارًا سيئًا، فيمكنني تتبع الحدث الذي تسبب في ذلك، والتراجع عن تحديث الحالة، وتصحيح القاعدة التي أدت إلى ذلك.
الهدف هو تقليل الوقت اليومي الذي أقضيه على الكمبيوتر. لا القضاء عليه. التحول من التنفيذ العملي إلى المراجعة والموافقة. أريد أن أستيقظ على ملخص لما تعامل معه وكلائي بين عشية وضحاها: فرز رسائل البريد الإلكتروني، وصياغة المشاركات، والتحقق من عمليات النشر، ووضع المدفوعات في قائمة الانتظار. أريد الموافقة على الدفع بالبيتكوين من Apple Watch. أرغب في مراجعة رسالة بريد إلكتروني تمت صياغتها على هاتفي أثناء المشي والنقر فوق للإرسال. يتعامل الوكلاء مع نسبة 80% القابلة للتكرار. أنا أتعامل مع الـ 20% التي تحتاج إلى حكم.
هذا هو المكان الذي يصبح فيه سؤال الأجهزة مثيرًا للاهتمام. الهواتف والساعات اليوم ليست مصممة لنمط التفاعل هذا. أنت بحاجة إلى جهاز محسّن لإجراء المراجعة المختصرة وإيماءات الموافقة، وليس للكتابة أو التصفح.
من بين الأجهزة الموجودة اليوم، تبدو Apple Watch هي الأقرب إلى عامل الشكل الصحيح: دائمًا على معصمك، ويمكن رؤيتها بسهولة، وقادرة على إجراء تفاعلات بسيطة من خلال النقر للموافقة. لكن طبقة البرمجيات لم تصل بعد. لا توجد طريقة لإرسال ملخصات الوكيل وطلبات الموافقة إلى الساعة بطريقة تبدو أصلية.
قد يكون هذا مجالًا بالنسبة لي لتجربته في مرحلة ما، من خلال إنشاء تطبيق مصاحب خفيف الوزن يربط حالة نيوتوما بواجهة على مستوى المعصم. سواء انتهى السطح الصحيح إلى تطبيق ساعة، أو جهاز مخصص للذكاء الاصطناعي، أو شيء غير موجود بعد، فإن نموذج التفاعل واضح: الوكلاء يقومون بالعمل، والذاكرة المنظمة هي التي تحتفظ بالحالة، والإنسان يوفر التوجيه بوتيرة النية بدلاً من وتيرة التنفيذ.
المكدس مفتوح المصدر
المكدس خاص اليوم لأنه يحتوي على حياتي: جهات الاتصال، والأمور المالية، والبيانات الصحية، والاتصالات الشخصية، والقواعد الدائمة حول كيفية إدارة أسرتي. قبل أن أتمكن من فتح المصدر، أحتاج إلى فك كل ذلك.
الطريق واضح ومباشر. تنتقل البيانات الشخصية بشكل كامل إلى نيوتوما، وهو بالفعل مصدر الحقيقة لمعظمها. تتم إعادة هيكلة البرامج النصية التي تشير إلى حساباتي ومساراتي المحددة لقراءتها من التكوين. تصبح أغلفة خادم MCP عامة. تفقد المهارات افتراضاتها المضمنة.
ما تبقى هو مكدس وكيل قابل لإعادة الاستخدام: قالب monorepo مع سقالات خادم MCP، وإطار القواعد والمهارات، وتكامل Neotoma للذاكرة المنظمة، ونماذج سير العمل التي يمكن لأي شخص التكيف معها. الهندسة المعمارية هي الجزء المثير للاهتمام. بياناتي الشخصية ليست كذلك.
ليس لدي جدول زمني لهذا. تتم إعادة البناء جنبًا إلى جنب مع الاستخدام اليومي. في كل مرة أتطرق فيها إلى نص ما، أجعله أكثر عمومية. في كل مرة أقوم بنقل البيانات إلى Neotoma، أقوم بإزالتها من الريبو. تصبح المكدس أكثر قابلية للنقل مع كل جلسة.
ما يثبته هذا بشأن نيوتوما
لقد قمت ببناء هذه المكدس قبل وجود نيوتوما. استخدم الإصدار المبكر ملفات مسطحة وجداول Parquet. عملت حتى لم تفعل ذلك.
كانت أوضاع الفشل محددة: حيث يقوم الوكيل بتخزين جهة اتصال باسم "سارة كيم" في جلسة واحدة و"S. Kim" في جلسة أخرى، مما يؤدي إلى إنشاء نسخ مكررة دون أي طريقة لدمجها. لم يكن هناك مصدر، لذلك لم أتمكن من تحديد الوكيل الذي كتب الحقل أو متى.
كانت الاستعلامات مقتصرة على المطابقات التامة في أعمدة فردية، لذا فإن السؤال "ما هي التعليقات التي حصلت عليها الأسبوع الماضي؟" يعني مسح كل ملف يدويًا. في بعض الأحيان، تتم الكتابة فوق السجلات بشكل سيئ أو يتم حذفها بالكامل، مع عدم وجود سجل أحداث للتعافي منه. ولا يوجد شيء مرتبط عبر الأنواع، لذا فإن معرفة أن المهمة المتعلقة بجهة اتصال مرتبطة بمعاملة تتطلب مني الاحتفاظ بهذا الرسم البياني في رأسي.
استبدل الورم النيوتومي تلك الطبقة. لقد منح الوكلاء ذاكرة منظمة وقابلة للاستعلام ومدركة للعلاقة التي تعمل عبر كل سير عمل. تحتوي المكدس الآن على 170 نوعًا من الكيانات في Neotoma، ليس لأنني صممت 170 مخططًا مقدمًا، ولكن لأن الوكلاء يقومون بإنشاء أنواع كيانات عندما يواجهون أنواعًا جديدة من المعلومات. تختلف ملاحظة الملاحظات عن المعاملة عن القاعدة الدائمة، ويتعامل النظام معها جميعًا.
هذا هو التطبيق التجريبي الذي يبقي نيوتوما صادقًا. عندما يكون الاسترجاع بطيئًا، أشعر بذلك في كل جلسة وكيل. عندما يفشل تحليل الكيان، أحصل على جهات اتصال مكررة. عندما يكون التخزين غير موثوق، يتعطل سير العمل. كل خلل وكل فجوة تظهر في عملي اليومي قبل أن تظهر في عمل أي شخص آخر.
مشكلة الذاكرة عالمية. سيصطدم كل سير عمل وكيل يقوم ببناء مطور بنفس الجدار: الوكلاء الذين لا يستطيعون التذكر، ولا يمكنهم الاستعلام، ولا يمكنهم البناء على العمل السابق. الاسترجاع وحده لا يكفي; البنية والمصدر هما ما يجعل الذاكرة جديرة بالثقة. تعد هذه المكدس دليلاً على أن الذاكرة المنظمة تغير ما يمكن للوكلاء فعله. Neotoma هي الطريقة التي أجعل بها ذلك متاحًا للجميع.
إصدار المطور مفتوح للاختبار. إذا كنت تقوم بإنشاء مسارات عمل فعالة وتريد ذاكرة منظمة تحتها، فهذا هو المكان الذي تبدأ منه.