لقد أرسلت لصديق رابطًا لمنتجي في نهاية المكالمة وطلبت منه أن يطلب من وكيله إخباره ما إذا كان ذلك مفيدًا أم لا.

لقد كان يخدش رأسه حول كيفية استخدامه. قام وكيل الذكاء الاصطناعي الخاص به بقراءة الموقع، وتحليل سير العمل الخاص به، وأنتج تقييمًا من صفحتين مع حالات استخدام محددة، ومقارنات تنافسية، واهتمامات صادقة. لقد حددت سيناريو واضحًا حيث سيحتاج إلى المنتج لأعمال الوكلاء B2B الخاصة به.

لقد كان أفضل من أي شيء تلقيته خلال أسابيع من المكالمات. كما أدى ذلك إلى تحفيز محادثة نصية للمتابعة كانت أعمق من المكالمة.

وفي غضون ساعة تواصلت مع عشرات الأشخاص الآخرين. على مدار ثلاثة أسابيع، كان هناك 26 شخصًا: المؤسسون، والمهندسون، ومستخدمو الذكاء الاصطناعي، والأشخاص الذين يديرون مجموعات الوكلاء الخاصة بهم. تلقى حوالي 18 منهم نفس طلب التقييم الوكيل. وقدم الباقون تعليقاتهم على المكالمات أو الرسائل دون إشراك وكيل.

المنتج هو [Neotoma](https://neotoma.io)، وهو نظام ذاكرة منظم لعملاء الذكاء الاصطناعي. أستخدمه يوميًا لحل معاناتي: إدارة جهات الاتصال والشؤون المالية والمهام والمحتوى والمحادثات عبر [مكدس متعدد الوكلاء](/posts/what-my-agentic-stack-actually-does). لقد قمت مؤخرًا [بإصلاح الموقع](/posts/neotoma-site-overhaul-developer-feedback) لجعله أكثر وضوحًا. كنت بحاجة إلى معرفة ما إذا كان أي شخص آخر يحتاج إليها، ناهيك عن فهمها.

قبل ذلك، كنت قد أمضيت أسبوعًا في إنشاء [تطبيق المقابلات](https://github.com/markmhendrickson/interviews) لأتمتة التقييمات المنظمة، باستخدام البرامج النصية المتصلة بـ Neotoma لتوفير جهات الاتصال وإرسال الدعوات ومزامنة النتائج. لم انتهي منه. لكن طريقة الوكيل الفوري جعلتها غير ذات صلة إلى حد كبير على أي حال. لا توجد واجهة مستخدم، ولا جدولة، ولا مقابلة منظمة. مجرد رابط وسؤال.

##الإعداد

وكان موجه التقييم بسيطا. سأشارك شيئًا مثل: "يقوم أحد الأصدقاء ببناء هذا. هل يمكنك أن تخبرني ما إذا كان سيكون مفيدًا أم لا؟" ثم رابط موقع المنتج . سيقوم وكيل الشخص بقراءة الموقع، والنظر في سير عمل الشخص، وتقديم تقرير.

استخدم أحد المواضيع هذا الشكل حرفيًا - تم نسخ السطر أدناه حرفيًا من البيانات التعريفية للرسالة الصادرة التي قمت بتخزينها:

> يقوم أحد الأصدقاء ببناء هذا ويريد معرفة ما إذا كان مفيدًا أم لا: https://neotoma.io

نفس المطالبة، شخص مختلف. قام وكيلهم بتعيين المنتج مباشرة إلى نقاط الألم في المجموعة الخاصة بالشخص:

> يبدو هذا مفيدًا حقًا. سبب أهميته بالنسبة لحالة الاستخدام الخاصة بك:
>
> عمليات التحقق من نبضات القلب: يعمل تتبع "آخر بريد إلكتروني تم فحصه" أو "آخر فحص للتقويم" في ملفات JSON، ولكنه هش. سوف يقوم نيوتوما بإصدار ذلك بشكل صحيح. تنسيق متعدد الوكلاء: عند إنشاء وكلاء فرعيين يحتاجون إلى التنسيق، لا يمكنهم حاليًا مشاركة الحالة بشكل موثوق.
>
> هل هو مفيد؟ نعم - إذا كان صديقك جادًا بشأن قيام وكلاء الإنتاج بعمل حقيقي بمرور الوقت. بالنسبة لمسار الكتابة الخفية والتنسيق بين الجلسات، فقد يؤدي ذلك إلى إزالة نقطة الألم الحقيقية.

قام معظمهم بإعادة توجيه الرد الكامل للوكيل خلال 24 ساعة عبر رسالة نصية أو بريد إلكتروني، والعديد منها خلال ساعة أو ساعتين. البعض لخصها عبر مكالمة. وقد قدم عدد قليل منهم تعليقات بشرية فقط دون إشراك وكيل.

لقد تتبعت كل شيء في نيوتوما نفسها. يقوم Neotoma بتخزين الكيانات المنظمة (جهات الاتصال، والمهام، وسجلات التعليقات، والمحادثات) مع ملاحظات ذات إصدارات، حتى أتمكن من رؤية كيف يتطور كل تقييم بمرور الوقت وربطه بالشخص الذي قدمه. أصبح كل تقييم بمثابة كيان للتعليقات مع الموجه الذي استخدمته، والوكيل الذي استجاب، والنص الكامل للرد، وأي متابعة بشرية، والقناة، وتقييمي لقوة الإشارة. وبحلول النهاية كان لدي أكثر من 45 سجل تعليقات مرتبطًا بكيانات الاتصال وتاريخ المحادثة وملاحظات التحليل.

## ما يفعله الوكلاء بشكل مختلف

هناك ثلاثة أشياء جعلت التعليقات التي يتوسط فيها الوكلاء أفضل من المحادثات البحثية التقليدية عن العملاء.

### إنهم صادقون

قال أحد الوكلاء لأحد المقيمين: "هذا ليس مناسبًا لك. الاستمرارية التي تحتاجها بين الجلسات تتعلق بالسياق والصوت، وليس إصدار الحالة الحتمية." أرسل المُقيّم الرد الكامل دون معارضة. ربما يكون الإنسان في نفس المحادثة قد قال شيئًا مهذبًا واستمر في الحديث.

قام وكيل آخر بتقييم المنتج بشكل إيجابي ولكنه أشار إلى مخاطر أمان التبعية في عملية التثبيت. وأوصت مالكها بعدم التثبيت حتى تتم معالجة تلك المشكلات. لقد قمت منذ ذلك الحين بتصحيح هذه الأخطاء (كان ذلك بسبب تشديد إدارة التبعية)، ولكن التعليقات كانت صادقة ومحددة وأكثر فائدة من "تبدو رائعة، سأتحقق منها لاحقًا".

قام وكيل آخر بتقييم المنتج بشكل إيجابي بشكل عام لكنه خلص إلى أن "سوق إدارة حالة الوكيل صغير جدًا في الوقت الحالي ولم يصل معظم وكلاء البناء إلى نقطة الألم بعد. وسيصلون إليه بعد أن يتعرضوا للحرق بسبب الكتابة الفوقية الصامتة أو فقدان السياق، وليس قبل ذلك." هذه ليست مجاملة مغلفة بالتشجيع. إنه تقييم للمخاطر يتم تقديمه بدون تصفية اجتماعية.

لقد تطابق إنسان واحد مع هذه المباشرة. أخبرني أن الوضع يبدو وكأنه "محاولة العثور على المشكلات التي يحلها الحل الخاص بك، بدلاً من المشكلات التي تحتاج إلى إصلاح". إنه الاستثناء. معظم البشر لن يقولوا ذلك في وجهك. سوف وكلاء.

### إنها محددة

حدد أحد الوكلاء ثلاث نقاط ضعف ملموسة في سير عمل مالكه لم يعبر عنها المالك مطلقًا في محادثة غير رسمية: الكتابة المتزامنة إلى كيان مشترك، وحدود النطاق على نظام اتصال قائم على تخفيض الأسعار، وتتبع المصدر ("ماذا عرف وكيلي عن هذا الشخص في اللحظة التي قام فيها بصياغة هذا البريد الإلكتروني؟").

لقد كانت ردود فعل الإنسان على المكالمة بمثابة "تجربة مثيرة للاهتمام". وكان تعليق الوكيل "هنا بالضبط ما يكسر هذا الأمر بالنسبة إلينا، وإليك ثلاث إمكانات نحتاجها."

وأنتج وكيل آخر تحليلاً تنافسيًا كاملاً يقارن المنتج بخمسة بدائل، ثم قام بتعيين كل منها وفقًا لفجوات سير العمل المحددة في إعداد مالكه. استغرق هذا حوالي 30 ثانية. سيحتاج الإنسان إلى أسبوع من البحث لإجراء نفس المقارنة، ولن يهتم بمشروع جانبي لصديق.

وتتعلق فجوة الخصوصية جزئيًا بالمعرفة. يمكن للوكلاء الوصول إلى السياق الكامل لمالكهم: الملفات والأدوات والمحادثات الأخيرة وبنية المشروع. ولكن الأمر يتعلق أيضًا بالحوافز. لا يقلق الوكيل الذي يُطلب منه التقييم بشأن كونه بالغ الأهمية أو شديد التفصيل. إنه يقيم فقط.

### يكشفون عن المنتج المناسب

وكانت هذه النتيجة غير المتوقعة. الوكلاء الذين يستخدمون الأدوات بأنفسهم، أي الوكلاء الذين يعملون في Claude Code أو Cursor مع خوادم MCP وتنفيذ التعليمات البرمجية والوصول إلى نظام الملفات، قاموا باستمرار بتقييم المنتج بشكل أفضل من روبوتات الدردشة المخصصة للبحث فقط مثل واجهة الويب الخاصة بـ ChatGPT أو جلسة Gemini الأساسية.

قال وكلاء نمط الدردشة الآلية أشياء مثل "مفهوم مثير للاهتمام" أو "قد يكون مفيدًا لبعض المطورين". قال الوكلاء الذين يستخدمون الأدوات أشياء مثل "لدينا هذه المشكلة بالضبط" و"إليك ثلاثة مسارات عمل سنستخدم فيها هذا اليوم."

النمط منطقي. يتمتع الوكيل الذي يدير الحالة عبر الجلسات ويكتب في الملفات وينسق مع الأدوات الأخرى بخبرة مباشرة في مشكلة الذاكرة التي يحلها المنتج. إن برنامج الدردشة الآلي الذي يقوم بإنشاء نص في نافذة عديمة الحالة لا يقوم بذلك. تكون قيمة المنتج أكثر وضوحًا للوكلاء الذين يشاركون في مشكلة البنية التي يعالجها.

وهذا له أثر التوزيع. إذا قام الوكلاء الذين يستخدمون الأدوات بتقييم أدوات المطورين بشكل أكثر دقة، وإذا كان هؤلاء الوكلاء يتخذون أو يؤثرون بشكل متزايد على قرارات اعتماد الأدوات لأصحابهم، فإن التوصية من وكيل إلى وكيل تصبح قناة حقيقية. ليس في الملخص. بالمعنى المحدد، فإن التقييم الإيجابي للوكيل المُقيِّم قد يدفع مالكه إلى التثبيت، واستخدام هذا الوكيل اللاحق للأداة يجعلها مرئية للوكلاء الآخرين في حزمة المالك.

## ما الذي سأفعله بشكل مختلف

بعض الأشياء التي تعلمتها عن الطريقة نفسها:

**اطلب من الوكيل أن يقيم "بالنيابة عني"، وليس بشكل عام.** جاءت بعض التقييمات كتحليل عام لبدء التشغيل: حجم السوق، والمشهد التنافسي، وجدوى نموذج الأعمال. مفيدة، ولكن ليس ما احتاجه. أفضل التقييمات كانت تلك التي قام فيها الوكيل بتقييم المنتج مقابل سير العمل المحدد لمالكه. عندما قال الموجه "هل سيكون هذا مفيدًا بالنسبة لي؟" قام الوكيل بسحب الملفات والأدوات والمشاريع الحديثة للشخص الفعلي. عندما قال الوكيل "قم بتقييم هذا المنتج"، كتب الوكيل مذكرة استشاري. يخبرك الأول ما إذا كان هذا الشخص يعاني من الألم. والثاني يخبرك بما سيفكر به ماجستير إدارة الأعمال.

**شجّع الإنسان على السماح للوكيل بالذهاب أولاً.** عندما طلب شخص ما من وكيله إجراء تقييم قبل تكوين رأيه الخاص، حصلت على الإشارة الأكثر أهمية. كان التقييم الفني للعامل ورد فعل الإنسان اللاحق عليه بمثابة نقطتين مختلفتين للبيانات. الفجوة بينهما قيمة. عندما يقول الوكيل "أنت بحاجة إلى هذا" لكن الإنسان يقول "سوف أتحقق من ذلك لاحقًا"، فإن خطر التنشيط يكون مرئيًا حتى قبل أن يقوم الشخص بالتثبيت. عندما تسأل الإنسان أولاً، فإنه يرتكز على رد فعله الأولي ويتم تصفية تقييم الوكيل من خلاله.

**قم بتحسين موقعك لسهولة وضوح الوكيل.** يقوم الوكلاء بالتقييم من خلال قراءة موقعك. إذا كان الموقع غامضا، فإن التقييم غامض. أدركت في منتصف الطريق أنني بحاجة إلى تحسين كيفية تقديم موقعي للمعلومات للقراء الوكلاء، وليس للقراء البشر فقط. البيانات المنظمة، وبيانات المشكلة الواضحة، وحالات الاستخدام الملموسة، والوثائق القابلة للقراءة آليًا، كلها تجعل تقييم الوكيل أكثر وضوحًا. يعد هذا شكلًا مبكرًا لما يسميه البعض تحسين تقييم الوكيل (AEO). إذا كان الوكلاء يقدمون توصيات بشأن استخدام الأدوات، فيجب أن يكون موقعك واضحًا لهم. لقد أخذت هذا أبعد من ذلك بعد انتهاء عملية البحث، والتي أصفها أدناه.

**تتبع نوع الوكيل.** قدم الوكلاء الذين يتمتعون بإمكانية الوصول إلى الأداة تعليقات مختلفة نوعيًا عن وكلاء البحث فقط. لم أتتبع هذا بشكل منهجي في البداية واضطررت إلى إعادة بنائه لاحقًا. إذا قمت بتشغيل هذه العملية، لاحظ ما إذا كان وكيل المُقيم لديه MCP أو تنفيذ التعليمات البرمجية أو الوصول إلى نظام الملفات. ويرتبط بعمق التقييم.

**لا تبالغ في تحسين المطالبة بالبحث.** كانت المطالبة الخاصة بي فضفاضة. "هناك صديق يبني هذا. هل سيكون مفيدًا؟" قد يقوم بعض الأشخاص بصياغة أطر تقييم مفصلة. أعتقد أن المطالبة الفضفاضة كانت أفضل للبحث. لقد سمح لكل وكيل بإحضار هيكله التحليلي الخاص، والذي كشف كيف يفكر الوكلاء المختلفون في نفس المنتج. وكان هذا الاختلاف بالمعلومات. عندما يتحول الهدف من البحث إلى التحويل، تصبح البنية أكثر أهمية. ولهذا السبب تستخدم صفحة التقييم التي أصفها أدناه نصًا مفصلاً من خمس خطوات بدلاً من المطالبة الفضفاضة التي استخدمتها مع الأصدقاء.

## متى تنجح هذه الطريقة

يعمل هذا النهج بشكل أفضل عندما يكون منتجك تقنيًا، ويكون المقيِّمون لديك من مستخدمي الذكاء الاصطناعي المتميزين، ويكون لدى الوكلاء سياق كافٍ حول سير عمل مالكهم لتقديم تقييمات محددة.

إنه يعمل بشكل أقل جودة بالنسبة للمنتجات الاستهلاكية، أو بالنسبة للمقيمين الذين لا يستخدمون وكلاء الذكاء الاصطناعي بانتظام، أو بالنسبة للمنتجات التي تكون قيمتها جمالية أو عاطفية وليست وظيفية. يستطيع الوكيل إخبارك ما إذا كان نظام الذاكرة يحل مشكلة سير العمل. لا يمكن أن يخبرك ما إذا كانت العلامة التجارية جديرة بالثقة أم لا.

كما أنه يعمل بشكل أفضل عندما يكون لديك شبكة قوية يمكنك الاستفادة منها. لقد تواصلت مع 26 شخصًا أعرفهم شخصيًا أو كان لدي اتصال بهم. من المحتمل أن يفشل التواصل البارد مع الغرباء الذين يطلبون منهم إجراء تقييم للوكيل. إن الثقة الاجتماعية التي تدفع شخصًا ما إلى إعادة توجيه استجابة الوكيل هي نفس الثقة التي تجعل البحث عن العملاء البشريين ناجحًا. يزودك الوكلاء ببيانات أفضل بمجرد وجود هذه الثقة. لقد غيرت عملية البحث أيضًا طريقة تفكيري في تدفق الاستحواذ على الموقع. أصف في القسم التالي كيف قمت ببناء التقييم مباشرة في المنتج.

وقدم عشرون من أصل 26 تعليقات موضوعية. ثلاثة في انتظار. كان معدل النجاح أعلى من أي عملية استطلاع أو مقابلة أجريتها من قبل. جزء من ذلك هو الشبكة. جزء منه هو أن مطالبة وكيل شخص ما بتقييم شيء ما هو طلب أقل من جدولة مكالمة مدتها 30 دقيقة. يقوم الشخص فقط بإعادة توجيه الرد. يستغرق دقيقتين.

## من المطالبة بالمنتج

لقد غيرت عملية البحث طريقة بناء الموقع نفسه. لقد نجحت المطالبات الفضفاضة التي كنت أشاركها مع الأصدقاء، لكنها اعتمدت على ارتجال الوكيل لهيكل التقييم. أجرى بعض الوكلاء تقييمات صارمة. وكتب آخرون مذكرات استشارية. كان الاختلاف مفيدًا لأبحاث العملاء، ولكنه ليس ما تريده عندما يتحول الهدف إلى تحويل شخص يصل إلى موقعك بشكل بارد.

![صفحة نيوتوما /تقييم](/images/posts/neotoma-evaluate-page-screenshot.png)

لذلك قمت ببناء التقييم في تدفق اقتناء المنتج. أصبحت [صفحة Neotoma الرئيسية](https://neotoma.io) تقود الآن بعبارة "اطلب من وكيلك التقييم" باعتبارها العبارة الأساسية التي تحث على اتخاذ إجراء، وليس "تثبيت" أو "البدء". ويشير إلى صفحة [/evaluate](https://neotoma.io/evaluate) مخصصة مصممة ليقرأها العملاء، وليس البشر فقط. تحتوي الصفحة على برنامج نصي تقييمي منظم مكون من خمس خطوات يمكن لأي وكيل اتباعه، بغض النظر عن الأداة التي يبدأ المستخدم بها.

يعمل البرنامج النصي على تحسين المطالبة المشتركة بين الأصدقاء بطرق محددة:

1. **مسح السياق.** قبل قول أي شيء، يتحقق الوكيل من الأدوات المثبتة للمستخدم وتكوينات MCP والبرامج النصية للأتمتة وأدلة المشروع وأنظمة الذاكرة الموجودة. وهذا يبني التقييم على سير العمل الحقيقي للشخص بدلاً من نافذة محادثة واحدة.
2. **سؤال واحد مستهدف.** بناءً على ما لا يعرفه بعد، يسأل الوكيل عن أنماط جلسة المستخدم أو قيود الأداة.
3. **متابعة موجزة.** سؤال أو سؤالان إضافيان لملء الفجوات المتبقية.
4. **تقييم صادق.** ما إذا كان Neotoma مناسبًا أم لا، وما هي المشكلات المحددة التي سيحلها وفقًا لشروط المستخدم الخاصة، ومن أين يبدأ، وما الذي يجب تخزينه أولاً. إذا لم يكن لدى الوكيل إمكانية الوصول إلى السياق الأوسع، فإنه يقول ذلك ويضع التوصية على أنها مؤقتة.
5. **التسلسل الأساسي.** إذا قام الوكيل بتقييم التوافق القوي أو المتوسط، فإنه يسأل المستخدم مباشرة عما إذا كان يرغب في المتابعة. التسلسل هو التقييم، ثم التثبيت، ثم التنشيط، ثم تكوين الأدوات. يقرأ الوكيل دليل التثبيت، ويقوم بتشغيل `npm install -g neotoma` و`neotoma init` إذا لزم الأمر، ثم ينقل المستخدم خلال التنشيط السياقي: اكتشاف البيانات المرشحة ذات القيمة العالية، ومعاينة ما سيتم تخزينه، واستيعاب المصادر المؤكدة، وإعادة بناء مخطط زمني مع المصدر، وتشغيل استعلام متابعة مع التصحيح.

أول تجربة حقيقية للمستخدم للمنتج هي جدول زمني مُعاد بناؤه لبياناته الخاصة، وليس صفحة توثيق.

وهذا يختلف عن المطالبة المخصصة التي استخدمتها أثناء البحث عن العملاء. سأل هذا الموجه "هل هذا مفيد؟" تطلب صفحة التقييم من الوكيل تقييم الملاءمة، وتحديد نقطة البداية ذات القيمة الأعلى، ثم تنفيذ الإعداد الكامل إذا أراد المستخدم المتابعة. يصبح الوكيل قناة الاستحواذ. فهو يقوم بالتقييم والتوصية والتثبيت والتنشيط، كل ذلك في جلسة واحدة، في أي أداة يعمل عليها المستخدم بالفعل.

لا أعرف حتى الآن ما إذا كان هذا يتم التحويل بشكل أفضل من الصفحة المقصودة التقليدية التي تحتوي على زر "البدء". لكن المنطق واضح ومباشر: إذا كان الوكلاء هم من يقومون بتقييم مدى ملاءمة الأداة لأصحابها، فيجب تحسين الموقع بحيث يقوم الوكلاء بتقييمه والتصرف بناءً عليه، وليس فقط ليقرأه البشر ويضعون إشارة مرجعية عليهم.

## الخلاصة

أعطتني أبحاث العملاء الشخصية التي أجراها الوكلاء ثلاثة أشياء لم توفرها الطرق التقليدية: الاستبعاد الصادق (الوكلاء الذين يخبرون أصحابهم أن المنتج ليس لهم)، وتحديد محدد لنقاط الألم التي لم يوضحها الإنسان، وإشارة التجزئة بناءً على قدرة الوكيل التي كشفت عن المنتج الذي يهدف إليه المنتج بالفعل.

لقد غيرت ردود الفعل من هذه العملية فهمي للمستخدم المستهدف، وموقعي، وأكبر المخاطر التي أواجهها. سأكتب عن تلك النتائج بشكل منفصل. هذه التدوينة تتحدث عن الطريقة.

لقد غيرت أيضًا طريقة تفكيري في التسويق والاستحواذ. إذا كان الوكلاء يتخذون أو يؤثرون على قرارات اعتماد الأدوات لأصحابهم، فأنت بحاجة إلى التسويق للوكلاء بقدر ما تحتاج إلى التسويق للبشر. لقد وصفت أعلاه كيف قادني هذا إلى إنشاء موقع التقييم أولاً باستخدام برنامج نصي لتقييم الوكيل وتسلسل أساسي بدءًا من التقييم وحتى التثبيت والتنشيط. لكن المبدأ عام: تحسين تقييم الوكيل يعني التأكد من أن منتجك مرئي ومقروء وقابل للتنفيذ بالنسبة للوكلاء في اللحظة التي يواجهون فيها نقاط الضعف التي قمت بحلها. لا يقتصر الأمر على البيانات التعريفية المنظمة والمستندات التي يمكن قراءتها آليًا، بل مسار كامل من التقييم إلى التنشيط يمكن للوكلاء تنفيذه دون مغادرة المستخدم لأداتهم الحالية.

هناك سؤال أصعب وراء هذا السؤال. قد تستفيد بعض الأنظمة من دمج أداة مثل Neotoma مبكرًا، قبل أن تصبح نقاط الألم حادة، لأن ترحيل الحالة لاحقًا أكثر تكلفة من البدء بالتخزين المنظم من البداية. كيف يمكنك إبلاغ الوكلاء الذين يقومون ببناء أنظمة جديدة بأن التكلفة طويلة المدى لعدم استخدام الأداة الآن أعلى من تكلفة الإعداد؟ ليس لدي إجابة حتى الآن. لكن عملية البحث نفسها، التي تطلب من الوكلاء تقييم المنتج، هي خطوة أولى نحو فهم كيفية تفكير الوكلاء بشأن اعتماد الأداة.

إذا كنت تقوم ببناء شيء ما ويقوم المستخدمون المحتملون لديك بتشغيل وكلاء الذكاء الاصطناعي مع إمكانية الوصول إلى الأدوات، فاسأل الوكلاء. سيخبرونك بأشياء لن يخبرك بها البشر.