আমি একজন বন্ধুকে একটি কলের শেষ প্রান্তে আমার পণ্যের একটি লিঙ্ক পাঠিয়েছিলাম এবং তাকে তার এজেন্টকে বলতে বলেছিলাম যে এটি সহায়ক হবে কিনা।

তিনি কীভাবে এটি ব্যবহার করতে পারেন তা নিয়ে তার মাথা ঘামাচ্ছিলেন। তার এআই এজেন্ট সাইটটি পড়েছেন, তার কর্মপ্রবাহ বিশ্লেষণ করেছেন এবং নির্দিষ্ট ব্যবহারের ক্ষেত্রে, প্রতিযোগিতামূলক তুলনা এবং সৎ উদ্বেগের সাথে একটি দুই-পৃষ্ঠা মূল্যায়ন তৈরি করেছেন। এটি একটি স্পষ্ট পরিস্থিতি চিহ্নিত করেছে যেখানে তার B2B এজেন্টিক ব্যবসার জন্য পণ্যটির প্রয়োজন হবে।

কয়েক সপ্তাহের কলে আমি যা পেয়েছি তার চেয়ে এটি ভাল ছিল। এটি একটি ফলো-আপ টেক্সট কথোপকথনকেও উত্সাহিত করেছিল যা কলটির চেয়ে গভীরে গিয়েছিল।

এক ঘন্টার মধ্যে আমি আরও এক ডজন লোকের সাথে যোগাযোগ করলাম। তিন সপ্তাহের বেশি, মোট 26 জন: প্রতিষ্ঠাতা, প্রকৌশলী, AI পাওয়ার ব্যবহারকারী, যারা তাদের নিজস্ব এজেন্ট স্ট্যাক চালাচ্ছেন। প্রায় 18 জন একই এজেন্টিক মূল্যায়ন প্রম্পট পেয়েছেন। বাকিরা কোনো এজেন্টকে জড়িত না করেই কল বা মেসেজের মাধ্যমে মতামত দিয়েছেন।

পণ্যটি হল [নিওটোমা](https://neotoma.io), এআই এজেন্টদের জন্য একটি কাঠামোগত মেমরি সিস্টেম। আমি আমার নিজের ব্যথা সমাধানের জন্য প্রতিদিন এটি ব্যবহার করি: একটি [মাল্টি-এজেন্ট স্ট্যাক](/posts/what-my-agentic-stack-actually-does) জুড়ে পরিচিতি, আর্থিক, কাজ, বিষয়বস্তু এবং কথোপকথন পরিচালনা করা। আমি সম্প্রতি [সাইটটি ওভারহল করেছি](/posts/neotoma-site-overhaul-developer-feedback) এটিকে আরও সুস্পষ্ট করতে। আমার জানার দরকার ছিল অন্য কারো প্রয়োজন আছে কি না, তা বুঝতে দিন।

এর আগে, আমি একটি [সাক্ষাৎকার অ্যাপ](https://github.com/markmhendrickson/interviews) তৈরি করতে এক সপ্তাহ কাটিয়েছি, যাতে পরিচিতিগুলির ব্যবস্থা করা, আমন্ত্রণ পাঠানো এবং ফলাফল সিঙ্ক করার জন্য নিওটোমা-সংযুক্ত স্ক্রিপ্ট সহ কাঠামোগত মূল্যায়ন স্বয়ংক্রিয়ভাবে করা যায়। আমি এটা শেষ ছিল না. কিন্তু এজেন্ট-প্রম্পট পদ্ধতিটি যাইহোক এটিকে মূলত অপ্রাসঙ্গিক করে তুলেছে। কোনও UI নেই, কোনও সময়সূচী নেই, কোনও কাঠামোগত ইন্টারভিউ নেই৷ শুধু একটি লিঙ্ক এবং একটি প্রশ্ন.

## সেটআপ

মূল্যায়ন প্রম্পট সহজ ছিল. আমি এমন কিছু শেয়ার করব: "একজন বন্ধু এটি তৈরি করছে। আপনি কি আমাকে বলতে পারেন এটি সহায়ক হবে কি না?" তারপর পণ্যের ওয়েবসাইটের লিঙ্ক। ব্যক্তির এজেন্ট সাইটটি পড়বে, ব্যক্তির কর্মপ্রবাহ বিবেচনা করবে এবং আবার রিপোর্ট করবে।

একটি থ্রেড সেই আকৃতির শব্দের জন্য শব্দ ব্যবহার করেছে—নীচের লাইনটি আমার সংরক্ষিত আউটবাউন্ড মেসেজ মেটাডেটা থেকে মৌখিকভাবে অনুলিপি করা হয়েছে:

> একজন বন্ধু এটি তৈরি করছে এবং এটি সহায়ক হবে কি না তা জানতে চায়: https://neotoma.io

একই প্রম্পট, ভিন্ন ব্যক্তি। তাদের এজেন্ট পণ্যটিকে সরাসরি ব্যক্তির নিজস্ব স্ট্যাকের ব্যথার পয়েন্টে ম্যাপ করেছে:

> এই সত্যিকারের দরকারী দেখায়. কেন এটি আপনার ব্যবহারের ক্ষেত্রে গুরুত্বপূর্ণ:
>
> হার্টবিট চেক: JSON ফাইলগুলিতে "শেষ চেক করা ইমেল" বা "শেষ ক্যালেন্ডার স্ক্যান" ট্র্যাক করা কাজ করে, তবে এটি ভঙ্গুর। নিওটোমা সঠিকভাবে সংস্করণ করবে। মাল্টি-এজেন্ট অর্কেস্ট্রেশন: যখন আপনি সাবএজেন্ট তৈরি করেন যেগুলিকে সমন্বয় করতে হবে, তারা বর্তমানে নির্ভরযোগ্যভাবে রাষ্ট্র ভাগ করতে পারে না।
>
> এটা কি সহায়ক? হ্যাঁ — যদি আপনার বন্ধু সময়ের সাথে সাথে প্রকৃত কাজ করে প্রোডাকশন এজেন্টদের বিষয়ে গুরুতর হয়। আপনার ভৌতিক লেখার পাইপলাইন এবং ক্রস-সেশন সমন্বয়ের জন্য, এটি একটি সত্যিকারের ব্যথা বিন্দুকে সরিয়ে দিতে পারে।

বেশিরভাগই টেক্সট বার্তা বা ইমেলের মাধ্যমে 24 ঘন্টার মধ্যে এজেন্টের সম্পূর্ণ প্রতিক্রিয়া ফরোয়ার্ড করেছে, অনেকগুলি এক বা দুই ঘন্টার মধ্যে। কেউ কেউ এটিকে কলের মাধ্যমে সংক্ষিপ্ত করেছেন। কয়েকজন এজেন্টকে জড়িত না করে শুধুমাত্র মানুষের জন্য মতামত দিয়েছেন।

আমি Neotoma নিজেই সবকিছু ট্র্যাক. নিওটোমা সংস্করণযুক্ত পর্যবেক্ষণ সহ কাঠামোগত সত্তা (পরিচিতি, কাজ, প্রতিক্রিয়া রেকর্ড, কথোপকথন) সঞ্চয় করে, তাই আমি দেখতে পারি যে প্রতিটি মূল্যায়ন সময়ের সাথে কীভাবে বিবর্তিত হয় এবং যে ব্যক্তি এটি দিয়েছে তার সাথে এটি সংযুক্ত করে। প্রতিটি মূল্যায়ন আমার ব্যবহৃত প্রম্পট, যে এজেন্ট প্রতিক্রিয়া জানায়, প্রতিক্রিয়ার সম্পূর্ণ পাঠ্য, যেকোনো মানবিক ফলো-আপ, চ্যানেল এবং আমার সংকেত শক্তির মূল্যায়ন সহ একটি প্রতিক্রিয়া সত্তা হয়ে ওঠে। শেষ পর্যন্ত আমার কাছে 45 টিরও বেশি প্রতিক্রিয়া রেকর্ড রয়েছে যা যোগাযোগের সত্তা, কথোপকথনের ইতিহাস এবং বিশ্লেষণ নোটগুলির সাথে সংযুক্ত ছিল।

## এজেন্টরা ভিন্নভাবে কি করে

তিনটি জিনিস প্রথাগত গ্রাহক গবেষণা কথোপকথনের চেয়ে এজেন্ট-মধ্যস্থ প্রতিক্রিয়াকে আরও ভাল করে তুলেছে।

### তারা সৎ

একজন এজেন্ট একজন মূল্যায়নকারীকে বলেছিলেন: "এটি আপনার জন্য নয়। সেশনগুলির মধ্যে আপনার যে ধারাবাহিকতা প্রয়োজন তা প্রসঙ্গ এবং ভয়েস সম্পর্কে, নির্ধারক রাষ্ট্রীয় সংস্করণ নয়।" মূল্যায়নকারী পুশব্যাক ছাড়াই সম্পূর্ণ প্রতিক্রিয়া ফরোয়ার্ড করেছেন। একই কথোপকথনে একজন মানুষ হয়তো ভদ্র কিছু বলেছে এবং এগিয়ে গেছে।

অন্য এজেন্ট পণ্যটিকে অনুকূলভাবে মূল্যায়ন করেছেন কিন্তু ইনস্টল প্রক্রিয়ায় নির্ভরতা নিরাপত্তা ঝুঁকি চিহ্নিত করেছেন। এটি তাদের সমাধান না করা পর্যন্ত এটির মালিককে ইনস্টল না করার পরামর্শ দিয়েছে৷ আমি তখন থেকে এগুলি প্যাচ করেছি (এগুলি নির্ভরতা পরিচালনার কঠোর হওয়ার কারণে ছিল), তবে প্রতিক্রিয়াটি সৎ, নির্দিষ্ট এবং "ঠান্ডা দেখাচ্ছে, আমি পরে এটি পরীক্ষা করব" এর চেয়ে বেশি কার্যকর ছিল।

অন্য একজন এজেন্ট পণ্যটিকে সামগ্রিকভাবে অনুকূলভাবে মূল্যায়ন করেছেন কিন্তু উপসংহারে এসেছেন: "এজেন্ট রাষ্ট্র পরিচালনার বাজার এই মুহূর্তে ছোট এবং বেশিরভাগ মানুষ বিল্ডিং এজেন্ট এখনও ব্যথার বিন্দুতে পৌঁছায়নি। তারা নীরব ওভাররাইট বা হারানো প্রসঙ্গ দ্বারা পুড়ে যাওয়ার পরে এটির জন্য পৌঁছাবে, আগে নয়।" যে উত্সাহ আবৃত একটি প্রশংসা না. এটি সামাজিক ফিল্টারিং ছাড়াই প্রদান করা একটি ঝুঁকি মূল্যায়ন।

একজন মানুষ সেই প্রত্যক্ষতার সাথে মিলেছে। তিনি আমাকে বলেছিলেন যে পজিশনিংটি এমনভাবে অনুভূত হয়েছিল যে "সমস্যাগুলি খুঁজে বের করার চেষ্টা করা আপনার সমাধানগুলি সমাধান করে, বরং যে সমস্যার সমাধান করা দরকার।" তিনি ব্যতিক্রম। বেশীরভাগ মানুষই আপনার মুখে তা বলবে না। এজেন্ট করবে।

### তারা নির্দিষ্ট

একজন এজেন্ট তার মালিকের কর্মপ্রবাহে তিনটি কংক্রিট ব্যথার পয়েন্ট চিহ্নিত করেছে যা মালিক কখনই নৈমিত্তিক কথোপকথনে প্রকাশ করেনি: একটি শেয়ার্ড সত্ত্বাকে একযোগে লেখেন, একটি মার্কডাউন-ভিত্তিক যোগাযোগ ব্যবস্থায় সীমা সীমা, এবং উত্স ট্রেসিং ("এই ইমেলটি খসড়া করার মুহুর্তে আমার এজেন্ট এই ব্যক্তির সম্পর্কে কী জানতেন?")৷

একটি কলে মানুষের প্রতিক্রিয়া "আকর্ষণীয় পরীক্ষা" ছিল। এজেন্টের প্রতিক্রিয়া ছিল "এখানে ঠিক যেখানে এটি আমাদের জন্য বিরতি, এবং এখানে তিনটি ক্ষমতা আমাদের প্রয়োজন।"

অন্য এজেন্ট পাঁচটি বিকল্পের সাথে পণ্যের তুলনা করে একটি সম্পূর্ণ প্রতিযোগিতামূলক বিশ্লেষণ তৈরি করেছে, তারপর প্রতিটিকে তার মালিকের সেটআপে নির্দিষ্ট ওয়ার্কফ্লো ফাঁকে ম্যাপ করেছে। এটি প্রায় 30 সেকেন্ড সময় নিয়েছে। একজন মানুষের একই তুলনা তৈরি করতে এক সপ্তাহের গবেষণার প্রয়োজন হবে এবং বন্ধুর পাশের প্রকল্পের জন্য বিরক্ত হবে না।

নির্দিষ্টতার ফাঁক আংশিকভাবে জ্ঞান সম্পর্কে। এজেন্টদের তাদের মালিকের সম্পূর্ণ প্রসঙ্গে অ্যাক্সেস রয়েছে: ফাইল, টুল, সাম্প্রতিক কথোপকথন, প্রকল্পের কাঠামো। কিন্তু এটা প্রণোদনা সম্পর্কেও। মূল্যায়ন করতে বলা একজন এজেন্ট খুব সমালোচনা বা খুব বিস্তারিত হওয়ার বিষয়ে চিন্তা করবেন না। এটা শুধু মূল্যায়ন.

### তারা প্রকাশ করে যে পণ্যটি কার জন্য

এটি ছিল অপ্রত্যাশিত আবিষ্কার। যে এজেন্টরা নিজেরাই টুল ব্যবহার করে, মানে এমসিপি সার্ভার, কোড এক্সিকিউশন, এবং ফাইল সিস্টেম অ্যাক্সেস সহ ক্লাউড কোড বা কার্সরে চলমান এজেন্ট, ChatGPT-এর ওয়েব ইন্টারফেস বা একটি মৌলিক জেমিনি সেশনের মতো শুধুমাত্র অনুসন্ধান-চ্যাটবটগুলির চেয়ে ক্রমাগতভাবে পণ্যটিকে আরও অনুকূলভাবে মূল্যায়ন করে।

চ্যাটবট-স্টাইল এজেন্টরা "আকর্ষণীয় ধারণা" বা "কিছু বিকাশকারীদের জন্য দরকারী হতে পারে" এর মতো জিনিসগুলি বলেছিল। টুল-ব্যবহারকারী এজেন্টরা "আমাদের এই সঠিক সমস্যাটি আছে" এবং "এখানে তিনটি ওয়ার্কফ্লো রয়েছে যেখানে আমরা আজ এটি ব্যবহার করব।"

প্যাটার্ন অর্থে তোলে. একটি এজেন্ট যেটি সেশন জুড়ে রাজ্য পরিচালনা করে, ফাইলগুলিতে লেখে এবং অন্যান্য সরঞ্জামগুলির সাথে সমন্বয় করে, পণ্যটি সমাধান করে এমন মেমরি সমস্যার সাথে সরাসরি অভিজ্ঞতা রয়েছে৷ একটি চ্যাটবট যা একটি রাষ্ট্রহীন উইন্ডোতে পাঠ্য তৈরি করে তা করে না। পণ্যটির মান সেই এজেন্টদের কাছে সবচেয়ে বেশি সুস্পষ্ট যেগুলি এটি সমাধান করে আর্কিটেকচার সমস্যা ভাগ করে।

এটি একটি বন্টন অন্তর্নিহিত আছে. যদি টুল-ব্যবহারকারী এজেন্টরা ডেভেলপার টুলকে আরও সঠিকভাবে মূল্যায়ন করে, এবং যদি সেই এজেন্টরা তাদের মালিকদের জন্য টুল-দত্তক নেওয়ার সিদ্ধান্ত ক্রমবর্ধমানভাবে গ্রহণ করে বা প্রভাবিত করে, তাহলে এজেন্ট-টু-এজেন্ট সুপারিশ একটি বাস্তব চ্যানেল হয়ে ওঠে। বিমূর্ত নয়। নির্দিষ্ট অর্থে যে মূল্যায়নকারী এজেন্টের ইতিবাচক মূল্যায়ন তার মালিককে ইনস্টল করতে পরিচালিত করতে পারে, এবং সেই এজেন্টের পরবর্তীতে টুলটির ব্যবহার এটি মালিকের স্ট্যাকের অন্যান্য এজেন্টদের কাছে দৃশ্যমান করে তোলে।

## আমি কি অন্যভাবে করতে চাই

কিছু জিনিস আমি নিজেই পদ্ধতি সম্পর্কে শিখেছি:

**এজেন্টকে "আমার জন্য" মূল্যায়ন করতে বলুন, সাধারণভাবে নয়।** কিছু মূল্যায়ন জেনেরিক স্টার্টআপ বিশ্লেষণ হিসাবে ফিরে এসেছে: বাজারের আকার, প্রতিযোগিতামূলক ল্যান্ডস্কেপ, ব্যবসায়িক মডেলের কার্যকারিতা। দরকারী, কিন্তু আমার যা প্রয়োজন তা নয়। সর্বোত্তম মূল্যায়ন হল সেইগুলি যেখানে এজেন্ট তার মালিকের নির্দিষ্ট কর্মপ্রবাহের বিপরীতে পণ্যটির মূল্যায়ন করেছিল। যখন প্রম্পট বলেছিল "এটি কি আমার জন্য সহায়ক হবে?" এজেন্ট ব্যক্তির প্রকৃত ফাইল, সরঞ্জাম এবং সাম্প্রতিক প্রকল্পগুলি থেকে টানা। যখন প্রম্পট বলেছিল "এই পণ্যটির মূল্যায়ন করুন," এজেন্ট একটি পরামর্শদাতার মেমো লিখেছিলেন। প্রথমটি আপনাকে বলে যে এই ব্যক্তির ব্যথা আছে কিনা। দ্বিতীয়টি আপনাকে বলে যে একজন এমবিএ কী ভাববে।

**মানুষকে এজেন্টকে প্রথমে যেতে দিতে উত্সাহিত করুন।** যখন কেউ তাদের এজেন্টকে তাদের নিজস্ব মতামত গঠনের আগে মূল্যায়ন করতে বলে, আমি সবচেয়ে ধনী সংকেত পেয়েছি। এজেন্টের প্রযুক্তিগত মূল্যায়ন এবং এটিতে মানুষের পরবর্তী প্রতিক্রিয়া দুটি স্বতন্ত্র ডেটা পয়েন্ট ছিল। তাদের মধ্যে ব্যবধান মূল্যবান. যখন একজন এজেন্ট বলে "আপনার এটি দরকার" কিন্তু মানুষ বলে "আমি পরে এটি পরীক্ষা করে দেখব", এমনকি ব্যক্তিটি ইনস্টল করার আগেই সক্রিয়করণের ঝুঁকি দৃশ্যমান হয়। আপনি যখন প্রথমে মানুষকে জিজ্ঞাসা করেন, তারা তাদের প্রাথমিক প্রতিক্রিয়ার উপর নোঙর করে এবং এজেন্টের মূল্যায়ন এটির মাধ্যমে ফিল্টার হয়ে যায়।

**এজেন্ট সুস্পষ্টতার জন্য আপনার সাইট উন্নত করুন।** এজেন্টরা আপনার সাইট পড়ে মূল্যায়ন করে। সাইটটি অস্পষ্ট হলে, মূল্যায়ন অস্পষ্ট। আমি মাঝপথে বুঝতে পেরেছিলাম যে আমার সাইটটি কীভাবে এজেন্ট পাঠকদের জন্য তথ্য উপস্থাপন করে তা উন্নত করতে হবে, শুধু মানুষের জন্য নয়। স্ট্রাকচার্ড ডেটা, স্পষ্ট সমস্যা বিবৃতি, কংক্রিট ব্যবহারের ক্ষেত্রে এবং মেশিন-পাঠযোগ্য ডকুমেন্টেশন সবই এজেন্টের মূল্যায়নকে আরও তীক্ষ্ণ করে তোলে। এটি একটি প্রাথমিক রূপ যা কিছু লোক এজেন্ট মূল্যায়ন অপ্টিমাইজেশান (AEO) বলে। যদি এজেন্টরা টুল-অধিগ্রহণের সুপারিশ করে থাকে, তাহলে আপনার সাইট তাদের কাছে সুস্পষ্ট হতে হবে। গবেষণা প্রক্রিয়া শেষ হওয়ার পরে আমি এটিকে আরও নিয়েছি, যা আমি নীচে বর্ণনা করছি।

**এজেন্টের ধরন ট্র্যাক করুন।** টুল অ্যাক্সেস সহ এজেন্টরা শুধুমাত্র-সার্চ এজেন্টের চেয়ে গুণগতভাবে ভিন্ন প্রতিক্রিয়া দিয়েছে। আমি প্রথমে এটি পদ্ধতিগতভাবে ট্র্যাক করিনি এবং পরে এটি পুনর্গঠন করতে হয়েছিল। আপনি যদি এই প্রক্রিয়াটি চালান, তাহলে মূল্যায়নকারীর এজেন্টের MCP, কোড এক্সিকিউশন বা ফাইল সিস্টেম অ্যাক্সেস আছে কিনা তা লক্ষ্য করুন। এটি মূল্যায়ন গভীরতার সাথে সম্পর্কযুক্ত।

**গবেষণার জন্য প্রম্পটটিকে অতিরিক্ত অপ্টিমাইজ করবেন না।** আমার প্রম্পটটি আলগা ছিল। "একজন বন্ধু এটি তৈরি করছে। এটি কি সহায়ক হবে?" কিছু লোক বিস্তৃত মূল্যায়ন কাঠামো তৈরি করতে পারে। আমি মনে করি আলগা প্রম্পট গবেষণার জন্য ভাল ছিল। এটি প্রতিটি এজেন্টকে তার নিজস্ব বিশ্লেষণাত্মক কাঠামো আনতে দেয়, যা প্রকাশ করে যে কীভাবে বিভিন্ন এজেন্ট একই পণ্য সম্পর্কে চিন্তা করে। যে বৈচিত্র ছিল তথ্যপূর্ণ. যখন লক্ষ্যটি গবেষণা থেকে রূপান্তরে স্থানান্তরিত হয়, তখন গঠন আরও গুরুত্বপূর্ণ। এই কারণেই আমি নীচের যে মূল্যায়ন পৃষ্ঠাটি বর্ণনা করেছি তা আমি বন্ধুদের সাথে ব্যবহার করা আলগা প্রম্পটের পরিবর্তে একটি বিশদ পাঁচ-পদক্ষেপের স্ক্রিপ্ট ব্যবহার করে।

## যখন এই পদ্ধতি কাজ করে

এই পদ্ধতিটি সবচেয়ে ভাল কাজ করে যখন আপনার পণ্য প্রযুক্তিগত হয়, আপনার মূল্যায়নকারীরা AI পাওয়ার ব্যবহারকারী এবং এজেন্টদের নির্দিষ্ট মূল্যায়ন দেওয়ার জন্য তাদের মালিকের কর্মপ্রবাহ সম্পর্কে যথেষ্ট প্রসঙ্গ থাকে।

এটি ভোক্তা পণ্যগুলির জন্য, মূল্যায়নকারীদের জন্য যারা নিয়মিত AI এজেন্ট ব্যবহার করেন না, বা যে পণ্যগুলির মূল্য কার্যকরী না হয়ে নান্দনিক বা আবেগপূর্ণ তাদের জন্য কম ভাল কাজ করে৷ একটি এজেন্ট আপনাকে বলতে পারে যে একটি মেমরি সিস্টেম একটি ওয়ার্কফ্লো সমস্যা সমাধান করে কিনা। এটি আপনাকে বলতে পারে না যে একটি ব্র্যান্ড বিশ্বস্ত মনে করে কিনা।

আপনার কাছে একটি শক্তিশালী নেটওয়ার্ক থাকলে এটিও ভাল কাজ করে। আমি 26 জনের সাথে যোগাযোগ করেছি যা আমি ব্যক্তিগতভাবে চিনি বা যাদের সাথে আমার সংযোগ ছিল। অপরিচিতদের কাছে ঠান্ডা আউটরিচ তাদের এজেন্ট মূল্যায়ন চালানোর জন্য জিজ্ঞাসা করা সম্ভবত ব্যর্থ হবে। সামাজিক বিশ্বাস যে কাউকে একজন এজেন্টের প্রতিক্রিয়া ফরোয়ার্ড করার জন্য পায় সেই একই বিশ্বাস যা মানুষের গ্রাহকদের গবেষণার কাজ করে। আস্থা বিদ্যমান থাকলে এজেন্টরা আপনাকে আরও ভাল ডেটা দেয়। সাইটটির অধিগ্রহণ প্রবাহ সম্পর্কে আমি কীভাবে চিন্তা করি তা গবেষণা প্রক্রিয়াটিও পরিবর্তিত হয়েছে। আমি পরবর্তী বিভাগে বর্ণনা করব কিভাবে আমি সরাসরি পণ্যের মধ্যে মূল্যায়ন তৈরি করেছি।

26 জনের মধ্যে 20 জন সারগর্ভ প্রতিক্রিয়া দিয়েছেন। তিনটি বিচারাধীন। হিট রেট আমার আগে চালানো যেকোনো জরিপ বা ইন্টারভিউ প্রক্রিয়ার চেয়ে বেশি ছিল। এর একটি অংশ হল নেটওয়ার্ক। এর একটি অংশ হল যে কারো এজেন্টকে কিছু মূল্যায়ন করতে বলা 30-মিনিটের কলের সময় নির্ধারণের চেয়ে কম জিজ্ঞাসা। ব্যক্তি শুধু প্রতিক্রিয়া ফরোয়ার্ড. দুই মিনিট সময় লাগে।

## প্রম্পট থেকে পণ্য পর্যন্ত

গবেষণা প্রক্রিয়া পরিবর্তন হয়েছে কিভাবে আমি নিজেই সাইট তৈরি. আমি বন্ধুদের সাথে যে আলগা প্রম্পটটি ভাগ করেছিলাম তা কাজ করেছিল, তবে এটি এজেন্টের উপর নির্ভর করে একটি মূল্যায়ন কাঠামোর উন্নতির উপর। কিছু এজেন্ট কঠোর মূল্যায়ন দৌড়ে. অন্যরা পরামর্শক মেমো লিখেছেন। গ্রাহক গবেষণার জন্য এই বৈচিত্রটি তথ্যপূর্ণ ছিল, কিন্তু আপনার সাইটে ঠান্ডা আগমনকারী কাউকে রূপান্তরিত করার লক্ষ্য পরিবর্তন হলে আপনি যা চান তা নয়।

![নিওটোমা /মূল্যায়ন পৃষ্ঠা](/images/posts/neotoma-evaluate-page-screenshot.png)

তাই আমি পণ্যের অধিগ্রহণ প্রবাহে মূল্যায়ন তৈরি করেছি। [নিওটোমা হোমপেজ](https://neotoma.io) এখন "ইন্সটল করুন" বা "শুরু করুন" নয়, প্রাথমিক কল টু অ্যাকশন হিসেবে "আপনার এজেন্টকে মূল্যায়ন করতে বলুন" নিয়ে যায়। এটি একটি ডেডিকেটেড [/evaluate](https://neotoma.io/evaluate) পৃষ্ঠা নির্দেশ করে যা এজেন্টদের পড়ার জন্য ডিজাইন করা হয়েছে, শুধু মানুষ নয়। পৃষ্ঠাটিতে একটি কাঠামোগত পাঁচ-পদক্ষেপ মূল্যায়ন স্ক্রিপ্ট রয়েছে যা ব্যবহারকারী যে টুলে শুরু করুক না কেন যে কোনো এজেন্ট অনুসরণ করতে পারে।

স্ক্রিপ্টটি নির্দিষ্ট উপায়ে বন্ধু-ভাগ করা প্রম্পটে উন্নতি করে:

1. **প্রসঙ্গ সুইপ।** কিছু বলার আগে, এজেন্ট ব্যবহারকারীর ইনস্টল করা টুল, MCP কনফিগারেশন, অটোমেশন স্ক্রিপ্ট, প্রজেক্ট ডিরেক্টরি এবং বিদ্যমান মেমরি সিস্টেম চেক করে। এটি একটি একক চ্যাট উইন্ডোর পরিবর্তে ব্যক্তির প্রকৃত কর্মপ্রবাহের মূল্যায়নকে ভিত্তি করে।
2. **একটি লক্ষ্যযুক্ত প্রশ্ন।** এটি এখনও যা জানে না তার উপর ভিত্তি করে, এজেন্ট ব্যবহারকারীর সেশন প্যাটার্ন বা টুল সীমাবদ্ধতা সম্পর্কে জিজ্ঞাসা করে।
3. **সংক্ষিপ্ত ফলো-আপ। ** অবশিষ্ট শূন্যস্থান পূরণ করতে আরও এক বা দুটি প্রশ্ন।
4. **সৎ মূল্যায়ন।** নিওটোমা ফিট করে কিনা, ব্যবহারকারীর নিজস্ব শর্তে এটি কোন নির্দিষ্ট সমস্যার সমাধান করবে, কোথা থেকে শুরু করতে হবে এবং প্রথমে কী সংরক্ষণ করতে হবে। যদি এজেন্টের বৃহত্তর প্রেক্ষাপটে অ্যাক্সেস না থাকে, তবে এটি তাই বলে এবং সুপারিশটিকে অস্থায়ী হিসাবে ফ্রেম করে।
5. **ক্যাননিকাল সিকোয়েন্স।** যদি এজেন্ট একটি শক্তিশালী বা মাঝারি ফিট মূল্যায়ন করে, তাহলে এটি ব্যবহারকারীকে সরাসরি জিজ্ঞাসা করে যে তারা এগিয়ে যেতে চান কিনা। ক্রম হল মূল্যায়ন, তারপর ইনস্টলেশন, তারপর সক্রিয়করণ, তারপর টুলিং কনফিগারেশন। এজেন্ট ইনস্টল গাইড পড়ে, প্রয়োজন হলে `npm install -g neotoma` এবং `neotoma init` চালায়, তারপর ব্যবহারকারীকে প্রাসঙ্গিক অ্যাক্টিভেশনের মাধ্যমে বহন করে: উচ্চ-মূল্যের ডেটা প্রার্থীদের আবিষ্কার করা, কী সঞ্চয় করতে হবে তার পূর্বরূপ দেখা, নিশ্চিত উৎসগুলি গ্রহণ করা, মূলসূত্রের সাথে একটি টাইমলাইন পুনর্গঠন করা, এবং সংশোধন সহ একটি ফলো-আপ কোয়েরি চালানো।

পণ্যের ব্যবহারকারীর প্রথম বাস্তব অভিজ্ঞতা হল তাদের নিজস্ব ডেটার একটি পুনর্গঠিত সময়রেখা, একটি ডকুমেন্টেশন পৃষ্ঠা নয়।

গ্রাহক গবেষণার সময় আমি যে অ্যাড-হক প্রম্পট ব্যবহার করেছি তার থেকে এটি আলাদা। সেই প্রম্পটটি জিজ্ঞাসা করেছিল "এটি কি দরকারী?" মূল্যায়ন পৃষ্ঠাটি এজেন্টকে উপযুক্ত মূল্যায়ন করতে, সর্বোচ্চ-মূল্যের প্রারম্ভিক বিন্দু চিহ্নিত করতে এবং তারপর ব্যবহারকারী যদি এগিয়ে যেতে চায় তাহলে সম্পূর্ণ অনবোর্ডিং কার্যকর করতে বলে। এজেন্ট অধিগ্রহণ চ্যানেল হয়ে ওঠে। এটি মূল্যায়ন করে, সুপারিশ করে, ইনস্টল করে এবং সক্রিয় করে, এক সেশনে, ব্যবহারকারী ইতিমধ্যেই যে কোনও সরঞ্জামে কাজ করছে৷

আমি এখনও জানি না এটি একটি "শুরু করুন" বোতাম সহ একটি ঐতিহ্যবাহী ল্যান্ডিং পৃষ্ঠার চেয়ে ভাল রূপান্তর করে কিনা৷ কিন্তু যুক্তিটি সোজা: যদি এজেন্টরা তাদের মালিকদের জন্য টুল প্রাসঙ্গিকতা মূল্যায়ন করে, তাহলে সাইটটিকে এজেন্টদের মূল্যায়ন ও কাজ করার জন্য অপ্টিমাইজ করা উচিত, শুধুমাত্র মানুষের পড়ার এবং বুকমার্ক করার জন্য নয়।

## নিচের লাইন

এজেন্ট-মধ্যস্থিত ব্যক্তিগতকৃত গ্রাহক গবেষণা আমাকে তিনটি জিনিস দিয়েছে যা ঐতিহ্যগত পদ্ধতিগুলি করেনি: সৎ অযোগ্যতা (এজেন্টরা তাদের মালিকদের বলে যে পণ্যটি তাদের জন্য নয়), ব্যথার পয়েন্টগুলির নির্দিষ্ট শনাক্তকরণ যা মানুষ প্রকাশ করেনি এবং এজেন্টের ক্ষমতার উপর ভিত্তি করে একটি বিভাজন সংকেত যা প্রকাশ করে যে পণ্যটি আসলে কার জন্য।

এই প্রক্রিয়ার প্রতিক্রিয়া আমার লক্ষ্য ব্যবহারকারী, আমার অবস্থান এবং আমার সবচেয়ে বড় ঝুঁকি সম্পর্কে আমার বোঝার পরিবর্তন করেছে। আমি আলাদাভাবে এই অনুসন্ধানগুলি সম্পর্কে লিখব। এই পোস্ট পদ্ধতি সম্পর্কে.

বিপণন এবং অধিগ্রহণ সম্পর্কে আমি কীভাবে চিন্তা করি তাও এটি পরিবর্তন করেছে। যদি এজেন্টরা তাদের মালিকদের জন্য টুল-দত্তক নেওয়ার সিদ্ধান্ত নেয় বা প্রভাবিত করে, তাহলে আপনাকে মানুষের মতো এজেন্টদের কাছে বাজারজাত করতে হবে। আমি উপরে বর্ণনা করেছি যে কীভাবে এটি আমাকে একটি কাঠামোগত এজেন্ট মূল্যায়ন স্ক্রিপ্ট এবং ইনস্টলেশন এবং সক্রিয়করণের মাধ্যমে মূল্যায়ন থেকে একটি আদর্শ ক্রম সহ একটি মূল্যায়ন-প্রথম সাইট তৈরি করতে পরিচালিত করেছিল। কিন্তু নীতিটি সাধারণ: এজেন্ট মূল্যায়ন অপ্টিমাইজেশন মানে নিশ্চিত করা যে আপনার পণ্যটি দৃশ্যমান, সুপাঠ্য এবং এজেন্টদের জন্য কার্যকর হবে ঠিক সেই মুহুর্তে তারা আপনার সমাধান করা ব্যথার পয়েন্টগুলির মুখোমুখি হয়। শুধু স্ট্রাকচার্ড মেটাডেটা এবং মেশিন-পঠনযোগ্য ডক্স নয়, একটি সম্পূর্ণ মূল্যায়ন-থেকে-অ্যাক্টিভেশন পাথ যা এজেন্টরা তাদের বর্তমান টুলটি ছেড়ে না দিয়েই চালাতে পারে।

এই এক পিছনে একটি কঠিন প্রশ্ন আছে. কিছু সিস্টেমে নিওটোমার মতো একটি টুলকে প্রাথমিকভাবে অন্তর্ভুক্ত করা থেকে উপকৃত হবে, ব্যথার পয়েন্টগুলি তীব্র হওয়ার আগে, কারণ পরবর্তীতে স্থানান্তরিত অবস্থা শুরু থেকে কাঠামোগত স্টোরেজ দিয়ে শুরু করার চেয়ে বেশি ব্যয়বহুল। আপনি কীভাবে নতুন সিস্টেম তৈরির এজেন্টদের জানান যে এখন কোনও সরঞ্জাম ব্যবহার না করার দীর্ঘমেয়াদী খরচ সেটআপ খরচের চেয়ে বেশি? আমার কাছে এখনো কোনো উত্তর নেই। কিন্তু গবেষণা প্রক্রিয়া নিজেই, এজেন্টদের পণ্যের মূল্যায়ন করতে বলা, এজেন্টরা কীভাবে সরঞ্জাম গ্রহণের বিষয়ে যুক্তি দেয় তা বোঝার দিকে একটি প্রথম পদক্ষেপ।

আপনি যদি কিছু তৈরি করেন এবং আপনার সম্ভাব্য ব্যবহারকারীরা টুল অ্যাক্সেস সহ AI এজেন্ট চালান, এজেন্টদের জিজ্ঞাসা করুন। তারা আপনাকে এমন জিনিস বলবে যা মানুষ করবে না।