8 জুন থেকে 9 জুনের মধ্যে, তিনজন ব্যক্তি যারা খুব কমই একই প্রবন্ধ লেখেন তারা একই প্রবন্ধ লিখেছেন। [অ্যাডি ওসমানী](https://x.com/addyosmani/status/2064127981161959567), Google ক্লাউড-এ AI-এর একজন পরিচালক, "লুপ ইঞ্জিনিয়ারিং" প্রকাশ করেছেন, যা কোডিং এজেন্টদের প্রম্পট করে এমন সিস্টেমের শ্রেণীবিন্যাস যাতে আপনাকে করতে না হয়। [ম্যাট ভ্যান হর্ন](https://x.com/mvanhorn/status/2063865685558903149) "WTF Is a Loop?" প্রকাশিত হয়েছে, Reddit, X, YouTube, এবং Hacker News জুড়ে একটি গবেষণা সুইপ যা 2022 ReAct পেপার থেকে আজকের অর্কেস্ট্রেশন লুপের জন্য ধারণাটি খুঁজে পেয়েছে। এবং [ল্যান্স মার্টিন](https://x.com/RLanceMartin/status/2064397389189071163), Anthropic-এর টেকনিক্যাল স্টাফের একজন সদস্য, "Fable 5 এর সাথে লুপ ডিজাইন করা" প্রকাশ করেছেন, সরাসরি প্রম্পট না করে লুপ ডিজাইন করে ফ্রন্টিয়ার মডেল থেকে সর্বাধিক সুবিধা পাওয়ার জন্য দুটি প্যাটার্ন।

তিনটিই একই শিফটে একত্রিত হয়: প্রম্পটিং হল লুপ ডিজাইন করার উপায় যা আপনার জন্য এজেন্টকে প্রম্পট করে। এবং তিনটিই একই উপাদানের নাম যা সবচেয়ে গুরুত্বপূর্ণ। ওসমানী পাঁচটি বিল্ডিং ব্লকের তালিকা করেছেন, তারপর একটি ষষ্ঠ অংশ যোগ করেছেন এবং তার অংশে সবচেয়ে শক্তিশালী বাক্য দিয়েছেন: "রাষ্ট্রীয় ফাইল পুরো জিনিসটির মেরুদণ্ড।" ভ্যান হর্ন যুক্তি দেন যে লুপগুলির বর্তমান প্রজন্ম একটি কাঠামোগত কারণে প্রকৃতপক্ষে নতুন: "স্থায়িত্ব স্পষ্ট হয়ে উঠেছে, গিট-ব্যাকড স্টেট এবং ক্র্যাশ রিকভারি সহ।" মার্টিন মেমরিকে "একটি বাইরের লুপ যা সেশন জুড়ে বিস্তৃত" হিসাবে ফ্রেম করে।

রোগ নির্ণয় এখন ঐক্যমত। টেকসই বাহ্যিক অবস্থা হল স্বায়ত্তশাসিত এজেন্টদের লোড বহনকারী অংশ। এরপর যা ঘটল তা হল আমাকে অবাক করে দিয়ে। তিনজনই একটি টেক্সট ফাইলে কাজ হস্তান্তর করে।

## একটি লুপ কি, সংক্ষেপে

ভ্যান হর্নের সংজ্ঞাটি সবচেয়ে পরিষ্কার: একটি লুপ হল ক্রোন প্লাস একটি সিদ্ধান্ত গ্রহণকারী। একটি ক্রন কাজ একটি নির্দিষ্ট স্ক্রিপ্ট চালায়। একটি লুপ এমন একটি মডেল চালায় যা বর্তমান অবস্থা দেখে সিদ্ধান্ত নেয়, কি করতে হবে, এটি কাজ করে কিনা তা পরীক্ষা করে এবং চালিয়ে যেতে হবে কিনা তা স্থির করে। সেগুলিকে স্ট্যাক করুন, একটি লুপ অন্যকে পাঠাতে দিন, এবং আপনার কাছে বরিস চেরনি বলতে বোঝায় যখন সে বলে তার কাজ লুপ লেখা।

সেই লুপের ভিতরের মডেলটি ডিজাইন দ্বারা রানের মধ্যে সবকিছু ভুলে যায়। প্রসঙ্গ উইন্ডো শেষ। সেশন রিস্টার্ট। তাই সিস্টেমে কিছু ভুলে যাওয়া উচিত নয়। এটি এমন কিছু যা লুপ পরবর্তীতে কী করতে হবে তা স্থির করার জন্য পড়ে এবং যা ঘটেছিল তা রেকর্ড করতে লেখে। এটা মেরুদণ্ড, ওসমানী এটাকে বলাই ঠিক।

## সাবস্ট্রেট পুন্ট

এখানে তিনটি পোস্ট জুড়ে মেরুদণ্ড প্রার্থীদের সম্পূর্ণ ইনভেন্টরি রয়েছে: একটি মার্কডাউন ফাইল, একটি লিনিয়ার বোর্ড, গিট-এর জন্য প্রতিশ্রুতিবদ্ধ স্টেট ফাইল এবং সেশন জুড়ে শেয়ার করা একটি মাউন্ট করা ফাইল সিস্টেম। ওসমানী প্রথম দুটি প্রস্তাব দেন। ভ্যান হর্ন তৃতীয়টি নথিভুক্ত করেছেন, যা স্টিভ ইয়েগের গ্যাস টাউন বিশ থেকে ত্রিশটি ক্লড দৃষ্টান্ত সমন্বয় করতে ব্যবহার করে। মার্টিন চতুর্থ, ক্লড ম্যানেজড এজেন্টদের মেমরি বৈশিষ্ট্য ব্যবহার করে।

এই সব অধ্যবসায় সমাধান. বাইট একটি পুনঃসূচনা বেঁচে. তাদের কেউই সততার সমাধান করে না। এই সাবস্ট্রেটগুলির মধ্যে যেকোনও প্রশ্ন জিজ্ঞাসা করুন যে একটি লুপের উত্তর আসলে প্রয়োজন: এই দুটি পরস্পর বিরোধী নোটের মধ্যে কোনটি সত্য, কে এটি লিখেছিল, কখন এবং এটি কি কখনও যাচাই করা হয়েছিল? একটি গদ্য ফাইল উভয় নোট পাশাপাশি ধরে রাখে এবং যে মডেলটি পরবর্তী ফাইলটি পড়বে তার জন্য পুনর্মিলন ছেড়ে দেয়। গিট অস্পষ্টতার প্রতিটি ঐতিহাসিক সংস্করণকে এটি সমাধান না করে সংরক্ষণ করে। একটি ভাগ করা মাউন্ট শীর্ষে শেষ লেখার জয় যোগ করে।

অধ্যবসায় এবং সততা বিভিন্ন বৈশিষ্ট্য। বক্তৃতাটি প্রথমটি সম্পূর্ণরূপে শোষণ করেছে এবং এখনও দ্বিতীয়টি লক্ষ্য করেনি।

## আমরা আগে এই পরীক্ষা চালিয়েছিলাম

অ্যাপ্লিকেশনগুলি কয়েক দশক ধরে ফ্ল্যাট ফাইলগুলিতে তাদের অবস্থা সংরক্ষণ করে। তিনটি শক্তি সেই যুগের অবসান ঘটিয়েছে: সমসাময়িক লেখকরা ফাইলগুলিকে দূষিত করেছে, জমে থাকা দ্বন্দ্বগুলির কোনও সমাধানের ব্যবস্থা নেই এবং প্রশ্নের উত্তর দেওয়ার অর্থ হল সবকিছু পার্স করা। ডেটাবেসগুলি জিতেছে কারণ তারা ডেটা স্পর্শ করে এমন প্রতিটি প্রোগ্রামের জন্য প্রত্যাশিত শৃঙ্খলার পরিবর্তে সততাকে স্টোরেজ স্তরের একটি সম্পত্তি বানিয়েছে।

ওই ফোর্সদের প্রত্যেককে ইতিমধ্যে তিনটি পোস্টের ভিতরে দৃশ্যমান।

সঙ্গতি আসে যখন লুপগুলি লুপগুলিকে তত্ত্বাবধান করে, ঠিক সেই পর্যায়ে ভ্যান হর্ন বলে যে আমরা প্রবেশ করছি৷ একটি স্টেট ফাইল লেখা দুটি লুপ একই ব্যর্থতা যা দুটি ইঞ্জিনিয়ার কথা না বলে একই লাইনে প্রতিশ্রুতিবদ্ধ। ওয়ার্কট্রিস কোডের জন্য এটি সমাধান করে। বর্তমান টুলচেইনের কোন কিছুই [শেয়ারড স্টেট](/posts/when-agents-share-state-everything-breaks) এর সমাধান করে না।

মার্টিনের বেঞ্চমার্ক ফলাফলে দ্বন্দ্ব নথিভুক্ত করা হয়েছে। একটি ক্রমাগত শেখার কাজে, সনেট 4.6 একটি মেমরি স্টোর রেখে গেছে যা তিনি ব্যর্থতার নোট এবং খোলা অনুমানগুলির একটি তালিকা হিসাবে বর্ণনা করেছেন, যার মধ্যে "prc_usd এর পরিবর্তে prc হতে পারে?" অনুমান জমে। কিছুই একটি সমাধান চিহ্নিত. পরবর্তী অধিবেশন গাদা উত্তরাধিকারী হয়.

প্রশ্নগুলি ভ্যান হর্নের নিজস্ব পাঞ্চলাইন। তিনি যুক্তি দেন যে এজেন্টিক কোডিংয়ের ব্যয়বহুল অংশটি এখন লুপ ম্যানেজমেন্ট: স্থগিত অবস্থা, কোন অগ্রগতি সনাক্তকরণ এবং বাজেট সিলিং। তাদের প্রত্যেকেরই আগের রানের সাথে বর্তমান রানের তুলনা করা প্রয়োজন। একটি গদ্য সাবস্ট্রেটে, এর অর্থ হল প্রতি টিকের উপরে একটি ক্রমবর্ধমান ফাইল পুনরায় পড়া এবং পুনরায় পার্স করা, যা একটি টোকেন ট্যাক্স যা লুপের বয়সের সাথে পরিমাপ করে।

## একটি ঝাঁক চালানো আমাকে কি শিখিয়েছে

আমি আমার নিজের মেশিনে নামকরা এজেন্টদের একটি ঝাঁক চালাই: একটি গ্রাহক বুদ্ধিমত্তার জন্য, একটি বিষয়বস্তুর জন্য, একটি প্রচারের জন্য, অন্যটি অপারেশনের জন্য৷ প্রারম্ভিক সেটআপে, প্রত্যেকে তার নিজস্ব ফাইলে নোট রাখে। সেই ফাইলগুলো ভেসে গেছে। একই ব্যক্তি তিনটি নামে হাজির। একটি ফাইলে সংশোধিত একটি সত্য অন্য দুটিতে অসংশোধিত রয়ে গেছে, এবং কোন রেকর্ডটি দেখায়নি কোন সংস্করণটি বর্তমান ছিল বা এটির কোনটি কোথা থেকে এসেছে।

ঝাঁক এখন [একটি কাঠামোগত স্টোর](/posts/from-memory-to-nervous-system) শেয়ার করে এবং এই পোস্টটি নিজেই একটি রসিদ। এটির পিছনে গবেষণাটি আমার গ্রাহক গোয়েন্দা এজেন্ট দ্বারা করা হয়েছিল, যা তিনটি X পোস্ট নিয়েছিল, প্রতিটিকে এনগেজমেন্ট নম্বর এবং উত্স সহ একটি টাইপ করা রেকর্ড হিসাবে সংরক্ষণ করেছিল, একটি কাঠামোগত বিশ্লেষণে প্রতিযোগিতামূলক ফলাফলগুলি লিখেছিল এবং শেয়ার্ড স্টোরের মাধ্যমে অন্য দুটি এজেন্টের কাছে ফলো আপ কাজগুলি জমা দিয়েছিল৷ যখন আমি এক ঘন্টা পরে একটি ফলো-আপ প্রশ্ন জিজ্ঞাসা করলাম, তুলনাটি একই বিশ্লেষণ রেকর্ডের সাথে যুক্ত করা হয়েছিল তার নিজস্ব উদ্ভব ট্রেইলের সাথে, একটি নতুন ফাইলে ছড়িয়ে ছিটিয়ে নেই। কোন এজেন্ট ইতিমধ্যে অন্য যা প্রতিষ্ঠিত করেছে তা পুনরায় প্রাপ্ত করতে পারেনি।

## মেমরি পরিপক্কতা একটি সাবস্ট্রেট সম্পত্তি

তিনটি পোস্টের যেকোনও তীক্ষ্ণ তথ্য মার্টিন-এ। তিনি মেমরি ব্যবহারের পাঁচটি পর্যায় বর্ণনা করেছেন: একজন এজেন্ট ব্যর্থ হয়, কেন তা তদন্ত করে, যা পাওয়া যায় তা যাচাই করে, উত্তরটিকে একটি নিয়মে পাতিত করে এবং পরের বার সেই নিয়মের সাথে পরামর্শ করে। একটি এজেন্ট যে সমস্ত পাঁচটি সম্পূর্ণ করে ব্যর্থতাকে যাচাইকৃত, পুনরায় ব্যবহারযোগ্য নিয়মে পরিণত করে। একটি এজেন্ট যে তাড়াতাড়ি থামে অনুমান একটি গাদা ছেড়ে.

তার ফলাফল, সব একই মাউন্ট করা ফাইল সিস্টেমে: সনেট 4.6 প্রথম পর্যায়ে থেমে যায়, তাদের তদন্ত না করেই ব্যর্থতা রেকর্ড করে। Opus 4.7 যাচাই পর্যায়ে পৌঁছেছে কিন্তু মধ্যবর্তী সময়ে তার দাবির প্রায় 17 শতাংশ পরীক্ষা করে। রূপকথা 5 অগ্রগতি সম্পূর্ণ করে এবং 73 শতাংশ পর্যন্ত যাচাই করে।

একই ফাইল সিস্টেম, আমূল ভিন্ন মেমরির গুণমান। পার্থক্যটি সম্পূর্ণরূপে মডেলের শৃঙ্খলার মধ্যে থাকে, কারণ ফাইল সিস্টেম কিছুই গ্যারান্টি দেয় না: প্রতিটি পর্যায় এমন একটি আচরণ যা মডেলটিকে সম্পাদন করতে বেছে নিতে হবে। একটি স্ট্রাকচার্ড স্টোর সেই আচরণগুলিকে ডেটা অপারেশনে পরিণত করে। একটি ব্যর্থতা একটি সঞ্চিত পর্যবেক্ষণ. তদন্ত সংশ্লিষ্ট রেকর্ড উদ্ধার করা হয়. যাচাইকরণ হল একটি সংশোধন যার সূত্র সংযুক্ত করা হয়েছে। পাতন একটি টাইপ করা নিয়ম লিখছে. পরামর্শ একটি আবদ্ধ প্রশ্ন. যখন সাবস্ট্রেট অগ্রগতি বহন করে, যে কোনও মডেল এটি সম্পূর্ণ করতে পারে।

## একটি লুপ স্টেট লেয়ার থেকে কী দাবি করা যায়

অজ্ঞেয়ভাবে বলা হয়েছে, লুপের মেরুদণ্ডের ছয়টি জিনিস দেওয়া উচিত: গদ্যের ব্লবগুলির পরিবর্তে টাইপ করা রেকর্ড, প্রতিটি ক্ষেত্রের প্রমাণ, সংস্করণগুলি জমা করার পরিবর্তে বর্তমান সত্য গণনা করে এমন সংশোধন, সমসাময়িক লেখা যা দ্বন্দ্ব করতে পারে না, পুনরুদ্ধার যা বর্তমান টিকটির জন্য যা প্রয়োজন তা প্রদান করে, এবং এক বিক্রেতার স্ট্যাকের পরিবর্তে যে কোনও জোতা থেকে অ্যাক্সেস।

টেক্সট ফাইলের সাথে ন্যায্য হতে: একটি রেপোতে একটি লুপের জন্য, [মার্কডাউন প্রকৃতপক্ষে ঠিক আছে](/posts/the-markdown-memory-ceiling)। এটা পঠনযোগ্য, diffable, এবং বিনামূল্যে. ফোর্সিং ফাংশনটি লুপ নম্বর দুই, প্রথমবার দুটি প্রসেস একই সত্য সম্পর্কে যত্নশীল এবং অন্যটি যা লিখেছে তা বিশ্বাস করতে পারে না।

## ফাইল মনে রাখবেন, সিস্টেম অফ রেকর্ড জানে

ভ্যান হর্ন তার অংশটি শেষ করে এই যুক্তি দিয়ে যে লুপটি নদীর গভীরতানির্ণয় এবং টেকসই সম্পদ হল দক্ষতা গ্রন্থাগার যা এটি কল করে। অর্ধেক ডান, আমি মনে করি. দক্ষতা হল পদ্ধতিগত স্মৃতি, কিভাবে বারবার কাজ করা যায়। তাদের নীচে বাস্তবিক স্মৃতি, যা এই মুহূর্তে সত্য যে প্রতিটি দক্ষতার আহ্বান নির্ভর করে। উভয় যৌগ, কিন্তু শুধুমাত্র যদি বাস্তব স্তর বিশ্বাস করা যেতে পারে হাজার হাজার অনুপস্থিত লেখার পরে।

আমি [নিওটোমা](https://github.com/markmhendrickson/neotoma) তৈরি করেছি কারণ আমার নিজের ঝাঁকের জন্য আমার সেই স্তরটি দরকার ছিল: টাইপ করা পর্যবেক্ষণ, প্রতি ক্ষেত্রের উৎস, বর্তমান সত্যের সমাধান এবং আমি চালানো প্রতিটি এজেন্টের জন্য শেয়ার করা অ্যাক্সেস। লুপ ডিসকোর্সটি যে স্লটটি পূরণ করে তা বর্ণনা করার জন্য একটি সপ্তাহ অতিবাহিত করেছে।

ওসমানী তার প্রবন্ধটি শেষ করেন যিনি প্রকৌশলী হিসেবে থাকতে চান তার মতো লুপ তৈরি করার পরামর্শ দিয়ে। রাষ্ট্রীয় স্তর যেখানে সেই অভিপ্রায় পরীক্ষাযোগ্য হয়ে ওঠে। ফাইল মনে রাখবেন। রেকর্ড একটি সিস্টেম জানে.