8 جون سے 9 جون کے درمیان تین افراد جو شاذ و نادر ہی ایک مضمون لکھتے ہیں ایک ہی مضمون لکھا۔ [Addy Osmani](https://x.com/addyosmani/status/2064127981161959567)، گوگل کلاؤڈ میں AI کے ایک ڈائریکٹر نے "لوپ انجینئرنگ" شائع کیا، جو سسٹمز کی ایک درجہ بندی ہے جو کوڈنگ ایجنٹوں کو اشارہ کرتی ہے تاکہ آپ کو اس کی ضرورت نہ پڑے۔ [Matt Van Horn](https://x.com/mvanhorn/status/2063865685558903149) نے "WTF Is a Loop؟" شائع کیا، Reddit، X، YouTube، اور Hacker News میں ایک تحقیقی جھاڑو جس نے 2022 کے ReAct پیپر سے آرکیسٹریشن لوپ کو آج کے لوگوں تک پہنچایا۔ اور [Lance Martin](https://x.com/RLanceMartin/status/2064397389189071163)، Anthropic کے تکنیکی عملے کے ایک رکن نے، "Designing loops with Fable 5" شائع کیا، براہ راست اشارہ کرنے کے بجائے لوپس ڈیزائن کرکے فرنٹیئر ماڈلز سے زیادہ سے زیادہ فائدہ اٹھانے کے لیے دو نمونے۔

تینوں ایک ہی شفٹ پر اکٹھے ہوتے ہیں: پرامپٹنگ لوپس کو ڈیزائن کرنے کا راستہ فراہم کر رہا ہے جو آپ کے لیے ایجنٹوں کا اشارہ کرتا ہے۔ اور تینوں ایک ہی جزو کا نام دیتے ہیں جو سب سے زیادہ اہمیت رکھتا ہے۔ عثمانی نے پانچ عمارتی بلاکس کی فہرست بنائی، پھر چھٹا اضافہ کیا اور اسے اپنے حصے میں سب سے مضبوط جملہ دیا: "ریاست فائل پوری چیز کی ریڑھ کی ہڈی ہے۔" وان ہورن کا استدلال ہے کہ لوپس کی موجودہ نسل ایک ساختی وجہ سے حقیقی طور پر نئی ہے: "گٹ بیکڈ اسٹیٹ اور کریش ریکوری کے ساتھ پائیداری واضح ہوگئی۔" مارٹن میموری کو "ایک بیرونی لوپ کے طور پر تیار کرتا ہے جو سیشنوں میں پھیلا ہوا ہے۔"

تشخیص اب اتفاق رائے ہے. پائیدار بیرونی حالت خود مختار ایجنٹوں کا بوجھ برداشت کرنے والا حصہ ہے۔ جس چیز نے مجھے حیران کیا وہ یہ ہے کہ آگے کیا ہوا۔ تینوں نے کام ایک ٹیکسٹ فائل کے حوالے کر دیا۔

## ایک لوپ کیا ہے، مختصر طور پر

وان ہارن کی تعریف سب سے صاف ہے: ایک لوپ جسم میں کرون پلس ایک فیصلہ ساز ہے۔ ایک کرون جاب ایک مقررہ اسکرپٹ چلاتی ہے۔ ایک لوپ ایک ماڈل چلاتا ہے جو موجودہ حالت کو دیکھتا ہے، فیصلہ کرتا ہے کہ کیا کرنا ہے، کیا کرنا ہے، چیک کرتا ہے کہ آیا اس نے کام کیا، اور فیصلہ کرتا ہے کہ اسے جاری رکھنا ہے۔ ان کو اسٹیک کریں، ایک لوپ کو دوسروں کو بھیجنے دیں، اور آپ کے پاس وہ چیز ہے جس کا مطلب بورس چرنی ہے جب وہ کہتا ہے کہ اس کا کام لوپس لکھنا ہے۔

اس لوپ کے اندر کا ماڈل ڈیزائن کے لحاظ سے رن کے درمیان سب کچھ بھول جاتا ہے۔ سیاق و سباق کی ونڈوز ختم۔ سیشن دوبارہ شروع۔ لہذا نظام میں کچھ بھولنا نہیں ہے. یہ وہ چیز ہے جسے لوپ پڑھتا ہے اور فیصلہ کرتا ہے کہ آگے کیا کرنا ہے اور جو کچھ ہوا اسے ریکارڈ کرنے کے لیے لکھتا ہے۔ یہ ریڑھ کی ہڈی ہے اور اسے عثمانی کہنا درست ہے۔

## سبسٹریٹ پنٹ

یہاں تینوں پوسٹوں میں ریڑھ کی ہڈی کے امیدواروں کی مکمل انوینٹری ہے: ایک مارک ڈاؤن فائل، ایک لکیری بورڈ، ریاستی فائلیں جو گٹ کے لیے پرعزم ہیں، اور ایک ماونٹڈ فائل سسٹم جو سیشنز میں شیئر کیے گئے ہیں۔ عثمانی پہلے دو پیش کرتے ہیں۔ وان ہورن نے تیسری دستاویز کی ہے، جسے اسٹیو یگ کا گیس ٹاؤن بیس سے تیس کلاڈ مثالوں کو مربوط کرنے کے لیے استعمال کرتا ہے۔ مارٹن کلاڈ مینیجڈ ایجنٹس کی چوتھی، میموری کی خصوصیت کا استعمال کرتا ہے۔

یہ سب استقامت کو حل کرتے ہیں۔ بائٹس دوبارہ شروع ہونے سے بچ جاتے ہیں۔ ان میں سے کوئی بھی سالمیت کو حل نہیں کرتا ہے۔ ان سبسٹریٹس میں سے کوئی بھی سوال پوچھیں جس کا جواب درحقیقت لوپ کو درکار ہے: ان دو متضاد نوٹوں میں سے، کون سا سچ ہے، اسے کس نے لکھا، کب، اور کیا اس کی کبھی تصدیق ہوئی؟ ایک نثر فائل دونوں نوٹوں کو ساتھ ساتھ رکھتی ہے اور جو بھی ماڈل فائل کو آگے پڑھتا ہے اس پر مفاہمت چھوڑ دیتا ہے۔ گٹ ابہام کے ہر تاریخی ورژن کو حل کیے بغیر محفوظ کرتا ہے۔ ایک مشترکہ ماؤنٹ سب سے اوپر آخری تحریری جیت کا اضافہ کرتا ہے۔

استقامت اور سالمیت مختلف خصوصیات ہیں۔ گفتگو نے پہلے کو مکمل طور پر جذب کر لیا ہے اور دوسرے کو ابھی تک محسوس نہیں کیا ہے۔

## ہم نے یہ تجربہ پہلے بھی چلایا تھا۔

ایپلی کیشنز نے اپنی ریاست کو کئی دہائیوں تک فلیٹ فائلوں میں محفوظ کیا۔ تین قوتوں نے اس دور کا خاتمہ کیا: ایک ساتھ لکھنے والوں نے فائلوں کو خراب کیا، جمع تضادات کا کوئی حل کرنے کا طریقہ کار نہیں تھا، اور سوالات کے جوابات کا مطلب ہر چیز کو پارس کرنا تھا۔ ڈیٹا بیس جیت گئے کیونکہ انہوں نے ڈیٹا کو چھونے والے ہر پروگرام سے متوقع نظم و ضبط کی بجائے سالمیت کو اسٹوریج پرت کی خاصیت بنا دیا۔

ان میں سے ہر ایک فورس پہلے ہی تین پوسٹوں کے اندر نظر آ رہی ہے۔

کنکرنسی اس وقت پہنچتی ہے جب لوپس لوپس کی نگرانی کرتے ہیں، بالکل وہی مرحلہ ہے جس میں وان ہارن کہتا ہے کہ ہم داخل ہو رہے ہیں۔ ایک اسٹیٹ فائل لکھنے والے دو لوپس وہی ناکامی ہے جیسے دو انجینئرز بغیر بات کیے ایک ہی لائنوں پر کام کر رہے ہیں۔ ورک ٹری اس کوڈ کے لیے حل کرتے ہیں۔ موجودہ ٹول چین میں کچھ بھی اسے [مشترکہ حالت](/posts/when-agents-share-state-everything-breaks) کے لیے حل نہیں کرتا ہے۔

تضاد مارٹن کے بینچ مارک کے نتائج میں درج ہے۔ مسلسل سیکھنے کے کام پر، سونیٹ 4.6 نے ایک میموری اسٹور کو پیچھے چھوڑ دیا جس کو وہ ناکامی کے نوٹوں اور کھلے اندازوں کی فہرست کے طور پر بیان کرتا ہے، جس میں اندراجات جیسے "شاید prc_usd کے بجائے prc؟" اندازے جمع ہو جاتے ہیں۔ کوئی بھی چیز حل شدہ نہیں ہے۔ اگلا سیشن ڈھیر وراثت میں ملتا ہے۔

سوالات وان ہارن کی اپنی پنچ لائن ہیں۔ وہ دلیل دیتے ہیں کہ ایجنٹی کوڈنگ کا مہنگا حصہ اب لوپ مینجمنٹ ہے: حالات کو روکنا، کوئی پیش رفت کا پتہ نہیں، اور بجٹ کی چھتیں۔ ان میں سے ہر ایک کو پچھلے رنز کے مقابلے موجودہ رن کا موازنہ کرنے کی ضرورت ہے۔ نثر کے سبسٹریٹ پر، اس کا مطلب ہے کہ ہر ٹک پر بڑھتی ہوئی فائل کو دوبارہ پڑھنا اور دوبارہ پارس کرنا، جو کہ ایک ٹوکن ٹیکس ہے جو لوپ کی عمر کے ساتھ پیمانے پر ہوتا ہے۔

## ایک غول چلانے نے مجھے کیا سکھایا

میں اپنی مشین پر نامزد ایجنٹوں کا ایک غول چلاتا ہوں: ایک کسٹمر کی ذہانت کے لیے، ایک مواد کے لیے، ایک آؤٹ ریچ کے لیے، دوسرا آپریشن کے لیے۔ ابتدائی سیٹ اپ میں، ہر ایک نے اپنی فائلوں میں نوٹ رکھے۔ وہ فائلیں چلی گئیں۔ ایک ہی شخص تین ناموں سے ظاہر ہوا۔ ایک فائل میں درست کیا گیا ایک حقیقت دو دیگر فائلوں میں ناقابل تصحیح بچ گئی، اور کوئی ریکارڈ یہ نہیں دکھاتا ہے کہ کون سا ورژن موجودہ ہے یا اس میں سے کوئی کہاں سے آیا ہے۔

بھیڑ اب [ایک ساختہ اسٹور](/posts/from-memory-to-nervous-system) کا اشتراک کرتا ہے، اور یہ پوسٹ بذات خود ایک رسید ہے۔ اس کے پیچھے تحقیق میرے کسٹمر انٹیلی جنس ایجنٹ کے ذریعہ کی گئی تھی، جس نے تینوں X پوسٹس حاصل کیں، ہر ایک کو منگنی کے نمبروں اور اصلیت کے ساتھ ٹائپ شدہ ریکارڈ کے طور پر ذخیرہ کیا، مسابقتی نتائج کو ایک منظم تجزیہ میں لکھا، اور مشترکہ اسٹور کے ذریعے دو دیگر ایجنٹوں کو فالو اپ ٹاسک دائر کیے گئے۔ جب میں نے ایک گھنٹہ بعد فالو اپ سوال پوچھا، تو موازنہ اسی تجزیے کے ریکارڈ کے ساتھ اس کی اپنی اصل پگڈنڈی کے ساتھ جوڑ دیا گیا، کسی نئی فائل میں بکھرے ہوئے نہیں۔ کسی بھی ایجنٹ نے وہ چیز دوبارہ حاصل نہیں کی جو کسی دوسرے نے پہلے ہی قائم کی تھی۔

## یادداشت کی پختگی ایک سبسٹریٹ پراپرٹی ہے۔

تین میں سے کسی بھی پوسٹ میں سب سے تیز ڈیٹا مارٹن میں ہے۔ وہ میموری کے استعمال کے پانچ مراحل کی وضاحت کرتا ہے: ایک ایجنٹ ناکام ہو جاتا ہے، اس کی تحقیقات کیوں کرتا ہے، اس کی تصدیق کرتا ہے کہ اسے کیا ملا، جواب کو ایک اصول میں ڈسٹل کرتا ہے، اور اگلی بار اس اصول سے مشورہ کرتا ہے۔ ایک ایجنٹ جو تمام پانچوں کو مکمل کرتا ہے ناکامیوں کو تصدیق شدہ، دوبارہ قابل استعمال قواعد میں بدل دیتا ہے۔ ایک ایجنٹ جو جلدی رک جاتا ہے اندازہوں کا ڈھیر چھوڑ دیتا ہے۔

اس کے نتائج، سب ایک ہی نصب شدہ فائل سسٹم پر: سونیٹ 4.6 پہلے مرحلے پر رک جاتا ہے، ان کی چھان بین کیے بغیر ناکامیوں کو ریکارڈ کرتا ہے۔ Opus 4.7 تصدیق کے مرحلے تک پہنچتا ہے لیکن درمیانی دوڑ میں اپنے دعووں کا صرف 17 فیصد چیک کرتا ہے۔ افسانہ 5 ترقی کو مکمل کرتا ہے اور 73 فیصد تک تصدیق کرتا ہے۔

ایک ہی فائل سسٹم، یکسر مختلف میموری کوالٹی۔ فرق مکمل طور پر ماڈل کے نظم و ضبط میں رہتا ہے، کیونکہ فائل سسٹم کسی چیز کی ضمانت نہیں دیتا: ہر مرحلہ ایک ایسا طرز عمل ہے جسے انجام دینے کے لیے ماڈل کو منتخب کرنا چاہیے۔ ایک منظم اسٹور ان طرز عمل کو ڈیٹا آپریشنز میں بدل دیتا ہے۔ ناکامی ایک ذخیرہ شدہ مشاہدہ ہے۔ تفتیش متعلقہ ریکارڈ حاصل کر رہی ہے۔ توثیق ایک تصحیح ہے جس میں اصلیت منسلک ہے۔ کشید ایک ٹائپ شدہ اصول لکھ رہا ہے۔ مشاورت ایک پابند سوال ہے۔ جب سبسٹریٹ ترقی کرتا ہے، تو کوئی بھی ماڈل اسے مکمل کرتا ہے۔

## لوپ اسٹیٹ لیئر سے کیا مطالبہ کرنا ہے۔

غیر منطقی طور پر بیان کردہ ٹول، لوپ کی ریڑھ کی ہڈی کو چھ چیزیں فراہم کرنی چاہئیں: نثر کے بلب کی بجائے ٹائپ شدہ ریکارڈز، ہر فیلڈ پر پرووینس، وہ تصحیحیں جو موجودہ سچائی کو جمع کرنے کے بجائے شمار کرتی ہیں، کنکرنٹ تحریریں جو تنازعہ نہیں کر سکتیں، بازیافت جو صرف وہی دیتی ہے جو موجودہ ٹک کی ضرورت ہوتی ہے، اور کسی وینڈر کے سٹیک کے بجائے کسی بھی استعمال سے رسائی۔

ٹیکسٹ فائل کے ساتھ منصفانہ ہونا: ایک ریپو پر ایک لوپ کے لیے، [مارک ڈاؤن حقیقی طور پر ٹھیک ہے](/posts/the-markdown-memory-ceiling)۔ یہ پڑھنے کے قابل، قابل تفریق اور مفت ہے۔ مجبور کرنے کا فنکشن لوپ نمبر دو ہے، پہلی بار دو عمل ایک ہی حقیقت کا خیال رکھتے ہیں اور نہ ہی اس پر بھروسہ کر سکتے ہیں جو دوسرے نے لکھا ہے۔

## فائلیں یاد رکھیں، ریکارڈ کے نظام کو معلوم ہے۔

وان ہورن نے یہ بحث کرتے ہوئے اپنا حصہ ختم کیا کہ لوپ پلمبنگ ہے اور پائیدار اثاثہ اسکل لائبریری کو کہتے ہیں۔ آدھا صحیح، میرے خیال میں۔ مہارتیں طریقہ کار کی یادداشت ہیں، بار بار کام کرنے کا طریقہ۔ ان کے نیچے حقائق کی یادداشت بیٹھی ہے، جو اس وقت سچ ہے جس پر ہر مہارت کی درخواست منحصر ہے۔ دونوں کمپاؤنڈ، لیکن صرف اس صورت میں جب حقیقت پر مبنی تہہ پر ہزار غیر توجہ شدہ تحریروں کے بعد بھروسہ کیا جا سکے۔

میں نے [Neotoma](https://github.com/markmhendrickson/neotoma) بنایا کیونکہ مجھے اپنے بھیڑ کے لیے اس پرت کی ضرورت تھی: ٹائپ شدہ مشاہدات، فی فیلڈ پرووینس، تصحیحیں جو موجودہ سچائی کو حل کرتی ہیں، اور میرے چلانے والے ہر ایجنٹ کے لیے مشترکہ رسائی۔ لوپ ڈسکورس نے صرف ایک ہفتہ اس سلاٹ کو بیان کرنے میں گزارا جو اسے بھرتا ہے کسی بھی چیز کا نام لئے بغیر۔

عثمانی نے اپنے مضمون کو کسی ایسے شخص کی طرح تیار کرنے کے مشورے کے ساتھ بند کیا جو انجینئر رہنے کا ارادہ رکھتا ہے۔ ریاستی پرت وہ ہے جہاں یہ ارادہ قابل آزمائش بن جاتا ہے۔ فائلیں یاد رکھیں۔ ریکارڈ کا ایک نظام جانتا ہے۔