میرا ایجنٹ اسٹیک دراصل کیا کرتا ہے۔

میں نے dogfood Neotoma کے لیے ایک ایجنٹی اسٹیک بنایا اور اپنے کام کو تیز کیا۔ 12+ MCP سرورز کے ساتھ ایک نجی monorepo جہاں میں روزانہ AI ایجنٹوں کے ساتھ کام کرتا ہوں۔ Neotoma ذیل میں ساختی میموری فراہم کرتا ہے، ایجنٹوں کو ہر سیشن میں پہلے سے کام کرنے دیتا ہے۔

میرا ایجنٹ اسٹیک دراصل کیا کرتا ہے۔

میرا ایجنٹ اسٹیک یہ ہے کہ میں کس طرح Neotoma کو ڈاگ فوڈ کرتا ہوں۔ یہ میرا ذاتی آپریٹنگ سسٹم بھی ہے۔ ایک پرائیویٹ monorepo جہاں AI ایجنٹس ای میل ٹرائیج سے لے کر Bitcoin کی ادائیگی سے لے کر ویب سائٹ کی تعیناتیوں تک سب کچھ سنبھالتے ہیں، Neotoma کے ساتھ نیچے کی ساختی میموری کے ساتھ۔

Neotoma میں بھیجی جانے والی ہر خصوصیت کی توثیق یہاں پہلے ہوتی ہے، بنیادی طور پر Cursor میں اور دوسرے طور پر ٹرمینل ایجنٹس جیسے Claude Code، Codex، اور [Cursor] CLI](https://cursor.com/cli)۔ ہر خلا مجھے ایجنٹ میموری کی سطحوں میں سب سے پہلے ملتا ہے۔ اسٹیک یہ ہے کہ میں اپنی روزمرہ کی زندگی اور کام کیسے چلاتا ہوں۔ میں جس رگڑ کا سامنا کرتا ہوں، صارف کے تاثرات کے علاوہ، وہی ہے جو نیوٹوما روڈ میپ کو چلاتا ہے۔

میں اسٹیک کو اوپن سورس کرنے کا ارادہ رکھتا ہوں۔ لیکن ریپو میں مہینوں کا ذاتی ڈیٹا، میرے اکاؤنٹس میں ہارڈ کوڈ کردہ اسکرپٹس، اور میرے سیٹ اپ سے منسلک کنفیگریشن جمع ہے۔ اس سے پہلے کہ یہ عام ہو جائے مجھے اس ڈیٹا کو مکمل طور پر Neotoma میں دھکیلنے کی ضرورت ہے اور ٹولنگ کو عام ہونے کے لیے ری ایکٹر کرنا ہوگا۔ وہ کام جاری ہے۔

یہ پوسٹ بتاتی ہے کہ اسٹیک کیا ہے، میں اسے کیسے استعمال کرتا ہوں، اور اس سے کیا پتہ چلتا ہے کہ ساختی ایجنٹ میموری کو کیا کرنے کی ضرورت ہے۔

اسٹیک کیا ہے۔

اسٹیک ایک monorepo ہے جس میں ایک درجن سے زیادہ MCP سرورز اور CLIs ہیں، ہر ایک AI ایجنٹوں کو ایک مختلف سروس سے جوڑتا ہے: Gmail، Google کیلنڈر، WhatsApp، ایک Bitcoin والیٹ Instagram، Asana، HomeKit DNSimple، Google Search Console، 1Password، ایک ویب scraper، اور مزید۔ کچھ ایم سی پی سرورز ہیں جنہیں ایجنٹ ٹولز کہتے ہیں۔ دوسرے CLIs ہیں جنہیں ایجنٹ ٹرمینل سے طلب کرتے ہیں۔ دونوں ایجنٹوں کو ایک ہی چیز دیتے ہیں: بیرونی خدمات تک پہنچنا۔

MCP سرورز کے اوپری حصے میں اصول اور مہارتیں بیٹھی ہیں۔ قواعد مستقل رویے سے متعلق ہدایات ہیں جو ریپو میں رہتی ہیں، نیوٹوما میں نہیں: جواب دینے سے پہلے ہمیشہ رابطوں کو Neotoma میں اسٹور کریں، کبھی بھی راز نہ رکھیں، جملے کے کیس کو عنوانات میں استعمال کریں، کوڈ میں تبدیلی کے بعد ٹیسٹ چلائیں، لاگز اور تشکیل کے لیے ڈیش بورڈ پر CLI کو ترجیح دیں، پروڈکٹ کے ناموں کے پہلے ذکر کو لنک کریں۔ ہنر کئی قدمی ورک فلو ہیں: میرے ان باکس کو ٹرائیج کریں، بلاگ پوسٹ کا مسودہ تیار کریں، ویب سائٹ تعینات کریں، پروڈکٹ فیڈ بیک پر کارروائی کریں، ای میل سے ایمیزون آرڈر نکالیں، بٹ کوائن میں ٹھیکیدار کو ادائیگی کریں۔

اور ہر چیز کے نیچے Neotoma ساختی میموری پرت کے طور پر بیٹھی ہے۔ ہر ایجنٹ اس سے پڑھتا ہے اور اسے لکھتا ہے۔ یہی چیز ہر سیشن پر ری سیٹ کرنے کے بجائے وقت کے ساتھ ساتھ اسٹیک کو کمپاؤنڈ بناتی ہے۔

میں اس کے ساتھ کیسے کام کرتا ہوں۔

میں کرسر میں رہتا ہوں۔ میرا دن ایجنٹ سیشن کا ایک سلسلہ ہے۔ میں ایک نیا ایجنٹ کھولتا ہوں، بیان کرتا ہوں کہ میں کیا کرنا چاہتا ہوں، اور ایجنٹ کام کی جگہ میں MCP سرورز، اصولوں اور مہارتوں کا استعمال کرتے ہوئے عملدرآمد کرتا ہے۔ کچھ سیشن جلدی ہوتے ہیں: "اس ای میل کا جواب دیں۔" کچھ طویل ہیں: "میرے ان باکس کو ٹرائیج کریں، تازہ ترین ٹیسٹر فیڈ بیک پر کارروائی کریں، پھر [گوگل کے میموری ایجنٹ] (/posts/always-on-memory-agents-and-the-truth-layer) کے بارے میں ایک تقابلی پوسٹ کا مسودہ تیار کریں۔"

یہ ایجنٹوں کے ساتھ مل کر کام کر رہا ہے۔ میں اپنی میز پر بیٹھتا ہوں اور سارا دن ان کے ساتھ کام کرتا ہوں۔ ذاتی کام: مرمت کا شیڈول بنانا، ٹھیکیدار کو ادائیگی کرنا، کیلنڈر کے واقعات کا انتظام کرنا۔ پیشہ ورانہ: پوسٹس لکھنا، فیڈ بیک پر کارروائی کرنا، ویب سائٹس کی تعیناتی، ڈومینز کا انتظام کرنا۔ ایجنٹ پھانسی کو سنبھالتے ہیں۔ میں سمت فراہم کرتا ہوں، آؤٹ پٹ کا جائزہ لیتا ہوں، اور ایسے اعمال کی منظوری دیتا ہوں جن کے لیے انسان کی ضرورت ہوتی ہے۔

ہر ایجنٹ سیشن میں کام کی جگہ کا مکمل سیاق و سباق ہوتا ہے: ہر MCP سرور، ہر اصول، ہر مہارت۔ ایجنٹ میرا جی میل پڑھ سکتا ہے، میرا کیلنڈر چیک کر سکتا ہے، سابقہ ​​سیاق و سباق کے لیے نیوٹوما سے استفسار کر سکتا ہے، نیا ڈیٹا اسٹور کر سکتا ہے، تصاویر بنا سکتا ہے، پش کوڈ کر سکتا ہے، اور تعیناتیوں کی تصدیق کر سکتا ہے۔ میرا کردار ارادے کو بیان کرنا اور نتائج کا جائزہ لینا ہے۔

نیوٹوما کیسے فٹ بیٹھتا ہے۔

ساختی میموری کے بغیر، ہر ایجنٹ سیشن صفر سے شروع ہوتا ہے۔ ایجنٹ یہ نہیں جانتا کہ آپ کے رابطے کون ہیں، آپ نے کون سے کام کھولے ہیں، آپ نے کل کیا بات کی، یا آپ نے پہلے ہی کسی کو کیا ادا کیا۔ آپ سیاق و سباق کو ہر پرامپٹ میں چسپاں کر سکتے ہیں، لیکن یہ چند سیشنز کے پیچھے نہیں ہوتا ہے۔ پلیٹ فارم میموری آپ کے وائب کو اسٹور کرتی ہے، آپ کے کام کو نہیں۔ RAG کوڈ کے ساتھ مدد کرتا ہے، لیکن ساختی حقائق کے ساتھ نہیں جو ورک فلو کو آگے بڑھاتے ہیں: آپ کو کس کے پیسے دینے ہیں، پچھلے ہفتے آپ کو کیا تاثرات موصول ہوئے، کون سے کام ابھی بھی کھلے ہیں۔

My Neotoma مثال میں 1,000 سے زیادہ رابطے، 600 کام، 140 بات چیت، 120 بلاگ پوسٹس، اور 170 ہستی کی قسمیں ہیں جو ایجنٹوں نے نئی قسم کی معلومات کا سامنا کرنے پر تخلیق کیں: لین دین، اسٹینڈنگ رولز، فیڈ بیک نوٹ، کیلنڈر ایونٹس، تنازعات، رسیدیں، مہارتیں، جب کوئی ایجنٹ نیا سیشن شروع کرتا ہے، تو وہ اپنی ضرورت کی بازیافت کرتا ہے۔ جب یہ ختم ہو جاتا ہے، تو یہ جو کچھ سیکھا اسے محفوظ کرتا ہے۔

آج میرے Neotoma مثال میں ہستی کی سرفہرست 20 اقسام ہیں، ہر ایک کی مثال کے ساتھ:

ہستی کی قسممثال
ایجنٹ کے پیغامات"میرے ان باکس کو ٹرائیج کریں اور ٹیسٹر کے تاثرات پر عمل کریں"
وعدےسرمایہ کاروں کو مطلع کریں اگر فنڈنگ ​​کی حکمت عملی بدل جاتی ہے
کمپنیاںAcme ڈیزائن اسٹوڈیو، acme-studio.com
رابطےسارہ کم، sarah@example.com، Gmail سے درآمد کی گئی پھر جب بھی میں اس کے ساتھ بات چیت کرتا ہوں بڑھایا جاتا ہے
بات چیت"ای میل ٹریج 9 مارچ"
تنازعاترقم کی واپسی کا تنازعہ، 99 EUR، جائزہ میں
ای میل پیغامات"Re: شراکت کی تجویز،" مارچ 8
واقعاتسکول پلے ریہرسل، ہفتہ صبح 10 بجے، ملبوسات لائیں
تاثرات کے نوٹس"اسکیما کی دریافت کو بہتر دستاویزات کی ضرورت ہے،" ڈویلپر ریلیز
رسیدیںانوائس #2038، 1,450 EUR، گھر کی مرمت
لنکسLinkedIn, linkedin.com/in/username, social
مقاماتبارسلونا، سپین (گھر)
پوسٹسکیوں ایجنٹ میموری کو RAG، مضمون، شائع سے زیادہ کی ضرورت ہے۔
ترجیحاتPilates کلاس کی ادائیگیوں کے لیے میمو فیلڈ کو کبھی شامل نہ کریں
مستقل قواعدادائیگی کی تصدیق میں ہمیشہ لین دین کا لنک شامل کریں
ہنرfix-feature-bug: غلطی کی درجہ بندی کریں، ریگریشن ٹیسٹ شامل کریں، سویٹ چلائیں؛ ای میل ٹرائیج: پراسیس ان باکس، جوابات کا مسودہ، آرکائیو
ٹاسکس"مزاحمتی بینڈز خریدیں،" ہنگامی سطح کے ساتھ زیر التواء، ہیلتھ ڈومین
ٹائم لائن اندراجاتTechCrunch میں پروجیکٹ مینیجر، 2007-2009
لین دین0.0021 BTC ($178) مارچ کی خدمات کے لیے کارلوس کو ادا کیا گیا

ان سکیموں میں سے کوئی بھی پہلے سے ڈیزائن نہیں کیا گیا تھا۔ ایجنٹس ضرورت کے مطابق اسکیمے بناتے اور بڑھاتے ہیں جب انہیں نئی ​​قسم کی معلومات کا سامنا ہوتا ہے۔ سسٹم میں اب کل 170 ہستی کی قسمیں ہیں، جن میں سے زیادہ تر صرف مٹھی بھر ریکارڈ کے ساتھ ہیں۔ لمبی دم وہ جگہ ہے جہاں ایجنٹ کی یادداشت دلچسپ ہو جاتی ہے: ایک واحد تنازعہ ادارہ اس کی مکمل گفت و شنید کی تاریخ کے ساتھ، حکمت عملی تبدیل ہونے پر کسی کے ساتھ پیروی کرنے کا واحد عزم، کسی مخصوص ادائیگی کو کیسے ہینڈل کرنا ہے اس کے بارے میں ایک ترجیح۔

عملی فرق یہ ہے کہ ایجنٹ پہلے سے کام کرتے ہیں۔ جب میں کسی ایجنٹ سے کسی کو ای میل کرنے کے لیے کہتا ہوں، تو وہ پہلے رابطے کے لیے Neotoma تلاش کرتا ہے۔ جب میں اس سے تاثرات پر کارروائی کرنے کے لیے کہتا ہوں، تو یہ موجودہ فیڈ بیک اداروں کو بازیافت کرتا ہے اور نئے کو لنک کرتا ہے۔ جب میں اسے Bitcoin میں ایک ٹھیکیدار کو ادائیگی کرنے کے لیے کہتا ہوں، تو یہ اسٹینڈنگ قاعدہ کو جانتا ہے (اس شخص کو ہمیشہ BTC میں ادائیگی کریں) اور تصدیق میں لین دین کا لنک شامل کرتا ہے کیونکہ ایک اور مستقل اصول یہ کہتا ہے۔

اسٹوریج اور بازیافت قریب

Neotoma MCP ایسے ٹولز کو بے نقاب کرتا ہے جنہیں ایجنٹ براہ راست کال کرتے ہیں۔ عملی طور پر حقیقی ذخیرہ اور بازیافت کیسا لگتا ہے۔

جب کسی ایجنٹ کو نکالے گئے اداروں کے ساتھ بات چیت کے موڑ کو جاری رکھنے کی ضرورت ہوتی ہے، تو یہ ایک ہی پے لوڈ کے ساتھ 'اسٹور' کہتا ہے:

json اسٹور({ "ہستی": [ { "entity_type": "گفتگو"، "title": "ای میل ٹرائیج 9 مارچ کو" }، { "entity_type": "ایجنٹ_پیغام"، "role": "صارف" "content": "میرے ان باکس کو ٹرائیج کریں"، "turn_key": "conv-42:1" }، { "entity_type": "رابطہ"، "full_name": "ایلیکس چن"، "ای میل": "alex@example.com"، "source": "ٹیسٹر فیڈ بیک کال" }، { "entity_type": "ٹاسک"، "title": "ایلیکس کے تاثرات پر عمل کریں", "status": "زیر التواء" "ترجیح": "درمیانی" } ]، "رشتے": [ { "relationship_type": "PART_OF"، "ذریعہ_انڈیکس": 1، "ٹارگٹ_انڈیکس": 0 }، { "relationship_type": "REFERS_TO"، "ذریعہ_انڈیکس": 1، "ٹارگٹ_انڈیکس": 2 }، { "relationship_type": "REFERS_TO"، "ذریعہ_انڈیکس": 1، "ٹارگٹ_انڈیکس": 3 } ]، "idempotency_key": "conv-42-turn-1-triage" })

ایک کال گفتگو، پیغام، ایک نیا رابطہ، اور ایک ٹاسک کو محفوظ کرتی ہے، یہ سب ٹائپ کردہ رشتوں سے منسلک ہوتے ہیں۔ ایجنٹ کو پہلے سے 'رابطہ' یا 'ٹاسک' کے لیے اسکیما کی تعریف کی ضرورت نہیں تھی۔ نیوٹوما صوابدیدی شعبوں کو قبول کرتا ہے اور ساخت کا اندازہ لگاتا ہے۔

جب کسی ایجنٹ کو جواب دینے سے پہلے سیاق و سباق کی ضرورت ہوتی ہے، تو وہ شناخت کنندہ کے ذریعے سوال کرتا ہے:

json retrieve_entity_by_identifier({ "شناخت کنندہ": "ایلیکس چن" })

یہ ای میل، پہلے کی بات چیت، اور ہر فیلڈ کی اصلیت کے ساتھ رابطے کا ریکارڈ واپس کرتا ہے۔ اگر ایجنٹ کو وسیع تر سیاق و سباق کی ضرورت ہے، تو وہ قسم کے لحاظ سے سوال کرتا ہے:

json retrieve_entities({ "entity_type": "فیڈ بیک_نوٹ"، "search": "ڈیولپر ریلیز"، "حد": 10 })

یہ ڈیولپر کی ریلیز کے بارے میں دس سب سے زیادہ متعلقہ فیڈ بیک نوٹ واپس کرتا ہے، ہر ایک اپنی مکمل سنیپ شاٹ اور مشاہدے کی تاریخ کے ساتھ۔

مستقل قواعد کے لیے، ایجنٹ انہیں کام کے بہاؤ کے آغاز پر ایک بار بازیافت کرتا ہے:

json retrieve_entities({ "entity_type": "قائم_قاعدہ" })

میری مثال میں "ہمیشہ کارلوس کو بٹ کوائن میں ادائیگی کریں" اور "مارک ڈاؤن بلاکس میں مسودہ تیار کردہ پیغامات فراہم کریں" جیسے اصول لوٹاتا ہے۔ ایجنٹ ان کو بقیہ سیشن کے لیے خود بخود لاگو کرتا ہے۔

جب ورک فلو فائلوں کو ٹچ کرتا ہے (رسیدیں، اسکرین شاٹس، دستاویزات)، تو ایجنٹ انہیں 'file_path' کا استعمال کرتے ہوئے ایک ہی کال میں اداروں کے ساتھ اسٹور کرتا ہے:

json اسٹور({ "ہستی": [ { "entity_type": "لین دین"، "vendor": "ایمیزون"، "رقم": 47.99، "کرنسی": "EUR" } ]، "file_path": "/path/to/receipt.pdf", "idempotency_key": "amazon-order-march-9" })

نیوٹوما کا غیر ساختہ اسٹوریج پاتھ وہاں سے فائل کو ہینڈل کرتا ہے۔ خام بائٹس مواد ایڈریس (SHA-256) ہیں لہذا ایک ہی فائل کو کبھی بھی دو بار ذخیرہ نہیں کیا جاتا ہے۔ ایجنٹ فائل کو 'فائل_پاتھ' (مقامی ماحول جیسے کرسر) یا 'فائل_مواد' (بیس 64، ویب پر مبنی ماحول کے لیے) کے ذریعے منتقل کرتا ہے۔ یہ ذخیرہ کرنے سے پہلے ڈیٹا کی ترجمانی نہیں کرتا ہے اور نہ ہی نکالتا ہے۔ پہلے سے طے شدہ طور پر، Neotoma ذخیرہ شدہ فائل پر خود بخود AI تشریح چلاتا ہے، ساختی ہستیوں کو نکالتا ہے اور انہیں EMBEDS تعلق کے ساتھ واپس ماخذ سے جوڑتا ہے۔ اسی فائل کو تشریح: سچ کے ساتھ دوبارہ ذخیرہ کرنے سے ڈپلیکیٹ بنائے بغیر دوبارہ تشریح شروع ہو جاتی ہے۔ رسید اصل پی ڈی ایف کے ساتھ استفسار کے قابل ڈھانچہ ڈیٹا بن جاتی ہے جو پرویننس کے لیے محفوظ ہے۔ بیچ پروسیسنگ یا کوٹہ کے انتظام کے لیے تشریح کو بھی موخر کیا جا سکتا ہے (تشریح: غلط)، پھر بعد میں مختلف کنفیگریشن کے ساتھ چلائیں۔

عملی طور پر ورک فلو

کچھ ورک فلو پیٹرن کو ظاہر کرتے ہیں۔

ای میل ٹرائیج۔ ایجنٹ بغیر پڑھے ہوئے ای میلز کو Gmail MCP کے ذریعے پڑھتا ہے، ہر بھیجنے والے کے ساتھ موجودہ رابطے کے ریکارڈ اور سابقہ ​​سیاق و سباق کے لیے Neotoma کو چیک کرتا ہے، میرے کمیونیکیشن اسٹائل کے اصولوں کا استعمال کرتے ہوئے جوابات کا مسودہ تیار کرتا ہے، نئے رابطوں اور کاموں کو اسٹور کرتا ہے، اور پروسیس شدہ پیغامات کو محفوظ کرتا ہے۔ ایک ہی ٹرائیج رن پانچ نئے رابطوں، تین کاموں، اور گفتگو کے ایک درجن موڑ کو محفوظ کر سکتا ہے۔

بلاگ پوسٹ لکھنا۔ ہنر خود نیوٹوما میں ایک منظم وجود کے طور پر رہتا ہے۔ ایجنٹ اسے retrieve_entity_snapshot کے ساتھ بازیافت کرتا ہے۔ اس کے بعد یہ اسٹائل کیلیبریشن کے لیے موجودہ پوسٹس سے استفسار کرتا ہے، مسودہ لکھتا ہے، تمام میٹا ڈیٹا کے ساتھ پوسٹ ہستی کو اسٹور کرتا ہے، ہیرو امیجز تیار کرتا ہے، Twitter اور LinkedIn کے لیے شیئر کاپی بناتا ہے، Neotoma ایکسپورٹ سے ویب سائٹ کیشے کو دوبارہ تخلیق کرتا ہے، اور تعینات کرتا ہے۔ یہ پوسٹ اسی طرح لکھی گئی۔

بٹ کوائن کی ادائیگیاں۔ میں ایک ٹھیکیدار کو بٹ کوائن میں [ایک BTC والیٹ MCP سرور] (/posts/agentic-wallets-mcp-bitcoin) کا استعمال کرتے ہوئے ادائیگی کرتا ہوں۔ Neotoma کھڑے اصول، رابطہ ریکارڈ، اور لین دین کی تاریخ کو ذخیرہ کرتا ہے۔ ایجنٹ تینوں کو بازیافت کرتا ہے، ادائیگی کو انجام دیتا ہے، نئے لین دین کو آن چین لنک کے ساتھ اسٹور کرتا ہے، اور تصدیق کرتا ہے۔

فیڈ بیک پروسیسنگ۔ جب ٹیسٹرز نیوٹوما ڈویلپر کی ریلیز پر رائے دیتے ہیں، تو ایجنٹ ساختی فیڈ بیک ہستیوں کو نکالتے ہیں، انہیں ٹیسٹر کے رابطہ ریکارڈ سے جوڑتے ہیں، فیڈ بیک کو بالٹی کے ذریعے درجہ بندی کرتے ہیں، اور ریلیز کے مرحلے کی رکاوٹوں کے خلاف اس کا اندازہ لگاتے ہیں۔ پیشگی تاثرات ٹیسٹر، بالٹی، یا تاریخ کے ذریعے بازیافت کیے جا سکتے ہیں۔

ویب سائٹ کی تعیناتی۔ تعیناتی مہارت مقامی مارک ڈاؤن ایڈیٹس کو نیوٹوما میں ہم آہنگ کرتی ہے، مکمل ویب سائٹ ڈیٹاسیٹ برآمد کرتی ہے، کیشے کو دوبارہ تخلیق کرتی ہے، ویب سائٹ ریپو کو آگے بڑھاتی ہے، اور GitHub Actions کامیاب ہونے تک مانیٹر کرتی ہے۔ اگر تعمیر ناکام ہو جاتی ہے، تو ایجنٹ لاگز پڑھتا ہے، مسئلہ کو ٹھیک کرتا ہے، اور دوبارہ چلتا ہے۔

ان ایجنٹوں کی طرف جو میرے بغیر چلتے ہیں۔

ہر ورک فلو میرے ساتھ کرسر ایجنٹ کھولنے اور ایک ہدایات ٹائپ کرنے سے شروع ہوتا ہے۔ میں ہر کام کے لیے تیار ہوں۔ یہ موجودہ مرحلے کے لیے ٹھیک ہے، لیکن یہ آخری حالت نہیں ہے۔

میں خودکار عمل ترتیب دے رہا ہوں تاکہ ایجنٹ میری براہ راست شمولیت کے بغیر ورک فلو کو سنبھال سکیں۔ ٹکڑے پہلے سے موجود ہیں: مہارتیں مکمل ورک فلو کے مراحل کی وضاحت کرتی ہیں، Neotoma سیاق و سباق اور قواعد کو ذخیرہ کرتا ہے، MCP سرورز رسائی فراہم کرتے ہیں۔ جو چیز غائب ہے وہ آرکیسٹریشن ہے جو شیڈول پر یا واقعات کے جواب میں ورک فلو کو متحرک کرتی ہے، اور ایک ہلکا پھلکا منظوری والا انٹرفیس ہے تاکہ میں اپنے لیپ ٹاپ پر بیٹھے بغیر کارروائیوں کا جائزہ لے سکوں اور ان کی اجازت دے سکوں۔

Neotoma کا پرتوں والا فن تعمیر بالکل اسی کے لیے ڈیزائن کیا گیا ہے۔ یہ تین خدشات کو الگ کرتا ہے:

  1. سچائی کی تہہ (نیوٹوما)۔ واقعہ سے منبع شدہ، کم کرنے والے سے چلنے والا، فیصلہ کن۔ تمام ایجنٹ اس سے پڑھتے ہیں۔ ریاستی اپ ڈیٹس صرف ڈومین ایونٹس کے ذریعے ہوتی ہیں جن پر ریڈوسر کے ذریعے کارروائی کی جاتی ہے۔ کوئی ایجنٹ سچائی کو براہ راست تبدیل نہیں کرتا ہے۔
  2. حکمت عملی کی تہہ۔ نیوٹوما سے موجودہ عالمی حالت کو پڑھتی ہے۔ ترجیحات، رکاوٹوں، خطرے، وعدوں اور وقت کا اندازہ لگاتا ہے۔ فیصلوں اور احکامات کو آؤٹ پٹ کرتا ہے۔ خالص ادراک: ریاست میں، فیصلے باہر. کوئی سائیڈ ایفیکٹ نہیں۔
  3. Execution layer. حکمت عملی کی پرت سے کمانڈ لیتی ہے۔ بیرونی اڈاپٹر (ای میل APIs، ادائیگی کی خدمات، کیلنڈر، پیغام رسانی) کے ذریعے ضمنی اثرات انجام دیتا ہے۔ ڈومین کے واقعات کو بیان کرتا ہے کہ کیا ہوا ہے۔ وہ واقعات ریاست کو اپ ڈیٹ کرنے کے لیے ریڈوسر کے ذریعے واپس آتے ہیں۔ خالص اثر: حکم میں، واقعات باہر.

لوپ بند ہے:

ان باؤنڈ سگنلز (ای میل، واٹس ایپ، کیلنڈر، مالیاتی ڈیٹا) -> نارملائزیشن -> نیوٹوما اسٹیٹ (ایونٹ لاگ + کم کرنے والے) -> حکمت عملی ٹک (ترجیحات کا اندازہ کریں، آؤٹ پٹ فیصلے) -> پھانسی دینے والے ایجنٹ (ضمنی اثرات کو انجام دیتے ہیں، واقعات کو خارج کرتے ہیں) -> کم کرنے والے -> اپ ڈیٹ شدہ حالت -> اگلا ٹک

آج، میں حکمت عملی کی پرت ہوں۔ میں ریاست کو دیکھتا ہوں، فیصلہ کرتا ہوں کہ کیا کرنا ہے، اور ایک ایجنٹ سے کہتا ہوں کہ وہ عمل کرے۔ فن تعمیر اس کردار کو سافٹ ویئر کے ذریعہ بدلنے کے قابل بناتا ہے۔ ایک حکمت عملی کا انجن نیوٹوما کو پڑھتا ہے، اس بات کا جائزہ لیتا ہے کہ کس چیز پر توجہ دینے کی ضرورت ہے اس پر قائم قوانین اور ترجیحات، اور عمل درآمد کرنے والے ایجنٹوں کو حکم جاری کرتے ہیں۔ وہ ایجنٹ ایم سی پی سرورز کو کال کرتے ہیں، نتائج کو اسٹور کرتے ہیں، اور سائیکل دہرایا جاتا ہے۔

اہم تبدیلی یہ ہے کہ کوئی پرت نیوٹوما کے بنیادی ڈیٹا اسٹور کو براہ راست نہیں لکھتی ہے۔ اپ ڈیٹس صرف ڈومین ایونٹس اور کم کرنے والوں کے ذریعے چلتی ہیں۔ یہ نظام کو قابل سماعت اور الٹنے کے قابل بناتا ہے۔ اگر کوئی خود مختار ایجنٹ غلط فیصلہ کرتا ہے، تو میں اس واقعے کا سراغ لگا سکتا ہوں جس کی وجہ سے یہ ہوا، اسٹیٹ اپ ڈیٹ کو واپس کر سکتا ہوں، اور اس اصول کو درست کر سکتا ہوں جس کی وجہ سے یہ ہوا۔

مقصد یہ ہے کہ کمپیوٹر پر میرا یومیہ وقت کم کیا جائے۔ اسے ختم نہیں کرنا۔ ہینڈ آن ایگزیکیوشن سے نظرثانی اور منظوری کی طرف منتقل کریں۔ میں اس کے خلاصے کے لیے جاگنا چاہتا ہوں کہ میرے ایجنٹوں نے راتوں رات کیا کیا: ای میلز کی جانچ کی گئی، پوسٹس کا مسودہ تیار کیا گیا، تعیناتیوں کی تصدیق کی گئی، ادائیگیوں کی قطار لگی۔ میں اپنی Apple Watch سے بٹ کوائن کی ادائیگی منظور کرنا چاہتا ہوں۔ میں چلتے ہوئے اپنے فون پر ایک مسودہ ای میل کا جائزہ لینا چاہتا ہوں اور بھیجنے کے لیے تھپتھپائیں۔ ایجنٹ 80% کو ہینڈل کرتے ہیں جو دوبارہ قابل ہے۔ میں 20٪ کو ہینڈل کرتا ہوں جس کو فیصلے کی ضرورت ہے۔

یہ وہ جگہ ہے جہاں ہارڈ ویئر کا سوال دلچسپ ہو جاتا ہے۔ آج کے فون اور گھڑیاں اس بات چیت کے انداز کے لیے ڈیزائن نہیں کی گئی ہیں۔ آپ کو مختصر جائزہ لینے اور منظوری کے اشاروں کے لیے موزوں آلہ کی ضرورت ہے، نہ کہ ٹائپنگ یا براؤزنگ کے لیے۔

ان آلات میں سے جو آج موجود ہیں، Apple Watch صحیح فارم فیکٹر کے قریب محسوس ہوتا ہے: ہمیشہ آپ کی کلائی پر، نظر آنے کے قابل، سادہ تھپتھپانے سے منظور کرنے کے قابل۔ لیکن سافٹ ویئر کی پرت ابھی تک موجود نہیں ہے۔ ایجنٹ کے خلاصے اور منظوری کی درخواستوں کو اس انداز میں پائپ کرنے کا کوئی طریقہ نہیں ہے جو مقامی محسوس ہو۔

یہ میرے لیے کسی وقت تجربہ کرنے کا ایک علاقہ ہو سکتا ہے، ایک ہلکا پھلکا ساتھی ایپ بنانا جو Neotoma کی حالت کو کلائی کی سطح کے انٹرفیس تک پہنچاتا ہے۔ چاہے صحیح سطح ایک واچ ایپ، ایک وقف شدہ AI ڈیوائس، یا کوئی ایسی چیز ہو جو ابھی تک موجود نہیں ہے، تعامل کا ماڈل واضح ہے: ایجنٹ کام کرتے ہیں، ساختی یادداشت ریاست کو برقرار رکھتی ہے، اور انسان عمل کی رفتار کے بجائے ارادے کی رفتار سے سمت فراہم کرتا ہے۔

اسٹیک کو اوپن سورس کرنا

اسٹیک آج نجی ہے کیونکہ اس میں میری زندگی شامل ہے: رابطے، مالیات، صحت کا ڈیٹا، ذاتی مواصلات، اس بارے میں مستقل قواعد کہ میں اپنے گھر کو کیسے چلاتا ہوں۔ اس سے پہلے کہ میں اسے اوپن سورس کر سکوں، مجھے ان سب کو حل کرنے کی ضرورت ہے۔

راستہ سیدھا ہے۔ ذاتی ڈیٹا مکمل طور پر نیوٹوما میں منتقل ہوتا ہے، جو پہلے سے ہی اس میں سے بیشتر کے لیے سچائی کا ذریعہ ہے۔ اسکرپٹ جو میرے مخصوص اکاؤنٹس اور راستوں کا حوالہ دیتے ہیں ان کو کنفیگریشن سے پڑھنے کے لیے ری فیکٹر کیا جاتا ہے۔ MCP سرور ریپرز عام ہو جاتے ہیں۔ ہنر اپنے ہارڈ کوڈ شدہ مفروضوں کو کھو دیتے ہیں۔

جو باقی رہ جاتا ہے وہ دوبارہ قابل استعمال ایجنٹی اسٹیک ہے: MCP سرور اسکافولڈنگ کے ساتھ ایک monorepo ٹیمپلیٹ، ایک اصول اور مہارت کا فریم ورک، ساختی میموری کے لیے Neotoma انضمام، اور مثال کے طور پر ورک فلو جو کوئی بھی اپنا سکتا ہے۔ فن تعمیر ایک دلچسپ حصہ ہے۔ میرا ذاتی ڈیٹا نہیں ہے۔

میرے پاس اس کے لیے کوئی ٹائم لائن نہیں ہے۔ ری فیکٹرنگ روزانہ استعمال کے ساتھ ساتھ ہوتی ہے۔ جب بھی میں اسکرپٹ کو چھوتا ہوں، میں اسے زیادہ عام بناتا ہوں۔ جب بھی میں ڈیٹا کو Neotoma میں منتقل کرتا ہوں، میں اسے ریپو سے ہٹا دیتا ہوں۔ ہر سیشن کے ساتھ اسٹیک زیادہ پورٹیبل ہو جاتا ہے۔

یہ Neotoma کے بارے میں کیا ثابت کرتا ہے۔

میں نے اس اسٹیک کو نیوٹوما کے وجود سے پہلے بنایا تھا۔ ابتدائی ورژن میں فلیٹ فائلز اور Parquet ٹیبل استعمال کیے گئے تھے۔ اس نے کام کیا جب تک یہ نہیں ہوا۔

ناکامی کے طریقوں مخصوص تھے: ایک ایجنٹ ایک سیشن میں "سارہ کم" اور دوسرے سیشن میں "S. Kim" کے طور پر ایک رابطے کو اسٹور کرے گا، جس سے ان کو ضم کرنے کا کوئی طریقہ نہیں ہے۔ کوئی ثبوت نہیں تھا، لہذا میں یہ نہیں بتا سکتا تھا کہ کس ایجنٹ نے فیلڈ یا کب لکھا.

استفسارات واحد کالموں کے عین مطابق مماثلت تک محدود تھے، اس لیے یہ پوچھنا کہ "مجھے پچھلے ہفتے کیا فیڈ بیک ملا؟" مطلب ہر فائل کو دستی طور پر اسکین کرنا۔ کبھی کبھار ریکارڈز کو غلط طریقے سے اوور رائٹ کیا جاتا تھا یا مکمل طور پر حذف کر دیا جاتا تھا، جس سے بازیافت کرنے کے لیے کوئی ایونٹ لاگ نہیں ہوتا تھا۔ اور کچھ بھی مختلف اقسام سے منسلک نہیں ہے، لہذا یہ جانتے ہوئے کہ کسی لین دین سے متعلق رابطے سے متعلق کام کے لیے مجھے اس گراف کو اپنے سر میں رکھنے کی ضرورت ہے۔

نیوٹوما نے اس پرت کی جگہ لے لی۔ اس نے ایجنٹوں کو ایک سٹرکچرڈ، قابل استفسار، رشتہ سے آگاہ میموری دیا جو ہر ورک فلو میں کام کرتا ہے۔ اسٹیک میں اب نیوٹوما میں 170 ہستی کی قسمیں ہیں، اس لیے نہیں کہ میں نے 170 اسکیموں کو پہلے سے ڈیزائن کیا ہے، بلکہ اس لیے کہ ایجنٹ نئی قسم کی معلومات کا سامنا کرتے ہوئے ہستی کی قسمیں بناتے ہیں۔ فیڈ بیک نوٹ ایک ٹرانزیکشن سے مختلف ہوتا ہے جو ایک مستقل اصول سے مختلف ہوتا ہے، اور سسٹم ان سب کو ہینڈل کرتا ہے۔

یہ وہ dogfooding ہے جو Neotoma کو ایماندار رکھتی ہے۔ جب بازیافت سست ہوتی ہے، میں اسے ہر ایجنٹ سیشن میں محسوس کرتا ہوں۔ جب ہستی کی قرارداد ناکام ہوجاتی ہے، تو مجھے ڈپلیکیٹ رابطے ملتے ہیں۔ جب سٹوریج ناقابل بھروسہ ہو تو ورک فلو ٹوٹ جاتا ہے۔ میرے روزمرہ کے کام میں ہر بگ اور ہر خلا ظاہر ہوتا ہے اس سے پہلے کہ یہ کسی اور میں ظاہر ہو۔

یادداشت کا مسئلہ عالمگیر ہے۔ ایجنٹ ورک فلوز بنانے والا ہر ڈویلپر ایک ہی دیوار سے ٹکرائے گا: ایسے ایجنٹ جو یاد نہیں رکھ سکتے، استفسار نہیں کر سکتے، اور پہلے والے کام پر تعمیر نہیں کر سکتے۔ صرف بازیافت کافی نہیں ہے; ساخت اور پرووننس وہی ہیں جو میموری کو قابل اعتماد بناتے ہیں۔ یہ اسٹیک اس بات کا ثبوت ہے کہ ساختی میموری بدل جاتی ہے کہ ایجنٹ کیا کر سکتے ہیں۔ Neotoma یہ ہے کہ میں اسے سب کے لیے کیسے دستیاب کر رہا ہوں۔

ڈویلپر ریلیز جانچ کے لیے کھلا ہے۔ اگر آپ ایجنٹ ورک فلوز بنا رہے ہیں اور نیچے کی ساختی میموری چاہتے ہیں، تو یہیں سے شروع کرنا ہے۔

12 منٹ پڑھیںمضمون
شیئر کریں۔