[Shubham Saboo](https://x.com/Saboo_Shubham_) (ایک Google PM) [اوپن سورسڈ ایک ہمیشہ-آن میموری ایجنٹ](https://github.com/GoogleCloudPlatform/generative-ai/tree/main/gemini/agents/always-on-memory-agent as last week regenp-agent of Gp. [VentureBeat نے اس کا احاطہ کیا](https://venturebeat.com/orchestration/google-pm-open-sources-always-on-memory-agent-ditching-vector-databases-for) ایک سگنل کے طور پر کہ ایجنٹ کا انفراسٹرکچر کہاں جا رہا ہے۔ یہ ایک مستقل میموری سسٹم ہے جو 24/7 پس منظر کے عمل کے طور پر چلتا ہے، فائلوں کو ہضم کرتا ہے، ٹائمر کو مضبوط کرتا ہے، اور سوالات کا جواب دیتا ہے۔ کوئی ویکٹر ڈیٹا بیس نہیں ہے۔ کوئی سرایت نہیں ہے۔ صرف ایک LLM جو SQLite میں ساختی میموری کو پڑھتا، سوچتا اور لکھتا ہے۔

پروجیکٹ کسی ایسی چیز کی توثیق کرتا ہے جسے میں [Neotoma](https://github.com/markmhendrickson/neotoma) کے ساتھ بنا رہا ہوں: ایجنٹوں کے لیے مستقل یادداشت ایک حقیقی اور بڑھتی ہوئی ضرورت ہے۔ لیکن دونوں منصوبے مخالف تعمیراتی انتخاب کرتے ہیں۔ یہ پوسٹ ان کا موازنہ کرتی ہے۔

## ہمیشہ آن میموری ایجنٹ کیا ہے؟

پروجیکٹ ایک حوالہ عمل درآمد ہے جسے [Google ADK (Agent Development Kit)](https://google.github.io/adk-docs/) اور [Gemini 3.1 Flash-Lite](https://ai.google.dev/gemini-api/docs/models) کے ساتھ بنایا گیا ہے۔ یہ تین ماہر ذیلی ایجنٹوں کے ساتھ ہلکے وزن کے پس منظر کے عمل کے طور پر چلتا ہے: ایک ادخال کے لیے، ایک استحکام کے لیے، اور ایک استفسار کے لیے۔

1. **انجیشن۔** فائل دیکھنے والا ان باکس ڈائرکٹری کی نگرانی کرتا ہے۔ ایک فائل اندر ڈالیں اور ایجنٹ اسے اٹھا لے۔ یہ HTTP POST کے ذریعے ان پٹ کو بھی قبول کرتا ہے۔ یہ متن، تصاویر، آڈیو، ویڈیو اور پی ڈی ایف کو ہینڈل کرتا ہے۔ LLM خلاصے، اداروں، موضوعات، اور اہمیت کے اسکور نکالتا ہے۔

2. **کنسولیڈیشن۔** ٹائمر پر، کنسولیڈیشن ایجنٹ تمام ذخیرہ شدہ یادوں کو پڑھتا ہے، ان میں کنکشن اور پیٹرن تلاش کرتا ہے، متعلقہ اشیاء کو کمپریس کرتا ہے، اور نئی ترکیب شدہ بصیرتیں لکھتا ہے۔ یہ بغیر اشارہ کیے پس منظر میں چلتا ہے۔

3. **سوال۔** آپ ایک سوال پوچھتے ہیں۔ استفسار کرنے والا ایجنٹ متعلقہ یادوں اور جامع بصیرت کو پڑھتا ہے، جواب کی ترکیب کرتا ہے، اور اسے مخصوص میموری ریکارڈز میں حوالہ جات کے ساتھ واپس کرتا ہے۔

اسٹوریج SQLite ہے۔ کوئی ویکٹر ڈیٹا بیس نہیں، ایمبیڈنگ انڈیکس نہیں۔ آرکیٹیکچر شرط لگاتا ہے کہ ایل ایل ایم مماثلت کی تلاش کی ضرورت کے بغیر ساختی ٹیکسٹ ریکارڈز پر براہ راست بازیافت کو سنبھال سکتا ہے۔

## جہاں یہ سبقت لے جاتا ہے۔

**سادگی۔** ریپو کو کلون کریں، ایک Gemini API کی سیٹ کریں، اسے چلائیں۔ فائل واچر، HTTP API، اور ایک Streamlit ڈیش بورڈ۔ کم سے کم انحصار اور واحد عمل سے باہر انتظام کرنے کے لیے کوئی بنیادی ڈھانچہ نہیں۔ جیمنی کے ساتھ ایجنٹ میموری کو تلاش کرنے والے ڈویلپرز کے لیے، یہ کام کرنے والے ڈیمو کا تیز ترین راستہ ہے۔

**"کوئی ویکٹر DB" بیانیہ۔** ویکٹر ڈیٹا بیس کو ہٹانے سے آپریشنل اور تصوراتی پیچیدگی کم ہوتی ہے۔ منتخب کرنے کے لیے کوئی ایمبیڈنگ ماڈل نہیں، برقرار رکھنے کے لیے کوئی انڈیکس نہیں، کوئی بازیافت ٹیوننگ نہیں۔ چھوٹے پیمانے پر تعیناتیوں کے لیے یہ ایک حقیقی آسان کاری ہے۔

**ایکٹو کنسولیڈیشن۔** ٹائمر پر مبنی کنسولیڈیشن سب سے مخصوص حصہ ہے۔ زیادہ تر میموری سسٹم غیر فعال ہیں: چیزیں ذخیرہ کریں، چیزیں بازیافت کریں۔ یہ فعال طور پر جوڑتا ہے، کمپریس کرتا ہے اور ترکیب کرتا ہے۔ یہ ایسے نمونے تلاش کرتا ہے جن کے بارے میں آپ نے نہیں پوچھا۔ یہ ہر اس شخص کے ساتھ گونجتا ہے جو انتظار کرنے والی یادداشت کے بجائے "سوچنے والی یادداشت" چاہتا ہے۔

## جہاں راستے الگ ہوتے ہیں۔

ہمیشہ آن میموری ایجنٹ اور نیوٹوما ایک مقصد (مسلسل ایجنٹ میموری) کا اشتراک کرتے ہیں لیکن تقریباً ہر ڈیزائن کے فیصلے سے ہٹ جاتے ہیں۔ اختلاف اتفاقی نہیں ہیں۔ وہ مختلف ابتدائی احاطے کی عکاسی کرتے ہیں کہ میموری کو کس چیز کے لیے بہتر بنانا چاہیے۔

### خودکار بمقابلہ واضح ادخال

فائل دیکھنے والا خودکار ہے۔ ان باکس میں جو کچھ بھی آتا ہے اس پر کارروائی ہوتی ہے۔ کوئی منظوری کا مرحلہ نہیں ہے، کوئی سکیما فرسٹ توثیق نہیں ہے، LLM کے نچوڑ اور اسٹورز سے پہلے صارف کی تصدیق نہیں ہے۔ Neotoma مخالف نقطہ نظر اختیار کرتا ہے: کوئی بھی چیز سسٹم میں داخل نہیں ہوتی جب تک کہ کوئی ایجنٹ یا صارف اسے MCP کے ذریعے واضح طور پر نہ لکھے۔ ذاتی نوٹ کے لیے، خودکار ادخال آسان ہے۔ رازداری یا تعمیل کے تقاضوں کے ساتھ کسی بھی چیز کے لیے، واضح کنٹرول زیادہ محفوظ ڈیفالٹ ہے۔

### کون فیصلہ کرتا ہے کہ کیا یاد رکھنا ہے۔

نیوٹوما میموری اسٹوریج کو کال کرنے کے لیے کلائنٹ ایجنٹ پر انحصار کرتا ہے۔ آپ جس ایجنٹ سے بات کر رہے ہیں (ChatGPT, Claude, Cursor) فیصلہ کرتا ہے کہ کیا یاد رکھنے کے قابل ہے اور اس کی ساخت کیسے بنائی جائے۔ جب یہ نتیجہ اخذ کرتا ہے کہ کوئی حقیقت، رابطہ، یا کام برقرار رہنا چاہیے، تو یہ MCP کے ذریعے سٹور آپریشن کا مطالبہ کرتا ہے۔ "کیا یاد رکھنا ہے" کی ذمہ داری ایجنٹ کی پرت میں رہتی ہے، اسی عمل میں جس طرح آپ کی گفتگو ہوتی ہے۔

ہمیشہ آن میموری ایجنٹ اس ذمہ داری کو ماہر ذیلی ایجنٹوں میں تقسیم کرتا ہے۔ ادخال ایجنٹ فیصلہ کرتا ہے کہ فائلوں سے کیا نکالنا ہے۔ کنسولیڈیشن ایجنٹ فیصلہ کرتا ہے کہ کیا ضم کرنا ہے اور کن کنکشنز کو کھینچنا ہے۔ استفسار کرنے والا ایجنٹ فیصلہ کرتا ہے کہ کیا واپس کرنا ہے۔ "کیا یاد رکھنے کے قابل ہے" اور "کیسے" کو ان ذیلی ایجنٹوں میں تقسیم کیا جاتا ہے، جو گفتگو سے آزادانہ طور پر چلتے ہیں۔ صارف ہر فیصلے کو منظور نہیں کرتا ہے۔ ذیلی ایجنٹ انہیں پس منظر میں بناتے ہیں۔

### LLM سے چلنے والا بمقابلہ عزمی نکالنا

ہمیشہ آن میموری ایجنٹ ہر چیز کے لیے LLM استعمال کرتا ہے: ہستیوں کو نکالنا، اہمیت تفویض کرنا، خلاصے تیار کرنا۔ ایک ہی فائل پر ایک ہی نکالنے کو دو بار چلائیں اور نتائج مختلف ہو سکتے ہیں۔ Neotoma استعمال کرتا ہے [schema-first deterministic extraction](/posts/truth-layer-agent-memory)۔ ایک ہی ان پٹ ایک جیسی ہستی، وہی کینونیکل IDs، ایک جیسے رشتے پیدا کرتا ہے۔ اختیاری LLM تشریح اس تعییناتی پرت کے اوپر چلتی ہے، اس کی جگہ پر نہیں۔

### یکجہتی بمقابلہ ناقابل تغیر سچائی

کنسولیڈیشن ایجنٹ فیصلہ کرتا ہے کہ کس چیز کو ضم کرنا ہے، کن کنکشنز کو کھینچنا ہے، اور کس چیز کو سکیڑنا ہے۔ یہ وقت کے ساتھ میموری کو تبدیل کرتا ہے۔ پرانی یادیں نئی ​​ترکیب شدہ بصیرت میں جذب ہو جاتی ہیں۔ نیوٹوما مضبوط نہیں ہوتا ہے۔ یہ مل جاتا ہے۔ ہر مشاہدہ ناقابل تغیر ہے۔ تاریخ واقعہ سے ماخوذ ہے۔ اگر آپ کو یہ دیکھنے کی ضرورت ہے کہ کیا بدلا، کب، اور کیوں، مکمل ٹریل موجود ہے۔ کچھ بھی اوور رائٹ یا کمپریسڈ نہیں ہے۔

### سنگل پلیٹ فارم بمقابلہ کراس پلیٹ فارم

پروجیکٹ Gemini اور Google ADK پر بنایا گیا ہے۔ میموری صرف اس مخصوص ایجنٹ اسٹیک کے ذریعے قابل رسائی مقامی SQLite فائل میں رہتی ہے۔ Neotoma MCP کے ذریعے میموری کو بے نقاب کرتا ہے، جس کا مطلب ہے کہ وہی ادارے ChatGPT، Claude، Cursor، اور کسی دوسرے MCP کے موافق ٹول سے قابل رسائی ہیں۔ ایک میموری پرت، متعدد صارفین۔

### کوئی اصل بمقابلہ مکمل نسب

ہمیشہ آن میموری ایجنٹ میں میموری کے ریکارڈ میں خلاصے اور نکالے گئے اداروں پر مشتمل ہوتا ہے لیکن وہ مخصوص فائل، لائن، یا سیشن کا سراغ نہیں لگاتے جس نے انہیں بنایا تھا۔ اگر ایک جامع بصیرت غلط ہے، تو پیروی کرنے کے لیے کوئی آڈٹ ٹریل نہیں ہے۔ نیوٹوما میں، ہر ہستی پر موجود ہر فیلڈ ایک ماخذ کے مشاہدے کا سراغ لگاتا ہے۔ آپ کسی بھی حقیقت کا آڈٹ کر سکتے ہیں جہاں سے آیا ہے۔

### پیمانے پر تجارت

ایمبیڈنگز یا ویکٹر انڈیکس کے بغیر، سسٹم LLM کا استعمال کرتے ہوئے ساختی ٹیکسٹ ریکارڈز کو براہ راست پڑھتا ہے۔ یہ چھوٹے پیمانے پر کام کرتا ہے۔ جیسے جیسے میموری اسٹورز بڑھتے ہیں، نقطہ نظر برقرار نہیں رہ سکتا ہے۔ ویکٹر ڈی بی کو ہٹانے سے بازیافت ڈیزائن نہیں ہٹتا ہے۔ یہ پیچیدگی کو ایل ایل ایم سیاق و سباق کی ونڈو میں منتقل کرتا ہے۔ نیوٹوما ٹائپ شدہ اداروں پر سٹرکچرڈ استفسارات کا استعمال کرتا ہے، جو LLM سیاق و سباق کی حدود سے آزادانہ طور پر اسکیل کرتے ہیں۔

## سبسٹریٹ بمقابلہ ایجنٹ

سب سے واضح فرق کردار ہے۔ ہمیشہ آن میموری ایجنٹ ایک ایجنٹ ہے۔ یہ خود بخود ہضم ہو جاتا ہے، ایک شیڈول پر مستحکم ہوتا ہے، اور جوابات کی ترکیب کرتا ہے۔ اس کا اپنا استدلال لوپ ہے۔ یہ فیصلہ کرتا ہے کہ کیا ضم کرنا ہے، کن کنکشنز کو کھینچنا ہے، اور کب کمپریس کرنا ہے۔

Neotoma ایک ایجنٹ نہیں ہے. یہ سبسٹریٹ ہے۔ یہ کینونیکل IDs کے ساتھ ٹائپ شدہ اداروں کو اسٹور کرتا ہے۔ یہ اصلیت کو برقرار رکھتا ہے۔ یہ تعییناتی سوالات کا جواب دیتا ہے۔ یہ خود کسی چیز کا فیصلہ نہیں کرتا۔ کوئی پس منظر ادخال نہیں۔ کوئی خودکار کنسولیڈیشن نہیں۔ ٹائمر پر مبنی پروسیسنگ نہیں ہے۔ ایجنٹ اس سے پڑھتے ہیں اور اسے [MCP](/posts/agentic-search-and-the-truth-layer) کے ذریعے لکھتے ہیں۔ استدلال ایجنٹ کی پرت میں ہوتا ہے۔ سچائی سبسٹریٹ میں رہتی ہے۔

یہ اس لیے اہمیت رکھتا ہے کہ جب ایجنٹ غلط ہوتا ہے تو کیا ہوتا ہے۔ اگر ہمیشہ آن میموری ایجنٹ کا استحکام خراب بصیرت پیدا کرتا ہے، تو وہ بصیرت اب میموری کا حصہ ہے۔ کے خلاف تصدیق کے لیے کوئی الگ پرت نہیں ہے۔ ایجنٹ سچ ہے۔

نیچے سچائی کی پرت کے ساتھ، آپ اس بات کا پتہ لگا سکتے ہیں کہ ایجنٹ نے کیا پڑھا، اسے کب پڑھا، اور اس نے واپس کیا لکھا۔ اگر نئی بصیرت غلط ہے، تو آپ واپس جا سکتے ہیں۔ کنسولیڈیشن ایجنٹ کا آؤٹ پٹ ڈیٹرمنسٹک سٹیٹ کے اوپر ایک مشاہدہ ہے، اس کا میوٹیشن نہیں۔

| طول و عرض | ہمیشہ آن میموری ایجنٹ | سچائی کی تہہ (نیوٹوما) |
|------------|--------------------------------------|-------------------------|
| کردار | استدلال لوپ کے ساتھ ایجنٹ | بغیر ایجنٹ کے رویے کے سبسٹریٹ |
| کون فیصلہ کرتا ہے کہ کیا ذخیرہ کرنا ہے | سپیشلسٹ سب ایجنٹس (انجیکشن، کنسولیڈیشن) | کلائنٹ ایجنٹ (MCP کے ذریعے) |
| ادخال | خودکار (فائل دیکھنے والا، API) | صرف واضح (MCP، CLI، اپ لوڈ) |
| نکالنا | ایل ایل ایم سے چلنے والا؛ امکانی | سکیما پہلے؛ تعین پرست |
| استحکام | ٹائمر پر مبنی LLM کنسولیڈیشن | کوئی نہیں؛ ناقابل تغیر سچائی، واقعہ سے حاصل شدہ اپ ڈیٹس |
| پرووننس | بنیادی (ریکارڈ میں ماخذ/ خلاصہ) | مکمل نسب؛ ہر فیلڈ سورس |
| پلیٹ فارم | Gemini/Google ADK صرف | کراس پلیٹ فارم بذریعہ MCP (ChatGPT، کلاڈ، کرسر) |
| رازداری | پرائیویسی فرسٹ کے طور پر پوزیشن میں نہیں ہے | صارف کے زیر کنٹرول؛ فراہم کنندہ تک رسائی نہیں |
| رول بیک | نہیں؛ میموری کو یکجا کرنے سے تبدیل کیا جاتا ہے | ہاں؛ صرف ضمیمہ، ورژن شدہ، قابل واپسی |
| اسکیل ماڈل | LLM تمام ریکارڈ پڑھتا ہے۔ سیاق و سباق سے منسلک | ٹائپ شدہ اداروں سے متعلق سٹرکچرڈ سوالات |

## وہ کیسے مل کر کام کر سکتے ہیں۔

دونوں نقطہ نظر ایک دوسرے سے الگ نہیں ہیں۔ ایک کنسولیڈیشن ایجنٹ اور سچائی پرت مختلف مسائل کو حل کرتی ہے۔ ایک پیٹرن تلاش کرتا ہے. دوسرا اعتماد برقرار رکھتا ہے۔ دلچسپ فن تعمیر دونوں کو یکجا کرتا ہے۔

خاکہ سیدھا ہے۔ ایک کنسولیڈیشن ایجنٹ (جیسا کہ ہمیشہ آن میموری ایجنٹ میں) MCP کے ذریعے سچائی پرت سے اداروں کو پڑھتا ہے۔ اسے مکمل ساختی حالت تک رسائی حاصل ہے: ٹائپ شدہ ہستی، رشتے، ٹائم لائنز، پرووینس۔ یہ اس حالت پر اپنا پیٹرن تلاش کرنے والا لوپ چلاتا ہے، کنکشن، خلا، یا بصیرت کی تلاش میں جس کے لیے صارف نے نہیں پوچھا۔ جب اسے کچھ مل جاتا ہے، تو وہ اس کے ماخذ اداروں اور استدلال کے ساتھ ٹیگ کرکے ایک نئے مشاہدے کے طور پر نتیجہ کو سچائی کی تہہ پر واپس لکھتا ہے۔

سچائی کی تہہ اس بصیرت کے ساتھ اسی طرح برتاؤ کرتی ہے جس طرح کسی دوسری تحریر کے ساتھ سلوک کرتی ہے۔ یہ اسے مکمل ثبوت کے ساتھ مشاہدے کے طور پر ریکارڈ کرتا ہے: ایجنٹ نے کن اداروں کو پڑھا، کب، اس نے کیا نتیجہ اخذ کیا۔ بصیرت ہستی کے گراف کا حصہ بن جاتی ہے۔ اگر بصیرت غلط ہے تو، آپ بالکل دیکھ سکتے ہیں کہ ایجنٹ نے کیا کھایا، استدلال کا پتہ لگانا، اور مشاہدے کو ان بنیادی ہستیوں کو متاثر کیے بغیر واپس کر سکتے ہیں جن سے اس نے پڑھا ہے۔

یہ اس سے مختلف ہے کہ آج کل ہمیشہ آن میموری ایجنٹ میں کنسولیڈیشن کیسے کام کرتا ہے۔ وہاں، استحکام کا ایجنٹ براہ راست میموری کو تبدیل کرتا ہے۔ پرانی یادیں نئے ترکیبی ریکارڈ میں جذب ہو جاتی ہیں۔ پچھلی حالت ختم ہوگئی۔ اگر ترکیب غلط تھی، تو موازنہ کرنے کے لیے کوئی الگ پرت نہیں ہے۔

نیچے سچائی کی تہہ کے ساتھ، استحکام ایک غیر تباہ کن عمل بن جاتا ہے۔ ایجنٹ تعبیر کی ایک تہہ کو تعبیری حالت کے اوپر جوڑتا ہے۔ ریاست خود غیر متغیر رہتی ہے۔ آپ کو آڈٹ ایبلٹی اور رول بیک (سچ لیئر کی طاقت) کے فوائد کے ساتھ فعال پیٹرن کی دریافت (ہمیشہ آن میموری ایجنٹ کی طاقت) کے فوائد حاصل ہوتے ہیں۔ اوپر ذہانت، نیچے بھروسہ۔

## یہ کیا توثیق کرتا ہے۔

ہمیشہ آن میموری ایجنٹ ایک حوالہ پر عمل درآمد ہے، پروڈکٹ نہیں۔ یہ جو تصدیق کرتا ہے وہ یہ ہے کہ مستقل، متحرک ایجنٹ میموری کی مانگ حقیقی ہے۔ "[ویکٹر DB پلس RAG](/posts/why-agent-memory-needs-more-than-rag)" واحد بازیافت ماڈل نہیں ہے۔ [اس کو چلانے والے ساختی رجحانات](/posts/six-agentic-trends-betting-on) واضح ہیں: ایجنٹ ریاستی ہوتے جا رہے ہیں، غلطیاں قیمتیں وصول کر رہی ہیں، اور پلیٹ فارم مبہم ہیں۔ پروجیکٹ اس بات کا اشارہ کرتا ہے کہ انڈسٹری ہمیشہ آن میموری سسٹمز کی طرف بڑھ رہی ہے جو سادہ اسٹوریج اور بازیافت سے آگے ہے۔

جہاں دونوں منصوبے متفق ہیں: غیر فعال میموری کافی نہیں ہے۔ جہاں وہ متفق نہیں ہیں: چاہے میموری کی پرت کو خود ہی استدلال کرنا چاہئے، یا استدلال کو ایک الگ پرت میں ڈیٹرمینسٹک حالت کے اوپر ہونا چاہئے۔ یہ ابھی ایجنٹ میموری فن تعمیر میں ایک بنیادی سوال ہے۔ مارکیٹ ممکنہ طور پر دونوں طریقوں کی حمایت کرے گی۔ میں توقع کرتا ہوں کہ فن تعمیر ان مضبوطی کے ایجنٹوں پر اکٹھا ہو سکتا ہے جو سوچتے ہیں، سچائی کی تہوں کے اوپر چلتے ہوئے آپ پر بھروسہ کر سکتے ہیں۔

## جو میں بنا رہا ہوں۔

میں [Neotoma](https://github.com/markmhendrickson/neotoma) کو ٹرسٹ لیئر کے طور پر بنا رہا ہوں۔ ٹائپ شدہ ہستی، کینونیکل IDs، تعییناتی انضمام، پرووینس، MCP کے ذریعے کراس پلیٹ فارم تک رسائی۔ میں اسے روزانہ ChatGPT، Claude، اور Cursor پر استعمال کرتا ہوں۔ [ڈیولپر ریلیز](/posts/neotoma-developer-release) اب [neotoma.io](https://neotoma.io) پر دستیاب ہے۔

گوگل کا نمونہ ظاہر کرتا ہے کہ انڈسٹری مستقل ایجنٹ میموری پر تبدیل ہو رہی ہے۔ کھلا سوال یہ نہیں ہے کہ آیا ایجنٹ یاد رکھیں گے، لیکن کیسے۔ اہلیت یا حکمرانی۔ ایجنٹ یا سبسٹریٹ۔ امکانی استحکام یا تعییناتی سچائی۔ میں مؤخر الذکر پر شرط لگا رہا ہوں۔