[Claude memindahkan memori ke paket gratis](https://x.com/claudeai/status/2028559427167834314) adalah pencapaian yang nyata. Hal ini menegaskan bahwa memori kini menjadi permukaan produk inti, bukan fitur edge premium.

Bagian itu adalah berita bagus.

Pertanyaan yang lebih sulit adalah apa sebenarnya arti "memori" ketika Anda bergantung padanya untuk pekerjaan nyata. Saya telah menguji memori di Claude dan ChatGPT selama berbulan-bulan. Dua masalah terus muncul.

## Memori apa yang sebenarnya disimpan

Baik Claude maupun ChatGPT menggunakan kata "memori" sedemikian rupa sehingga membuat orang berasumsi bahwa detail yang bermakna tersimpan sepenuhnya di seluruh percakapan. Kenyataannya berbeda. Apa yang disebut platform ini sebagai memori lebih mirip dengan profil daripada catatan tentang apa yang Anda kerjakan.

Apa yang disimpan oleh sistem ini lebih mirip dengan cuplikan profil yang diringkas. Mereka mengamati percakapan Anda dan menyaring beberapa fakta tentang siapa Anda dan bagaimana Anda memilih untuk bekerja. Claude tampaknya melakukan yang terbaik. Untuk setiap obrolan, ini menghasilkan beberapa pengamatan, sebagian besar tentang identitas Anda sebagai seorang profesional, preferensi gaya Anda, bagaimana Anda suka berinteraksi dengan AI. ChatGPT, setidaknya menurut pengalaman saya, cenderung menyimpan cuplikan ini hanya jika Anda memintanya secara eksplisit.

![Ekspor memori Claude menampilkan cuplikan tingkat profil tanpa tanggal](/images/posts/your-ai-remembers-your-vibe-but-not-your-work-claude-memory-export.png)

Fitur-fitur ini tidak menangkap detail terperinci tentang hal-hal yang sebenarnya Anda kerjakan.

Jika saya berbicara tentang rutinitas kebugaran saya, latihan yang telah saya lakukan, statistik komposisi tubuh yang saya pantau, sistem akan menyimpulkan bahwa saya "menyukai kebugaran". Itu tidak akan menyimpan data aktual tentang evolusi kesehatan saya. Jika saya mengerjakan analisis keuangan atau serangkaian tugas proyek, sistem mungkin mencatat bahwa saya peduli dengan domain tersebut. Itu tidak akan mempertahankan rinciannya.

Klaim luas bahwa agen-agen ini mengingat "konteks" yang Anda berikan kepada mereka memang membantu, namun sempit. Itu bagus untuk keakraban. Itu membuat percakapan terasa lebih alami. Hal ini tidak memberikan jaminan bahwa agen dapat menjawab pertanyaan mendetail tentang pekerjaan sebelumnya atau melanjutkan pekerjaan Anda dengan andal.

Hasilnya adalah seperti seorang teman yang melupakan detail segala hal yang Anda bicarakan, namun samar-samar mengetahui siapa diri Anda sebenarnya. Itu berguna untuk percakapan yang lebih lancar. Ini tidak berguna untuk mendelegasikan pekerjaan yang sedang berlangsung.

## Dimana portabilitas rusak

Claude memberikan penawaran menarik bersamaan dengan rilis memorinya: [impor memori Anda dari layanan lain](https://claude.com/import-memory). Idenya sederhana. Tanyakan kepada asisten lamamu apa yang dia ketahui tentangmu, salin hasilnya, dan bawa ke Claude.

Sebagai UX, ini cerdas. Sebagai infrastruktur, cepat rusak.

Saya mengujinya dengan ChatGPT. Pertama kali saya menggunakan perintah ekspor Claude dalam obrolan reguler non-proyek, ChatGPT merespons dengan cuplikan memori yang telah disimpannya. Namun sebagian besar entri ini sudah basi, sebagian besar berasal dari tahun 2024, dan hampir tidak ada yang mencerminkan pekerjaan atau interaksi terbaru saya pada tahun ini. Tidak ada tanda-tanda bahwa sistem secara otomatis mempelajari sesuatu yang baru dari ratusan percakapan yang saya lakukan dalam beberapa bulan terakhir.

![Memori tersimpan ChatGPT menampilkan entri tingkat permukaan yang basi](/images/posts/your-ai-remembers-your-vibe-but-not-your-work-chatgpt-saved-memories.png)

Konteks lintas-obrolan yang jelas dimiliki ChatGPT, di mana informasi dari satu thread muncul di thread lain, tidak muncul sama sekali dalam ekspor. Hanya entri memori yang terpisah dan disimpan secara eksplisit yang masuk.

Ketika saya mencoba permintaan ekspor yang sama lagi di obrolan non-proyek berikutnya, ChatGPT menolak sepenuhnya. Itu tidak akan menghasilkan daftar memori untuk kedua kalinya. Jadi bahkan sebagian ekspor yang saya dapatkan adalah hasil sekali pakai.

![ChatGPT menolak mengekspor memori, mencantumkan kategori internal sebagai tidak dapat diekspor](/images/posts/your-ai-remembers-your-vibe-but-not-your-work-chatgpt-export-denied.png)

Dalam obrolan berbasis proyek, situasinya bahkan lebih buruk lagi. Saat saya menggunakan perintah yang sama di dalam proyek ChatGPT, proyek tersebut menolak mengekspor memori dari awal. Sebaliknya, ini mengarahkan saya ke fitur ekspor percakapan massal. Fitur tersebut memberi Anda dump data mentah, bukan konteks terstruktur. Anda mendapatkan file untuk diunduh dan dicari tahu sendiri.

![Penolakan ChatGPT: tidak ada dump kenangan atau konteks internal](/images/posts/your-ai-remembers-your-vibe-but-not-your-work-chatgpt-refusal-no-dump.png) ![ChatGPT apa yang dapat Anda ekspor: data akun dan perbedaan dari internal ringkasan](/images/posts/ai-Anda-mengingat-getaran-Anda-tetapi-bukan-pekerjaan-Anda-chatgpt-ekspor-apa-yang-Anda-bisa.png)

Jadi cerita portabilitas memiliki celah di kedua ujungnya. Platform sumber mengontrol apa yang akan diungkapkan dan di mana. Platform target hanya dapat menyerap apa yang sebenarnya masuk. Jika ekspor bersifat parsial, basi, dan bergantung pada permukaan, maka “portabilitas” adalah transfer upaya terbaik, bukan migrasi negara yang dapat diandalkan.

## Tiga kategori bersembunyi di bawah satu kata

Saya pikir pasar sedang ambruk setidaknya tiga hal berbeda di bawah kata "memori".

Yang pertama adalah memori kenyamanan. Cuplikan profil yang memperlancar interaksi, menghindari pengulangan, dan membantu personalisasi. Hal ini membuat chatbots merasa tidak terlalu memiliki kewarganegaraan. Inilah yang dikirimkan Claude dan ChatGPT hari ini, dan itulah yang dijelaskan dalam dua bagian pertama postingan ini.

Yang kedua adalah memori yang ditambah pengambilan. Beberapa platform telah melakukan hal ini sampai batas tertentu dengan memperlakukan transkrip percakapan sebelumnya sebagai file dan mencarinya sesuai permintaan. Secara lebih luas, agen menggunakan penelusuran agen atau penelusuran berbasis penyematan pada file, email, dan alat Anda untuk menampilkan konteks saat Anda memintanya. Itu bisa menjawab "apa yang kita putuskan dalam tiga email terakhir?" atau "temukan sesuatu tentang apartemen Barcelona". Itu adalah peningkatan dari cuplikan profil. Tapi [pengambilan agen menyimpulkan; itu tidak menjamin](/posts/agentic-search-and-the-truth-layer). Tidak ada keadaan kanonik yang tetap, tidak ada asal usulnya, tidak ada konsistensi lintas sesi. Pertanyaan yang sama dapat menghasilkan jawaban yang berbeda di lain waktu. Ini adalah jalan tengah: memori yang lebih baik daripada kenyamanan untuk pekerjaan nyata, bukan pengganti keadaan tahan lama.

Yang ketiga adalah memori operasional yang tahan lama. Ini adalah keadaan yang diketik, deterministik, dan dapat diaudit yang dapat bertahan dari perubahan alat, peralihan platform, dan batasan alur kerja. Ini adalah apa yang Anda perlukan ketika agen mulai menangani tugas berulang, kontak, komitmen, dan transaksi atas nama Anda.

Ketiganya penting. Mereka tidak dapat dipertukarkan, dan menggabungkannya menjadi satu kata akan menciptakan [masalah kebenaran](/posts/agent-memory-truth-problem) segera setelah Anda bergantung pada salah satu dari mereka untuk pekerjaan nyata.

Memori kenyamanan memenangkan pengalaman obrolan. Pengambilan memenangkan pertanyaan yang bersifat eksploratif dan satu kali saja. Memori yang tahan lama memenangkan lapisan status di bawahnya.

## Cara Neotoma menangani hal ini secara berbeda

Saya sedang membangun Neotoma untuk kategori ketiga. Saya telah menulis sebelumnya tentang [membangun lapisan kebenaran untuk memori agen persisten](/posts/truth-layer-agent-memory).

The core design difference is that Neotoma treats memory as explicit, user-owned data infrastructure rather than an opaque byproduct of chat interactions.

**Entitas, bukan cuplikan.** Setiap bagian konteks di Neotoma adalah entitas terstruktur dengan jenis, properti, dan hubungan dengan entitas lain. Kontak adalah kontak. Tugas adalah tugas. Catatan keuangan adalah catatan keuangan. Mereka tidak dimasukkan ke dalam kumpulan ringkasan bahasa alami tentang "apa yang menjadi perhatian pengguna". Ketika agen menyimpan sesuatu, ia menyimpan rekaman yang diketik. Saat agen mengambil sesuatu, ia mendapatkan hasil deterministik, bukan rekonstruksi probabilistik.

**Asal dari setiap fakta.** Setiap pengamatan di Neotoma melacak dari mana asalnya dan kapan dicatat. Jika dua agen menyumbangkan informasi tentang entitas yang sama, setiap kontribusi dapat ditelusuri secara terpisah. Tidak ada kotak hitam. Anda dapat mengaudit fakta apa pun kembali ke sumbernya.

**Akses lintas alat melalui MCP.** Neotoma mengekspos datanya melalui Model Context Protocol, yang berarti agen apa pun yang kompatibel dengan MCP dapat membaca dan menulis ke lapisan kebenaran yang sama. Saya menggunakan ini setiap hari. Data yang sama yang saya isi melalui Cursor tersedia untuk Claude, untuk ChatGPT, dan untuk alat masa depan apa pun yang menggunakan MCP. Tidak ada langkah ekspor. Tidak ada salin-tempel. Datanya ada di sana, dapat diakses dan konsisten, terlepas dari agen mana saya bekerja.

**Tidak ada gerbang platform.** Dalam model ChatGPT, memori berada di dalam platform dan platform memutuskan apa yang akan diungkapkan, di mana, dan kepada siapa. Di Neotoma, pengguna memiliki penyimpanan data. Tidak ada platform yang dapat menolak untuk mengekspornya karena tidak pernah dikunci menjadi satu.

**Inkremental dan dapat disusun.** Agen dapat menambahkan pengamatan ke entitas yang ada seiring waktu. Jika satu agen membantu saya mengurus pajak tahun ini, agen lain di platform berbeda tahun depan dapat mengambil dari catatan terstruktur yang sama. Pengetahuan bertambah bukannya diatur ulang.

Hal ini menciptakan pemisahan yang bersih. Antarmuka obrolan dapat terus mengoptimalkan kualitas interaksi, kepribadian, dan UX. Lapisan kebenaran di bawahnya mengoptimalkan keandalan, kelengkapan, dan kontrol. Ketika satu model atau antarmuka berubah, keadaan dasarnya tidak ikut berubah.

## Menurut saya ini mengarah ke mana

Dalam waktu dekat, sebagian besar pengguna akan tetap menggunakan memori platform. Mereka harus melakukannya. Ini membaik dan membuat obrolan terasa lebih baik.

Secara paralel, siapa pun yang membangun alur kerja agen yang serius akan mulai mengalami kesenjangan yang sama seperti yang saya alami: penarikan kembali sebagian, ekspor yang membosankan, perilaku yang bergantung pada permukaan, konteks halusinasi. Masalah-masalah tersebut menjadi lebih mahal ketika Anda mendelegasikan lebih banyak tanggung jawab. Saya telah menulis secara terpisah tentang [enam tren struktural](/posts/six-agentic-trends-betting-on) yang membuat kesenjangan ini semakin lebar dari waktu ke waktu: agen menjadi stateful, kesalahan menjadi harga, platform tetap buram, alat tetap terfragmentasi.

Pola yang saya harapkan adalah lapisan kebenaran muncul di bawah lapisan obrolan. Awalnya bertahap, kemudian infrastrukturnya terlihat jelas.

Claude membuat memori bebas mendorong seluruh kategori maju. Pengujian saya hanya memperjelas di mana batasnya. Memori platform meningkatkan kualitas percakapan. Ini belum menyediakan substrat yang dapat diandalkan untuk pekerjaan agen lintas konteks dan jangka panjang.

Kesenjangan itulah yang saya bangun untuk diisi oleh [Neotoma](/posts/neotoma-developer-release). Rilis pengembang sekarang tersedia di [neotoma.io](https://neotoma.io), dan saya secara aktif menyambut para penguji.