
Agen Anda memanfaatkan konteks, bukan kebenaran
Sarah Wooders berpendapat bahwa ingatan adalah tali pengaman. Dia benar tentang manajemen konteks. Dia salah karena konteksnya adalah masalahnya.
Esai, artikel teknis, dan pemikiran tentang membangun sistem kedaulatan.

Sarah Wooders berpendapat bahwa ingatan adalah tali pengaman. Dia benar tentang manajemen konteks. Dia salah karena konteksnya adalah masalahnya.

BEAM menguji pengambilan 10 juta token. Integritas negara menurun pada 500K. Kedua mode kegagalan tersebut aktif pada skala yang berbeda, dan tidak ada yang dapat mengukur skala kegagalan sebelumnya.

Metrik yang mendorong adopsi memori AI hampir semuanya merupakan metrik pengambilan. Diperlukan pengambilan yang baik. Tidak ada benchmark yang digunakan secara luas untuk menguji apa yang terjadi pada data yang disimpan setelah agen menulis ke data tersebut.
Delapan belas penilai produk manusia menjalankan perintah evaluasi yang sama melalui alat AI mereka. Tulisannya lebih tajam daripada panggilan apa pun. Umpan balik tersebut mengubah posisi produk — dan kemudian alur akuisisinya. Halaman beranda sekarang meminta agen untuk mengevaluasi, bukan manusia untuk mendaftar.

Saya mengirimkan sebelas rilis Neotoma dalam lima minggu pertama setelah rilis pengembang. CLI sekarang berfungsi di komputer lain, membuka blokir orientasi. Server MCP cukup stabil untuk penggunaan agen sehari-hari. Basis data dapat bertahan dari kesalahan operator. Inilah yang berubah dan alasannya.

Sekitar delapan belas dari dua puluh enam orang yang saya hubungi menjalankan perintah evaluasi yang sama melalui alat AI mereka. Tulisannya lebih tajam daripada panggilan apa pun. Umpan balik tersebut mengubah posisi produk — dan kemudian alur akuisisinya. Halaman beranda sekarang meminta agen untuk mengevaluasi, bukan manusia untuk mendaftar.

Perdebatan mengenai AI mengarah pada pertanyaan yang tidak pernah terselesaikan di zaman Pencerahan. Rousseau mengatakan alat merusak kita. Condorcet bilang mereka menyempurnakan kita. Nietzsche mengatakan keduanya tidak memahami maksudnya. Teknologi adalah ujian karakter, dan satu-satunya jawaban jujur adalah bagaimana jadinya Anda saat menghadapinya.

Saya tidak sengaja menimpa database produksi Neotoma saya dan turun dari 6.174 observasi menjadi 84. Saya mendapatkan hampir semuanya kembali. Pemulihan berhasil karena arsitektur Neotoma menyimpan observasi sebagai log tambahan saja dan menghitung ulang status entitas dari log tersebut.

Narasi FOMO mengikuti saya dari crypto ke AI. Di Leather, kesibukan Ordinal terasa seperti permintaan nyata. Di Neotoma, setiap tweet yang berhubungan dengan memori memicu kekacauan yang sama. Saya telah menjalani kedua cara narasi dapat menghancurkan produk Anda. Sinyal yang dipinjam memiliki batasan jangka waktu.

Orang-orang yang menggunakan AI menghadapi masalah-masalahnya secara lebih langsung dibandingkan orang lain. Namun mereka juga sangat yakin bahwa manusia dapat bekerja melalui mereka. Skeptisisme sebenarnya bukan pada mesin.

Saya merombak situs Neotoma. Dinding teks satu halaman yang lama kini menjadi presentasi visual yang didukung oleh dokumentasi, panduan integrasi khusus alat, dan pendalaman arsitektur—didorong oleh apa yang dikatakan penguji dan di mana mereka mengalami kebuntuan selama rilis pengembang.

Tekanan struktural yang mendasari pekerjaan saya, dan apa yang akan membuat tekanan tersebut menjadi tidak valid seiring dengan berkembangnya industri AI.