[Boris Cherny (pencipta Claude Code di Anthropic) mentweet](https://x.com/bcherny/status/2017824286489383315) bahwa Claude Code dipindahkan dari RAG plus DB vektor lokal ke pencarian agen. Ini berfungsi lebih baik, katanya, dan lebih sederhana, dengan lebih sedikit masalah seputar keamanan dan privasi. Alat lain mengambil jalur yang berbeda. Kursor, misalnya, menggunakan penyematan berbasis cloud untuk mengindeks basis kode dan mencari berdasarkan kesamaan semantik.

Jadi kita memiliki setidaknya dua paradigma pengambilan: pencarian berbasis penyematan (pra-indeks, kesamaan vektor) dan pencarian agen (penggunaan alat sesuai permintaan). Mereka tidak sama. Masing-masing memiliki pengorbanan yang berbeda. Keduanya adalah strategi pengambilan. Lapisan kebenaran adalah sesuatu yang lain. Ini mempertahankan entitas kanonik, mempertahankan asal usulnya, dan mendukung kueri deterministik. Ini tentang negara, bukan pengambilan. Posting ini membandingkan lapisan kebenaran dengan kedua model pengambilan. Ini juga sesuai dengan batasan yang saya capai ketika mengandalkan pengambilan saja.

## Saat saya mencapai batas

Saya menggunakan Kursor sebagai antarmuka utama untuk semua alur kerja digital saya, bukan hanya pengkodean. Triase email, manajemen tugas, pertanyaan keuangan, perencanaan konten, transaksi, kontak. Semuanya dijalankan melalui agen yang sama dengan akses ke repo yang sama. Pencarian agenik di seluruh file sering kali berfungsi dengan baik. Agen menemukan konteks, menyimpulkan koneksi, dan menyelesaikan sesuatu.

Tapi aku sudah mencapai batasnya. Agen menyimpulkan; itu tidak menjamin. Berikut tampilannya:

- **Kumpulan data besar, penarikan tidak lengkap.** Penelusuran sesuai permintaan melewatkan banyak hal atau terpotong di ribuan transaksi atau ratusan kontak. Pengambilan kembali diturunkan setiap saat. Tidak ada penyimpanan terstruktur untuk menanyakan hasil lengkap.
- **Penimpaan yang tidak dapat dipulihkan.** Agen menimpa kontak atau tugas dan keadaan sebelumnya hilang. Tidak ada kemunduran. Penulisan sudah ada. Tidak ada jejak pembuatan versi atau penambahan saja untuk dilacak dan diputar kembali.
- **Tidak ada akses lintas alat.** Saya tidak dapat menggunakan data yang sama dari Claude.ai atau ChatGPT. Pengambilan terikat pada penyedia.
- **Jawaban yang tidak dapat direproduksi.** Pertanyaan yang sama, jawaban yang berbeda. Saya tidak dapat mereproduksi hasil untuk verifikasi atau debugging. Pengambilan bersifat non-deterministik.
- **Tidak ada kemampuan penelusuran.** Saat agen memberikan nomor atau klaim yang salah, saya tidak dapat melacaknya kembali ke file atau catatan sumber. Pengambilan tidak memiliki asal.
- **Identitas kanonik yang tidak stabil.** Agen dapat memperlakukan "Acme Corp" dan "ACME CORP" sebagai hal yang sama di satu sesi dan berbeda di sesi berikutnya. Pengambilan kesimpulan ulang setiap saat. Tidak ada ID kanonis atau aturan penggabungan yang tetap.

## Dua paradigma pengambilan, satu paradigma negara

Penelusuran berbasis penyematan dan penelusuran agen memberikan informasi ke agen. Mereka tidak sama. Penelusuran berbasis penyematan (misalnya Kursor) mengindeks korpus terlebih dahulu dan menjawab melalui kesamaan vektor. Indeks dapat dihosting di cloud dan diperbarui. Pencarian agen (misalnya Kode Claude) melewatkan indeks persisten dan menggunakan alat untuk mencari dan membaca sesuai permintaan. Implementasi berbeda, pengorbanan berbeda: privasi, kebosanan, kesederhanaan.

Apa yang mereka bagikan adalah pengambilan. Agen menemukan sesuatu pada waktu permintaan. Lapisan kebenaran bukanlah pengambilan. Ini adalah keadaan yang persisten dan terstruktur: entitas kanonik, asal, kueri deterministik.

Kami membandingkan satu paradigma negara (lapisan kebenaran) dengan dua paradigma pengambilan (berbasis penyematan dan agen). Tabel di bawah ini menggambarkan ketiganya. Jika kedua kolom pengambilan memiliki batas yang sama (misalnya tidak ada asal), maka terdapat kesamaan di antara keduanya terkait dengan lapisan kebenaran. Ini bukan persamaan keduanya.

| Domain | Pencarian berbasis penyematan | Pencarian agen | Lapisan kebenaran |
|--------|------------------------|----------------|-------------|
| Pengambilan dokumen | Kesamaan yang telah diindeks sebelumnya, kecocokan semantik | Pencarian sesuai permintaan, inferensi | Resolusi entitas, dedup, asal |
| Agregasi multi-sumber | Cakupan dan kesegaran indeks bergantung pada build | Pencarian langsung lintas sumber | Grafik terpadu, penggabungan deterministik |
| Pencarian entitas | Kesamaan dalam penyematan; tidak ada ID kanonik | Inferensi per sesi | ID kanonik, penggabungan berbasis aturan |
| Kueri garis waktu | Hanya jika diindeks; tidak ada model waktu asli | Perakitan berdasarkan permintaan | Telah dihitung sebelumnya, berdasarkan skema |
| Asal dan audit | Tidak ada | Tidak ada | Jejak audit yang tidak dapat diubah |
| Lintas platform | Terikat dengan penyedia/indeks | Alat khusus penyedia | Data yang sama di seluruh alat |

Kedua pendekatan pengambilan dioptimalkan untuk kenyamanan dan fleksibilitas. Lapisan kebenaran mengoptimalkan konsistensi dan kemampuan verifikasi.

## Apa yang disediakan oleh lapisan kebenaran

Lapisan memori terstruktur dibangun berdasarkan primitif yang berbeda:

1. **Identitas kanonis yang persisten.** ID entitas yang stabil di seluruh sesi dan alat.
2. **Logika penggabungan deterministik.** Kombinasi observasi berbasis aturan, bukan inferensi LLM per sesi.
3. **Asal dan audit.** Silsilah yang dapat ditelusuri dari sumber hingga jawaban.
4. **Idempotence.** Input yang sama menghasilkan output yang sama.
5. **Kebenaran lintas platform.** Memori yang sama di ChatGPT, Claude, Cursor.
6. **Model privasi yang jelas.** Kontrol pengguna, tidak ada penggunaan pelatihan penyedia, batas data yang jelas.

Ini bukan peningkatan bertahap dibandingkan penelusuran agen. Mereka memiliki desain yang berbeda. Pengambilan dan orkestrasi dengan upaya terbaik versus keadaan yang dapat diverifikasi dan diputar ulang. Pilihannya tergantung pada apa yang Anda butuhkan.

## Perkiraan pengambilan yang dapat dilakukan (berbasis agen atau penyematan)

Tiga contoh menunjukkan pengambilan (berbasis agen atau penyematan) yang mendekati kemampuan di atas. Dalam setiap contoh, agen mendapatkan sesuatu yang terlihat tepat pada saat itu. Pada masing-masingnya, batasan yang sama muncul: tidak ada identitas kanonik yang persisten, tidak ada asal, tidak ada jaminan bahwa "kueri yang sama" menghasilkan "hasil yang sama" di seluruh sesi atau pembuatan ulang indeks. Contoh di bawah ini menggunakan istilah agen (alat, pencarian sesuai permintaan). Pengambilan berbasis penyematan dapat memperkirakan perilaku yang sama melalui pencarian semantik pada indeks dan mencapai batas yang sama.

**Contoh 1: Resolusi entitas cakupan sesi.** Agen memiliki alat untuk mencari file, email, dan cloud. Ini memiliki instruksi untuk memperlakukan penyebutan entitas yang sama sebagai satu kesatuan. Anda bertanya: "Berapa total pembelanjaan saya dengan Acme Corp?" Agen mencari ekspor bank, kuitansi, faktur. Ia menemukan "Acme Corp", "ACME CORP", "Acme Corporation", menyimpulkan entitas yang sama, jumlah jumlah. Sepertinya resolusi entitas untuk kueri dan sesi ini. Apa yang salah: tanyakan lagi besok dan jumlahnya mungkin berbeda. Agen mungkin melewatkan file (pencarian terpotong, jalur salah) dan jumlah yang kurang. Atau perusahaan mungkin memperlakukan "Acme Corp" dan "Acme Industries" sebagai hal yang sama dan terlalu banyak dihitung. Tidak ada cara untuk memverifikasi. Tidak ada jejak audit, tidak ada ID stabil. Sesi yang berbeda mungkin berbeda pendapat.

**Contoh 2: Perakitan garis waktu sesuai permintaan.** Agen memiliki akses file dan tanggal yang luas. Anda bertanya: "Berapa pengeluaran utama saya pada Q3 2024?" Agen mencari, menguraikan tanggal, menyusun daftar kronologis, memfilter berdasarkan "mayor". Anda mendapatkan jawaban seperti garis waktu tanpa sistem garis waktu khusus. Apa yang salah: "Mayor" selalu disimpulkan. Satu sesi tidak termasuk item €500. Yang berikutnya mencakupnya. Dokumen dengan format tanggal non-standar terjatuh atau salah urutan. Agen dapat memotong ("inilah 10 teratas") ketika ada 15. Kueri yang sama, hasil berbeda, setiap saat.

**Contoh 3: Lapisan memori hibrid.** Penyedia mengirimkan penelusuran agen ditambah memori ringan. Agen mengekstrak cuplikan terstruktur, menyimpannya, dan mengambilnya nanti. Ia memproses tanda terima, menyimpan `{vendor: "Acme Corp", jumlah: 150, tanggal: "15-07-2024"}`. Sesi berikutnya mengambil ini dan menggabungkannya dengan hasil pencarian langsung. Itu terlihat seperti memori terstruktur. Apa yang salah: ekstraksi selanjutnya akan menimpa cuplikan. Tidak ada versi, tidak ada rollback. Vendor yang sama muncul sebagai "Acme Corp" di memori tersimpan dan "ACME CORP" di pencarian baru. Duplikat terakumulasi. Penyedia mengubah fitur atau skema dan cuplikan yang Anda simpan akan hilang. Tidak ada cara untuk melacak nomor yang salah kembali ke sumbernya.

Dalam setiap contoh, perilakunya mendekati apa yang diberikan oleh lapisan kebenaran. Batasannya melekat pada pengambilan. Baik agen menggunakan penelusuran penyematan atau penelusuran agen, Anda tetap mendapatkan cakupan sesi dan penggabungan berbasis inferensi. Anda tetap tidak mendapatkan asal dan jaminan lintas platform. Lapisan kebenaran mengatasinya dengan mempertahankan status alih-alih mengambilnya kembali.

## Ketika pengambilan unggul (berbasis agen atau penyematan)

**Penemuan eksplorasi.** "Temukan apa pun di unduhan atau catatan saya tentang apartemen Barcelona." Anda tidak tahu di mana ia tinggal atau apa namanya. Pencarian agenik di seluruh file, folder, dan format menampilkan cuplikan yang relevan. Tidak diperlukan skema. Agen menyimpulkan dan merakit.

**Ringkasan cepat lintas sumber.** "Apa yang kami putuskan dalam tiga email terakhir dengan kontraktor?" Cari kotak masuk, ekstrak thread, rangkum. Satu sesi, satu jawaban. Anda tidak memerlukan ringkasan tersebut untuk bertahan atau sama persis di lain waktu.

**Kode ad hoc dan penjelajahan dokumen.** "Di mana kami menangani webhook Stripe?" Cari basis kode, README, dokumen internal. Tata letak bervariasi berdasarkan repo. Pencarian agen beradaptasi. Tidak diperlukan grafik terpadu.

**Triase dokumen tunggal atau rangkaian tunggal.** "Ringkaslah PDF ini" atau "Apa yang ditanyakan dalam email ini?" Konteksnya terbatas. Inferensi sudah cukup. Tidak ada resolusi entitas atau status lintas sesi.

## Ketika lapisan kebenaran unggul

**Selesaikan penarikan kembali kumpulan data berukuran besar.** "Cantumkan setiap transaksi dengan vendor X dalam dua tahun terakhir." Dengan ribuan baris, pencarian agen mungkin kehilangan catatan, memotong, atau membuat halusinasi agregat. Lapisan kebenaran menanyakan penyimpanan terstruktur. Anda mendapatkan semua catatan yang cocok atau hitungan yang tepat.

**Konsistensi lintas sesi.** Agen membuat tugas tindak lanjut di sesi pertama. Anda membuka sesi baru besok. Tugasnya harus ada di sana, ditautkan ke kontak dan email yang benar. Penelusuran agen tidak memiliki grafik persisten. Lapisan kebenaran bisa melakukannya.

**Audit dan asal usulnya.** "Dari mana nomor ini berasal?" Lacak ke catatan sumber, tanggal impor, dan aturan derivasi. Pencarian agenik menghasilkan jawaban yang disimpulkan. Lapisan kebenaran mengembalikan jawaban dengan garis keturunan.

**Resolusi entitas dalam skala besar.** Ratusan kontak, beberapa duplikat (variasi nama, perusahaan gabungan). Ribuan transaksi mereferensikan vendor yang sama dengan ejaan berbeda. Lapisan kebenaran mempertahankan ID kanonik dan aturan penggabungan. Pencarian agenik menyimpulkan ulang setiap sesi dan mungkin tidak setuju.

**Pemutaran ulang deterministik.** Kueri yang sama, hasil yang sama, setiap saat. Penting untuk pelaporan, kepatuhan, atau proses debug. Pencarian agenik bersifat non-deterministik. Lapisan kebenaran bersifat idempoten.

**Dapat dipulihkan dari penulisan yang buruk.** Agen akan menimpa kontak, menggabungkan dua tugas menjadi satu, atau "mengoreksi" transaksi berdasarkan kesimpulan yang salah. Dengan pencarian agen dan penulisan file langsung, keadaan sebelumnya hilang. Tidak boleh dibatalkan. Lapisan kebenaran menggunakan penulisan hanya tambahan atau penulisan berversi. Anda dapat melacak apa yang berubah dan memutar kembali. Mutasi adalah operasi eksplisit, bukan penimpaan diam-diam.

## Mengapa perbedaan itu penting

Pengambilan (berbasis penyematan atau agen) terikat pada sesi. Itu tidak dengan sendirinya memberi Anda identitas, asal, atau konsistensi lintas sesi yang persisten. Nilainya adalah akses yang fleksibel dan sesuai permintaan. Nilai lapisan kebenaran adalah kebenaran lintas sesi yang persisten. Resolusi entitas yang deterministik dan dapat diaudit sulit dilakukan. Penyematan kesamaan maupun pencarian agen ad hoc tidak ada bandingannya. Agen yang dihosting oleh penyedia menghadapi insentif yang bertentangan dengan memori yang mengutamakan privasi dan dikontrol pengguna. Memori dan alat mereka cenderung spesifik untuk produk.

Tweet Cherny mencerminkan perubahan nyata. RAG plus vektor DB rumit dan memiliki implikasi privasi. Pencarian agen menyederhanakan pengambilan Kode Claude. Kursor dan lainnya mengambil jalur pengambilan yang berbeda (cloud embeddings). Kedua paradigma pengambilan memecahkan masalah "bagaimana agen menemukan sesuatu?" Tidak ada yang memecahkan “bagaimana kita mendapatkan identitas, asal, dan verifikasi yang stabil?” Lapisan kebenaran menargetkan yang terakhir. Lapisan pengambilan dan status akan hidup berdampingan. Mereka memecahkan masalah yang berbeda.

## Apa yang saya bangun

Saya sedang membangun [Neotoma](https://github.com/markmhendrickson/neotoma), lapisan memori terstruktur yang menggunakan pendekatan lapisan kebenaran: resolusi entitas, garis waktu, asal, determinisme, lintas platform melalui MCP. Saya melakukan dogfood di tumpukan agen saya sendiri untuk melihat di mana peran primitif ini dalam praktiknya. Pencarian berbasis penyematan dan pencarian agen adalah dua strategi pengambilan. Tidak ada yang memberi Anda identitas tetap atau status yang dapat diverifikasi. Lapisan kebenaran bisa melakukannya. Saya sedang membangun yang terakhir.