[Boris Cherny (créateur de Claude Code chez Anthropic) a tweeté](https://x.com/bcherny/status/2017824286489383315) que Claude Code est passé de RAG plus DB vectorielle locale à la recherche agentique. Cela fonctionne mieux, a-t-il déclaré, et est plus simple, avec moins de problèmes de sécurité et de confidentialité. D'autres outils empruntent un chemin différent. Cursor, par exemple, utilise des intégrations basées sur le cloud pour indexer la base de code et effectuer une recherche par similarité sémantique.

Nous avons donc au moins deux paradigmes de recherche : la recherche basée sur l'intégration (pré-indexée, similarité vectorielle) et la recherche agentique (utilisation d'outils à la demande). Ce ne sont pas les mêmes. Chacun a des compromis différents. Les deux sont des stratégies de récupération. Une couche de vérité, c'est autre chose. Il conserve les entités canoniques, conserve la provenance et prend en charge les requêtes déterministes. Il s'agit d'une question d'état, pas de récupération. Cet article compare une couche de vérité aux deux modèles de récupération. Cela est également lié aux limites que j'ai atteintes en m'appuyant uniquement sur la récupération.

## Là où j'ai atteint mes limites

J'utilise Cursor comme interface centrale pour tous mes flux de travail numériques, pas seulement pour le codage. Tri des e-mails, gestion des tâches, requêtes financières, planification du contenu, transactions, contacts. Ils fonctionnent tous via le même agent avec accès au même dépôt. La recherche agentique dans les fichiers fonctionne souvent bien. L'agent trouve le contexte, déduit les connexions et fait avancer les choses.

Mais j'ai atteint des limites. L'agent déduit ; cela ne garantit pas. Voici à quoi cela ressemble :

- **Grands ensembles de données, rappel incomplet.** La recherche à la demande manque des éléments ou est tronquée sur des milliers de transactions ou des centaines de contacts. La récupération est redérivée à chaque fois. Il n’existe aucun magasin structuré permettant d’interroger des résultats complets.
- **Écrasements irrécupérables.** Un agent écrase un contact ou une tâche et l'état précédent disparaît. Pas de retour en arrière. Les écritures sont en place. Il n'y a pas de suivi de version ou d'ajout uniquement pour tracer et restaurer.
- **Pas d'accès multi-outils.** Je ne peux pas utiliser les mêmes enregistrements de Claude.ai ou ChatGPT. La récupération est liée au fournisseur.
- **Réponses non reproductibles.** Même question, réponse différente. Je ne parviens pas à reproduire un résultat pour vérification ou débogage. La récupération est non déterministe.
- **Aucune traçabilité.** Lorsque l'agent donne un numéro ou une réclamation erronée, je ne peux pas retracer les fichiers ou les enregistrements sources. La récupération n'a aucune provenance.
- **Identité canonique instable.** L'agent peut traiter « Acme Corp » et « ACME CORP » comme identiques dans une session et différents dans la suivante. La récupération est réinférée à chaque fois. Il n’y a pas d’identifiants canoniques persistants ni de règles de fusion.

## Deux paradigmes de récupération, un paradigme d'état

La recherche basée sur l'intégration et la recherche agentique transmettent toutes deux des informations à un agent. Ce ne sont pas les mêmes. La recherche basée sur l'intégration (par exemple Cursor) pré-indexe un corpus et les réponses via la similarité vectorielle. L'index peut être hébergé et mis à jour dans le cloud. La recherche agentique (par exemple Claude Code) ignore un index persistant et utilise des outils pour rechercher et lire à la demande. Différentes implémentations, différents compromis : confidentialité, obsolescence, simplicité.

Ce qu'ils partagent, c'est la récupération. L'agent trouve des éléments au moment de la requête. Une couche de vérité n'est pas une récupération. C'est un état persistant et structuré : entités canoniques, provenance, requêtes déterministes.

Nous comparons un paradigme d'état (couche de vérité) à deux paradigmes de récupération (basé sur l'intégration et agentique). Le tableau ci-dessous regroupe les trois. Lorsque les deux colonnes de récupération partagent une limite (par exemple, aucune provenance), il s'agit d'une similitude entre elles par rapport à une couche de vérité. Ce n'est pas une équation des deux.

| Domaine | Recherche basée sur l'intégration | Recherche agent | Couche de vérité |
|--------|------------------------|----------------|-------------|
| Récupération de documents | Similitude pré-indexée, correspondance sémantique | Recherche à la demande, inférence | Résolution d'entité, déduplication, provenance |
| Agrégation multi-sources | La portée et la fraîcheur de l'index dépendent de la version | Recherche en direct parmi les sources | Graphe unifié, fusion déterministe |
| Recherche d'entité | Similarité sur les intégrations ; pas d'identification canonique | Inférence par session | ID canoniques, fusion basée sur des règles |
| Requêtes de chronologie | Seulement si indexé ; pas de modèle temporel natif | Assemblage à la demande | Précalculé, basé sur un schéma |
| Provenance et audit | Aucun | Aucun | Piste d'audit immuable |
| Multiplateforme | Lié au fournisseur/index | Outils spécifiques au fournisseur | Mêmes données dans tous les outils |

Les deux approches de récupération sont optimisées pour plus de commodité et de flexibilité. Une couche de vérité optimise la cohérence et la vérifiabilité.

## Ce qu'offre une couche de vérité

Une couche mémoire structurée est construite autour de différentes primitives :

1. **Identité canonique persistante.** ID d'entité stables dans les sessions et les outils.
2. **Logique de fusion déterministe.** Combinaison d'observations basée sur des règles, pas d'inférence LLM par session.
3. **Provenance et audit.** Lignée traçable de la source à la réponse.
4. **Idempotence.** Les mêmes entrées produisent les mêmes résultats.
5. **Vérité multiplateforme.** Même mémoire sur ChatGPT, Claude, Cursor.
6. **Modèle de confidentialité clair.** Contrôle des utilisateurs, aucune formation du fournisseur, limites claires des données.

Il ne s’agit pas d’améliorations progressives par rapport à la recherche agent. Ils sont d'une conception différente. Récupération et orchestration au mieux par rapport à un état vérifiable et rejouable. Le choix dépend de ce dont vous avez besoin.

## Ce que la récupération peut approximer (agentique ou basée sur l'intégration)

Trois exemples montrent une récupération (agentique ou basée sur l'intégration) se rapprochant des capacités ci-dessus. Dans chaque exemple, l’agent obtient quelque chose qui lui semble correct pour le moment. Dans chacun d'eux, les mêmes limites apparaissent : pas d'identité canonique persistante, pas de provenance, aucune garantie que la "même requête" donne le "même résultat" à travers les sessions ou les reconstructions d'index. Les exemples ci-dessous utilisent des termes agents (outils, recherche à la demande). La récupération basée sur l'intégration peut se rapprocher des mêmes comportements via une recherche sémantique sur un index et atteint les mêmes limites.

**Exemple 1 : résolution d'entité à l'échelle de la session.** L'agent dispose d'outils pour rechercher des fichiers, des e-mails et le cloud. Il contient des instructions pour traiter les mentions de la même entité comme une seule. Vous demandez : « Quelle est ma dépense totale avec Acme Corp ? » L'agent recherche les exports bancaires, les reçus, les factures. Il trouve "Acme Corp", "ACME CORP", "Acme Corporation", déduit la même entité, additionne les montants. Cela ressemble à une résolution d'entité pour cette requête et cette session. Qu'est-ce qui ne va pas : redemandez demain et le numéro peut différer. L'agent peut manquer un fichier (recherche tronquée, chemin erroné) et sous-dénombrer. Ou bien, il peut traiter « Acme Corp » et « Acme Industries » comme étant identiques et surestimer. Aucun moyen de vérifier. Pas de piste d'audit, pas d'identifiant stable. Différentes sessions peuvent être en désaccord.

**Exemple 2 : Assemblage de chronologie à la demande.** L'agent dispose d'un accès étendu aux fichiers et aux dates. Vous demandez : « Quelles ont été mes principales dépenses au troisième trimestre 2024 ? » L'agent recherche, analyse les dates, dresse une liste chronologique, filtre par « majeur ». Vous obtenez une réponse de type chronologie sans système de chronologie dédié. Ce qui ne va pas : « Major » est déduit à chaque fois. Une séance exclut un article de 500 €. Le suivant l'inclut. Les documents avec des formats de date non standard sont supprimés ou mal ordonnés. L'agent peut tronquer ("voici le top 10") lorsqu'il y en avait 15. Même requête, résultats différents, à chaque fois.

**Exemple 3 : couche de mémoire hybride.** Un fournisseur propose une recherche agentique et une mémoire légère. L'agent extrait les extraits de code, les stocke et les récupère ultérieurement. Il traite un reçu, stocke `{fournisseur : "Acme Corp", montant : 150, date : "2024-07-15"}`. Une session ultérieure le récupère et le fusionne avec les résultats de recherche en direct. Cela ressemble à une mémoire structurée. Ce qui ne va pas : une extraction ultérieure écrase l'extrait. Pas de versionnage, pas de restauration. Le même fournisseur apparaît sous le nom de « Acme Corp » dans la mémoire stockée et « ACME CORP » dans une nouvelle recherche. Les doublons s’accumulent. Le fournisseur modifie la fonctionnalité ou le schéma et vos extraits stockés disparaissent. Aucun moyen de retracer un mauvais numéro jusqu'à sa source.

Dans chaque exemple, le comportement se rapproche de celui fourni par une couche de vérité. Les limites sont inhérentes à la récupération. Que l'agent utilise la recherche intégrée ou la recherche agentique, vous bénéficiez toujours de la portée de la session et de la fusion basée sur l'inférence. Vous n’obtenez toujours aucune provenance et aucune garantie multiplateforme. Une couche de vérité traite ces problèmes en persistant dans l’état au lieu de le récupérer à nouveau.

## Quand la récupération excelle (agentique ou basée sur l'intégration)

**Découverte exploratoire.** "Trouvez n'importe quoi dans mes téléchargements ou notes sur l'appartement de Barcelone." Vous ne savez pas où il vit ni comment il s'appelle. La recherche agentique dans les fichiers, dossiers et formats fait apparaître des extraits pertinents. Aucun schéma requis. L'agent déduit et assemble.

**Résumé rapide multi-sources.** "Qu'avons-nous décidé lors des trois derniers e-mails avec l'entrepreneur ?" Rechercher dans la boîte de réception, extraire le fil de discussion, résumer. Une séance, une réponse. Vous n'avez pas besoin que ce résumé persiste ou corresponde exactement la prochaine fois.

**Parcours ad hoc de code et de documents.** "Où gérons-nous les webhooks Stripe ?" Rechercher dans la base de code, README, la documentation interne. La mise en page varie selon le dépôt. La recherche agent s'adapte. Aucun graphique unifié n’est nécessaire.

**Triage d'un seul document ou d'un seul fil de discussion.** « Résumer ce PDF » ou « Quelle est la demande dans cet e-mail ? » Le contexte est limité. L'inférence est suffisante. Aucune résolution d’entité ni état inter-session.

## Quand une couche de vérité excelle

**Rappel complet sur de grands ensembles de données.** "Répertoriez chaque transaction avec le fournisseur X au cours des deux dernières années." Avec des milliers de lignes, la recherche agentique peut manquer des enregistrements, tronquer ou halluciner des agrégats. Une couche de vérité interroge un magasin structuré. Vous obtenez tous les enregistrements correspondants ou un décompte précis.

**Cohérence entre sessions.** L'agent crée une tâche de suivi dans la première session. Vous ouvrez une nouvelle session demain. La tâche doit être là, liée au bon contact et au bon email. La recherche agent n'a pas de graphique persistant. Une couche de vérité le fait.

**Audit et provenance.** « D'où vient ce numéro ? » Suivez-le jusqu'aux enregistrements source, aux dates d'importation et aux règles de dérivation. La recherche agent renvoie des réponses déduites. Une couche de vérité renvoie des réponses avec lignée.

**Résolution d'entités à grande échelle.** Des centaines de contacts, quelques doublons (variations de noms, sociétés fusionnées). Des milliers de transactions faisant référence au même fournisseur sous des orthographes différentes. Une couche de vérité conserve les identifiants canoniques et les règles de fusion. La recherche agentique réinfère chaque session et peut être en désaccord.

**Relecture déterministe.** Même requête, même résultat, à chaque fois. Critique pour le reporting, la conformité ou le débogage. La recherche agentique n'est pas déterministe. Une couche de vérité est idempotente.

**Récupérabilité après de mauvaises écritures.** Un agent écrase un contact, fusionne deux tâches en une seule ou « corrige » une transaction sur la base d'une inférence erronée. Avec la recherche agentique et l’écriture directe de fichiers, l’état précédent a disparu. Aucune annulation. Une couche de vérité utilise des écritures en ajout uniquement ou versionnées. Vous pouvez retracer ce qui a changé et revenir en arrière. Les mutations sont des opérations explicites et non des écrasements silencieux.

## Pourquoi la distinction est importante

La récupération (basée sur l'intégration ou agentique) est liée à la session. Cela ne vous donne pas en soi une identité, une provenance ou une cohérence entre les sessions persistantes. Sa valeur est un accès flexible et à la demande. La valeur d’une couche de vérité est une vérité persistante et intersessions. La résolution d’entités déterministe et vérifiable est difficile. Ni l'intégration de la similarité ni la recherche agentique ad hoc ne sont équivalentes. Les agents hébergés par le fournisseur sont confrontés à des incitations qui entrent en conflit avec la mémoire contrôlée par l'utilisateur et axée sur la confidentialité. Leur mémoire et leurs outils ont tendance à être spécifiques au produit.

Le tweet de Cherny reflète un véritable changement. RAG plus Vector DB était complexe et avait des implications en matière de confidentialité. Recherche agentique, récupération simplifiée pour Claude Code. Le curseur et d'autres empruntent un chemin de récupération différent (intégrations dans le cloud). Les deux paradigmes de récupération résolvent « comment l'agent trouve-t-il les choses ? » Ni l’un ni l’autre ne résout « comment pouvons-nous obtenir une identité, une provenance et une vérification stables ? » Une couche de vérité cible ces derniers. Les couches de récupération et d’état coexisteront. Ils résolvent différents problèmes.

## Ce que je construis

Je construis [Neotoma](https://github.com/markmhendrickson/neotoma), une couche de mémoire structurée qui adopte l'approche de la couche de vérité : résolution d'entité, chronologies, provenance, déterminisme, multiplateforme via MCP. Je le teste dans ma propre pile agent pour voir où ces primitives sont importantes dans la pratique. La recherche basée sur l'intégration et la recherche agentique sont deux stratégies de récupération. Ni l’un ni l’autre ne vous donne une identité persistante ou un état vérifiable. Une couche de vérité le fait. Je construis ce dernier.