PRÆTOR · ESSAI

2026-05-23 · 9 MIN · ARCHITECTURE TECHNIQUE

Comment fonctionne une plateforme agentique en wealth : L'Esprit, Les Agents, Le Flux

Pour le CIO ou le CTO de l'institution qui évalue : ce n'est pas de la magie. C'est de l'architecture. Et voici ce qu'il y a dans la boîte.

9 min de lecture · Équipe PRÆTOR

« Plateforme agentique » est un terme qui apparaît avec une fréquence croissante dans les présentations technologiques pour le secteur financier. Comme tout terme qui gagne en vitesse d'adoption, il risque de perdre en précision en chemin. Cet essai est l'opposé d'un pitch — c'est une description technique et fonctionnelle du fonctionnement d'une plateforme agentique pour le wealth management, écrite pour qui évaluera l'architecture, non pour qui doit être convaincu que la catégorie existe.

La structure comporte 3 couches : L'Esprit (graphe de mémoire persistante), Les Agents (force de travail autonome coordonnée) et Le Flux (cycle commercial de bout en bout). À la fin, nous parcourons un exemple réel — un message WhatsApp qui arrive à 14h23 et ce qui se produit dans les 60 secondes suivantes.

L'Esprit — graphe de mémoire persistante

Le point de départ de toute plateforme agentique efficace pour le wealth management est la résolution d'un problème fondamental : les agents ont besoin de contexte pour agir correctement. Sans contexte, un agent est aussi utile qu'un modèle générique — et les modèles génériques ne savent pas qui est votre client.

L'Esprit est un graphe de connaissances persistant — une représentation structurée d'entités (clients, proches, holdings, actifs, bankers responsables, événements) et des relations entre elles. Ce n'est pas une base de données relationnelle plate. C'est un réseau sémantique navigable : du client au portefeuille, du portefeuille aux actifs, des actifs aux événements de marché qui les affectent, des événements aux interactions enregistrées, des interactions au contexte émotionnel et stratégique capturé.

Ce que contient le graphe

Le graphe est alimenté par de multiples sources : flux de custody, transcriptions WhatsApp traitées, notes de réunion des bankers, flux d'actualités filtrés, et enrichissement programmé par des agents spécialisés. Chaque donnée nouvelle est insérée avec timestamp, source et contexte — créant une ligne du temps auditable de tout ce que le système sait sur chaque client.

« L'Esprit n'est pas une base de données avec recherche. C'est ce qu'un banker avec 15 ans de maison sait — mais disponible à tout agent, instantanément, sans dégradation par turnover. »

Les Agents — force de travail coordonnée

Le second pilier est la force de travail agentique — un ensemble d'agents spécialisés qui opèrent sur le graphe de mémoire, coordonnés par un orchestrateur central. Chaque agent dispose d'un périmètre de responsabilité bien défini, de permissions délimitées et d'un mode opératoire spécifique (actif ou réactif, programmé ou event-driven).

Concierge — le point d'entrée

Le Concierge est l'agent d'intake — le point de contact entre le monde externe et le système. Tout message inbound passe par le Concierge : WhatsApp du client, email, demande du banker. Le Concierge identifie l'intention, classe l'urgence, résout ce qu'il peut résoudre dans ses permissions et transmet aux agents spécialisés ce qui requiert un traitement complémentaire.

Oghma — l'orchestrateur

Oghma est l'orchestrateur central — l'agent qui reçoit les tâches complexes et les décompose en sous-tâches distribuées entre les agents spécialisés. Lorsqu'une réunion est programmée, Oghma ne génère pas le briefing seul — il instruit l'agent portfolio de mettre à jour les positions, l'agent suitability de vérifier le profil, l'agent news de filtrer les événements pertinents, l'agent compliance de vérifier les points en suspens. Il reçoit les résultats et synthétise le briefing final.

Oghma maintient l'état de chaque tâche en cours, gère les dépendances entre sous-tâches, et garantit que les défaillances d'agents individuels ne bloquent pas le résultat final. Il est LLM-agnostique — peut orchestrer des agents qui tournent sur Anthropic Claude, OpenAI GPT, des modèles open-source, ou une combinaison.

Agents spécialisés

« Chaque agent dispose de permissions délimitées. Aucun agent ne prend de décisions hors de son périmètre. Le banker demeure sur la ligne d'approbation pour toutes les actions ayant des conséquences externes. »

Le Flux — un exemple réel

La théorie est nécessaire mais insuffisante. Parcourons un exemple concret : un message WhatsApp qui arrive à 14h23. Le client est M. Monteiro, patriarche d'une famille avec patrimoine sous gestion dans une banque disposant d'une division private banking. Le message dit : « Je dois parler de ce qui se passe avec le fonds. Je suis préoccupé. »

14h23:01 — Message reçu

Le message entre par le canal d'intégration de l'API WhatsApp Business. Le Concierge le reçoit, identifie l'expéditeur comme M. Monteiro (via le numéro mappé dans le graphe), classe l'intention comme « préoccupation sur la performance — exige briefing urgent » et active Oghma en priorité haute.

14h23:04 — Oghma décompose la tâche

Oghma lit le contexte de M. Monteiro dans le graphe : profil suitability modéré-conservateur, 42 % du portefeuille en fonds multi-stratégie, la dernière interaction enregistrée date d'il y a 12 jours. Il décompose en sous-tâches parallèles : (1) Investments Agent : performance des fonds du portefeuille sur les 30 derniers jours ; (2) News Agent : événements de marché pertinents pour le portefeuille de M. Monteiro ; (3) WhatsApp Analyst : historique d'interactions antérieures sur le thème de la performance.

14h23:08 — Agents en parallèle

L'Investments Agent extrait les positions du graphe et calcule : le fonds de référence du portefeuille de M. Monteiro a baissé de 3,2 % sur le mois, contre un benchmark à −1,8 %. Le News Agent identifie deux articles pertinents publiés dans les 48 dernières heures sur le secteur d'exposition du fonds. Le WhatsApp Analyst trouve dans l'historique qu'en mars M. Monteiro a exprimé un inconfort face à une volatilité supérieure à 2 % mensuels et que le banker actuel s'est engagé à l'appeler si le fonds dépassait ce niveau.

14h23:19 — Synthèse et proposition de réponse

Oghma reçoit les résultats des 3 agents, active le Suitability Agent pour confirmer qu'une réponse de type « contexte + suggestion d'appel » est dans le périmètre, et le Compliance Agent pour vérifier qu'aucune information dans la réponse proposée ne viole les politiques de communication. Avec l'approbation des deux, le Briefing Agent synthétise un message de réponse pour M. Monteiro et un mémo interne pour le banker responsable.

14h23:41 — Le banker reçoit le paquet

Le banker reçoit dans son panneau : (1) le contexte complet de M. Monteiro, mis à jour avec le message du jour ; (2) l'analyse de performance du fonds avec contexte de marché ; (3) l'engagement de mars qui n'a pas été honoré — le banker aurait dû appeler quand la volatilité a dépassé 2 % ; (4) brouillon de réponse WhatsApp, en attente d'approbation ; (5) suggestion de programmer un appel dans les 30 prochaines minutes.

Le banker approuve le message d'un clic, ajuste deux termes, et la réponse est envoyée. L'interaction est enregistrée dans le graphe. L'engagement de mars est mis à jour comme « en suspens — résolu par appel programmé ». Tout cela entre 14h23 et 14h24.

Sécurité, isolement et déploiement — pour l'acheteur technique

Les questions que tout CIO et CTO de banque ou de société de gestion pose à ce stade sont prévisibles — et légitimes. Nous y répondons directement :

Isolement multi-tenant

Chaque tenant (chaque banque, chaque entité, chaque segment) opère avec un graphe complètement isolé. Pas de partage de données entre tenants. Une banque avec private banking et asset management dans la même institution peut configurer des tenants distincts avec des politiques de compliance distinctes, sans croisement de données entre les entités.

Déploiement on-premise

La plateforme tourne sur le VPS ou le data center de l'institution. Coolify, Kubernetes ou VM traditionnelle — le choix appartient à l'institution. Les données des clients ne sortent jamais vers des serveurs tiers. Le LLM utilisé par les agents peut être self-hosted (modèles open-source) ou via API avec contrats enterprise garantissant que les données ne sont pas utilisées pour l'entraînement. L'institution choisit — et conserve une auditabilité totale sur l'emplacement des données.

Audit trail

Toute action d'agent est enregistrée : quel agent a exécuté, avec quels inputs, avec quel output, à quel timestamp, avec quel résultat. Pour les besoins réglementaires et la supervision interne de compliance, l'audit trail est complet et immuable. Les décisions d'agents qui génèrent des communications avec les clients sont enregistrées avec le contexte complet ayant conduit à cette décision.

LLM-agnostique

Aucun agent n'est couplé à un fournisseur spécifique de modèle de langage. L'institution peut utiliser Anthropic Claude pour l'orchestrateur et un modèle open-source self-hosted pour l'agent compliance — ou toute autre combinaison. C'est particulièrement pertinent pour les institutions ayant des restrictions réglementaires sur l'usage de fournisseurs cloud spécifiques ou disposant d'une feuille de route de souveraineté des données à moyen terme.

« Ce n'est pas de la magie. C'est de l'architecture. Et l'architecture tourne sur votre VPS, avec vos données, sous vos politiques. »

Pour l'institution qui évalue une plateforme agentique, la conversation technique commence ici — non au pitch.

Nous tenons des sessions d'évaluation technique avec les CIO, CTO et équipes d'architecture — avec accès au diagramme complet de composants, à la cartographie des intégrations avec les systèmes existants et à l'analyse d'adéquation avec l'infrastructure de l'institution. Modèle commercial sur demande.

info@praetor-ai.tech

Demander une session technique

§ À LIRE AUSSI