PRÆTOR · ESSAY

2026-05-23 · 9 MIN · TECHNISCHE ARCHITEKTUR

Wie eine agentische Plattform im Wealth funktioniert: Der Verstand, Die Agenten, Der Fluss

Für CIOs oder CTOs der evaluierenden Institution: Es ist keine Magie. Es ist Architektur. Und hier ist, was im Kasten ist.

9 Min. Lesezeit · PRÆTOR Team

„Agentische Plattform" ist ein Begriff, der mit zunehmender Häufigkeit in Technologie-Präsentationen für den Finanzsektor auftaucht. Wie jeder Begriff, der Adoptionstempo gewinnt, läuft er Gefahr, unterwegs an Präzision zu verlieren. Dieser Essay ist das Gegenteil eines Pitches — er ist eine technische und funktionale Beschreibung, wie eine agentische Plattform für Wealth Management funktioniert, geschrieben für jene, die die Architektur evaluieren, nicht für jene, die überzeugt werden müssen, dass die Kategorie existiert.

Die Struktur hat 3 Schichten: Der Verstand (persistenter Gedächtnisgraph), Die Agenten (koordinierte autonome Arbeitskraft) und Der Fluss (vollständiger kommerzieller Zyklus). Am Ende durchlaufen wir ein reales Beispiel — eine WhatsApp-Nachricht, die um 14:23 eintrifft, und was in den nächsten 60 Sekunden geschieht.

Der Verstand — persistenter Gedächtnisgraph

Der Ausgangspunkt jeder effektiven agentischen Plattform für Wealth Management ist die Lösung eines fundamentalen Problems: Die Agenten brauchen Kontext, um gut zu handeln. Ohne Kontext ist ein Agent nicht nützlicher als ein generisches Modell — und generische Modelle wissen nicht, wer Ihr Kunde ist.

Der Verstand ist ein persistenter Wissensgraph — eine strukturierte Darstellung von Entitäten (Kunden, Angehörigen, Holdings, Vermögenswerten, verantwortlichen Bankern, Ereignissen) und den Beziehungen zwischen ihnen. Es ist keine flache relationale Datenbank. Es ist ein semantisches Netzwerk, das durchquert werden kann: vom Kunden zum Portfolio, vom Portfolio zu den Vermögenswerten, von den Vermögenswerten zu den Marktereignissen, die sie betreffen, von den Ereignissen zu den erfassten Interaktionen, von den Interaktionen zum eingefangenen emotionalen und strategischen Kontext.

Was der Graph enthält

Der Graph wird aus vielfältigen Quellen gespeist: Verwahr-Feeds, verarbeitete WhatsApp-Transkripte, Meeting-Notizen der Banker, gefilterte News-Feeds und geplante Anreicherung durch spezialisierte Agenten. Jeder neue Datenpunkt wird mit Zeitstempel, Quelle und Kontext eingefügt — und schafft so eine auditierbare Zeitleiste alles dessen, was das System über jeden Kunden weiß.

„Der Verstand ist keine Datenbank mit Suche. Er ist das, was ein Banker mit 15 Jahren Hauszugehörigkeit weiß — aber jedem Agenten sofort zur Verfügung, ohne Degradation durch Fluktuation."

Die Agenten — koordinierte Arbeitskraft

Die zweite Säule ist die agentische Arbeitskraft — ein Satz spezialisierter Agenten, die auf dem Gedächtnisgraph operieren, koordiniert von einem zentralen Orchestrator. Jeder Agent hat einen wohldefinierten Verantwortungsbereich, abgegrenzte Berechtigungen und einen spezifischen Betriebsmodus (aktiv oder reaktiv, geplant oder event-getrieben).

Concierge — der Eintrittspunkt

Der Concierge ist der Intake-Agent — der Kontaktpunkt zwischen Außenwelt und System. Jede eingehende Nachricht passiert den Concierge: WhatsApp eines Kunden, E-Mail, Bankeranfrage. Der Concierge identifiziert die Intention, klassifiziert die Dringlichkeit, löst innerhalb seiner Berechtigungen, was er kann, und leitet weiter, was zusätzliche Verarbeitung erfordert.

Oghma — der Orchestrator

Oghma ist der zentrale Orchestrator — der Agent, der komplexe Aufgaben entgegennimmt und sie in Teilaufgaben zerlegt, die auf spezialisierte Agenten verteilt werden. Wenn ein Meeting angesetzt ist, erzeugt Oghma das Briefing nicht allein — er weist den Portfolio-Agenten an, Positionen zu aktualisieren, den Suitability-Agenten, das Profil zu prüfen, den News-Agenten, relevante Ereignisse zu filtern, den Compliance-Agenten, offene Punkte zu checken. Empfängt die Ergebnisse und synthetisiert das finale Briefing.

Oghma hält den Zustand jeder laufenden Aufgabe, verwaltet Abhängigkeiten zwischen Teilaufgaben und stellt sicher, dass Ausfälle einzelner Agenten das Endergebnis nicht blockieren. Er ist LLM-agnostisch — er kann Agenten orchestrieren, die auf Anthropic Claude, OpenAI GPT, Open-Source-Modellen oder einer Kombination laufen.

Spezialisierte Agenten

„Jeder Agent hat abgegrenzte Berechtigungen. Kein Agent trifft Entscheidungen außerhalb seines Bereichs. Der Banker bleibt in der Freigabelinie für alle Aktionen mit externen Konsequenzen."

Der Fluss — ein reales Beispiel

Theorie ist notwendig, aber unzureichend. Wir durchlaufen ein konkretes Beispiel: eine WhatsApp-Nachricht, die um 14:23 eintrifft. Der Kunde ist Herr Monteiro, Familienpatriarch mit verwaltetem Vermögen in einer Bank mit Private Banking. Die Nachricht lautet: „Ich muss über das sprechen, was mit dem Fonds passiert. Ich bin besorgt."

14:23:01 — Nachricht empfangen

Die Nachricht tritt über den WhatsApp Business API-Integrationskanal ein. Der Concierge empfängt sie, identifiziert den Absender als Herrn Monteiro (über im Graph hinterlegte Nummer), klassifiziert die Intention als „Performance-Sorge — dringendes Briefing erforderlich" und stößt Oghma mit hoher Priorität an.

14:23:04 — Oghma zerlegt die Aufgabe

Oghma liest den Kontext von Herrn Monteiro im Graph: Suitability-Profil moderat-konservativ, 42 % des Portfolios in Multi-Asset-Fonds, letzte erfasste Interaktion vor 12 Tagen. Zerlegt in parallele Teilaufgaben: (1) Investments Agent: Performance der Fonds im Portfolio in den letzten 30 Tagen; (2) News Agent: Marktereignisse, relevant für das Portfolio von Herrn Monteiro; (3) WhatsApp Analyst: Historie früherer Interaktionen zum Thema Performance.

14:23:08 — Agenten parallel

Investments Agent zieht die Positionen aus dem Graph und berechnet: Der Referenzfonds im Portfolio von Herrn Monteiro fiel diesen Monat um 3,2 %, gegenüber Benchmark −1,8 %. News Agent identifiziert zwei in den letzten 48 Stunden veröffentlichte Artikel zum Sektor, in dem der Fonds exponiert ist. WhatsApp Analyst findet in der Historie, dass Herr Monteiro im März Unbehagen mit Volatilität über 2 % pro Monat ausdrückte und der aktuelle Banker zusagte, anzurufen, falls der Fonds dieses Niveau überschreitet.

14:23:19 — Synthese und Antwortvorschlag

Oghma empfängt die Ergebnisse der 3 Agenten, stößt den Suitability Agent an, um zu bestätigen, dass eine Antwort vom Typ „Kontext + Anrufvorschlag" im Rahmen liegt, und den Compliance Agent, um zu prüfen, dass keine Information in der vorgeschlagenen Antwort Kommunikationsrichtlinien verletzt. Mit beider Freigabe synthetisiert der Briefing Agent eine Antwortnachricht an Herrn Monteiro und ein internes Memo für den verantwortlichen Banker.

14:23:41 — Banker erhält das Paket

Der Banker erhält im Panel: (1) vollständigen Kontext von Herrn Monteiro, aktualisiert mit der heutigen Nachricht; (2) Performance-Analyse des Fonds mit Marktkontext; (3) die nicht eingehaltene März-Zusage — der Banker hätte anrufen sollen, als die Volatilität 2 % überschritt; (4) WhatsApp-Antwortentwurf, der auf Freigabe wartet; (5) Vorschlag, einen Anruf für die nächsten 30 Minuten zu planen.

Der Banker gibt die Nachricht mit einem Klick frei, justiert zwei Formulierungen, und die Antwort wird gesendet. Die Interaktion wird im Graph erfasst. Die März-Zusage wird auf „offen — gelöst mit geplantem Anruf" aktualisiert. All das zwischen 14:23 und 14:24.

Sicherheit, Isolierung und Deployment — für den technischen Käufer

Die Fragen, die jeder CIO und CTO einer Bank oder eines Vermögensverwalters an diesem Punkt stellt, sind vorhersehbar — und legitim. Wir antworten direkt:

Multi-Tenant-Isolierung

Jeder Tenant (jede Bank, jeder Bereich, jedes Segment) operiert mit vollständig isoliertem Graph. Es gibt keine Datenteilung zwischen Tenants. Eine Bank mit Private Banking und Asset Management in derselben Institution kann separate Tenants mit unterschiedlichen Compliance-Richtlinien konfigurieren, ohne Datenüberschneidung zwischen den Bereichen.

On-premise-Bereitstellung

Die Plattform läuft auf dem VPS oder Rechenzentrum der Institution. Coolify, Kubernetes oder traditionelle VM — die Wahl liegt bei der Institution. Die Kundendaten verlassen niemals den Server zu Dritten. Das von den Agenten genutzte LLM kann self-hosted (Open-Source-Modelle) oder per API mit Enterprise-Verträgen genutzt werden, die garantieren, dass Daten nicht für Training verwendet werden. Die Institution wählt — und behält volle Auditierbarkeit darüber, wo die Daten sind.

Audit-Trail

Jede Agentenaktion wird erfasst: welcher Agent ausgeführt hat, mit welchen Inputs, mit welchem Output, mit welchem Zeitstempel, mit welchem Ergebnis. Für die Zwecke von CVM, Anbima und interner Compliance-Aufsicht ist der Audit-Trail vollständig und unveränderlich. Agentenentscheidungen, die Kundenkommunikationen erzeugen, werden mit dem vollständigen Kontext erfasst, der zu dieser Entscheidung führte.

LLM-agnostisch

Kein Agent ist an einen spezifischen Sprachmodell-Anbieter gekoppelt. Die Institution kann Anthropic Claude für den Orchestrator und ein self-hosted Open-Source-Modell für den Compliance Agent verwenden — oder jede andere Kombination. Das ist besonders relevant für Institutionen mit regulatorischen Einschränkungen bei spezifischen Cloud-Anbietern oder mit einer mittelfristigen Datensouveränitäts-Roadmap.

„Keine Magie. Architektur. Und die Architektur läuft auf Ihrem VPS, mit Ihren Daten, unter Ihren Richtlinien."

Für die Institution, die eine agentische Plattform evaluiert, beginnt das technische Gespräch hier — nicht im Pitch.

Wir führen technische Evaluationssitzungen mit CIOs, CTOs und Architektur-Teams durch — mit Zugang zum vollständigen Komponentendiagramm, Mapping der Integrationen mit bestehenden Systemen und Fit-Analyse mit der Infrastruktur der Institution. Kommerzielles Modell auf Anfrage.

info@praetor-ai.tech

Technische Sitzung anfragen

§ WEITERLESEN