PRÆTOR · ENSAIO

2026-05-23 · 9 MIN · ARQUITETURA TÉCNICA

Como funciona uma plataforma agêntica em wealth: A Mente, Os Agentes, O Fluxo

Para a CIO ou o CTO da instituição que está avaliando: não é mágica. É arquitetura. E aqui está o que está dentro da caixa.

9 min de leitura · Equipe PRÆTOR

"Plataforma agêntica" é um termo que aparece com frequência crescente em apresentações de tecnologia para o setor financeiro. Como todo termo que ganha velocidade de adoção, corre o risco de perder precisão no caminho. Este ensaio é o oposto de um pitch — é uma descrição técnica e funcional de como uma plataforma agêntica para wealth management funciona, escrita para quem vai avaliar a arquitetura, não para quem precisa ser convencido de que a categoria existe.

A estrutura tem 3 camadas: A Mente (grafo de memória persistente), Os Agentes (força de trabalho autônoma coordenada) e O Fluxo (ciclo comercial de ponta a ponta). Ao final, percorremos um exemplo real — uma mensagem de WhatsApp que chega às 14:23 e o que acontece nos próximos 60 segundos.

A Mente — grafo de memória persistente

O ponto de partida de qualquer plataforma agêntica eficaz para wealth management é a resolução de um problema fundamental: os agentes precisam de contexto para agir bem. Sem contexto, um agente é tão útil quanto um modelo genérico — e modelos genéricos não sabem quem é seu cliente.

A Mente é um grafo de conhecimento persistente — uma representação estruturada de entidades (clientes, familiares, holdings, ativos, bankers responsáveis, eventos) e das relações entre elas. Não é um banco de dados relacional flat. É uma rede semântica que pode ser atravessada: do cliente ao portfólio, do portfólio aos ativos, dos ativos aos eventos de mercado que os afetam, dos eventos às interações registradas, das interações ao contexto emocional e estratégico capturado.

O que o grafo contém

O grafo é alimentado por múltiplas fontes: feeds de custódia, transcrições de WhatsApp processadas, anotações de reunião dos bankers, feeds de notícias filtrados, e enriquecimento agendado por agentes especializados. Cada dado novo é inserido com timestamp, fonte e contexto — criando uma linha do tempo auditável de tudo que o sistema sabe sobre cada cliente.

"A Mente não é um banco de dados com busca. É o que um banker com 15 anos de casa sabe — mas disponível a qualquer agente, instantaneamente, sem degradação por turnover."

Os Agentes — força de trabalho coordenada

O segundo pilar é a força de trabalho agêntica — um conjunto de agentes especializados que operam sobre o grafo de memória, coordenados por um orquestrador central. Cada agente tem um escopo de responsabilidade bem definido, permissões delimitadas e um modo de operação específico (ativo ou reativo, agendado ou event-driven).

Concierge — o ponto de entrada

O Concierge é o agente de intake — o ponto de contato entre o mundo externo e o sistema. Toda mensagem inbound passa pelo Concierge: WhatsApp de cliente, email, solicitação de banker. O Concierge identifica a intenção, classifica a urgência, resolve o que pode resolver dentro de suas permissões e encaminha para os agentes especializados o que requer processamento adicional.

Oghma — o orquestrador

Oghma é o orquestrador central — o agente que recebe tarefas complexas e as decompõe em subtarefas distribuídas entre os agentes especializados. Quando uma reunião está agendada, Oghma não gera o briefing sozinho — ele instrui o agente de portfolio a atualizar posições, o agente de suitability a verificar o perfil, o agente de news a filtrar eventos relevantes, o agente de compliance a checar pendências. Recebe os resultados e sintetiza o briefing final.

Oghma mantém o estado de cada tarefa em andamento, gerencia dependências entre subtarefas, e garante que falhas em agentes individuais não bloqueiem o resultado final. É LLM-agnóstico — pode orquestrar agentes que rodam sobre Anthropic Claude, OpenAI GPT, modelos open-source, ou uma combinação.

Agentes especializados

"Cada agente tem permissões delimitadas. Nenhum agente toma decisões fora do seu escopo. O banker permanece na linha de aprovação para todas as ações que têm consequências externas."

O Fluxo — um exemplo real

Teoria é necessária mas insuficiente. Percorremos um exemplo concreto: uma mensagem de WhatsApp que chega às 14:23. O cliente é o Sr. Monteiro, patriarca de uma família com patrimônio sob gestão em um banco com private banking. A mensagem diz: "Preciso falar sobre o que está acontecendo com o fundo. Estou preocupado."

14:23:01 — Mensagem recebida

A mensagem entra pelo canal de integração do WhatsApp Business API. O Concierge a recebe, identifica o remetente como Sr. Monteiro (via número mapeado no grafo), classifica a intenção como "preocupação com performance — requer briefing urgente" e aciona Oghma com prioridade alta.

14:23:04 — Oghma decompõe a tarefa

Oghma lê o contexto do Sr. Monteiro no grafo: perfil suitability moderado-conservador, 42% da carteira em fundos multimercado, a última interação registrada foi há 12 dias. Decompõe em subtarefas paralelas: (1) Investments Agent: performance dos fundos na carteira nos últimos 30 dias; (2) News Agent: eventos de mercado relevantes para a carteira do Sr. Monteiro; (3) WhatsApp Analyst: histórico de interações anteriores sobre o tema de performance.

14:23:08 — Agentes em paralelo

Investments Agent puxa as posições do grafo e calcula: o fundo de referência na carteira do Sr. Monteiro caiu 3,2% no mês, contra benchmark de −1,8%. News Agent identifica que há dois artigos relevantes publicados nos últimos 48 horas sobre o setor de exposição do fundo. WhatsApp Analyst encontra no histórico que em março o Sr. Monteiro expressou desconforto com volatilidade acima de 2% mensal e que o banker atual comprometeu-se a ligar caso o fundo ultrapassasse esse nível.

14:23:19 — Síntese e proposta de resposta

Oghma recebe os resultados dos 3 agentes, aciona o Suitability Agent para confirmar que uma resposta de "contexto + sugestão de ligação" está dentro do escopo, e o Compliance Agent para verificar que nenhuma informação na resposta proposta viola as políticas de comunicação. Com aprovação de ambos, o Briefing Agent sintetiza uma mensagem de resposta para o Sr. Monteiro e um memo interno para o banker responsável.

14:23:41 — Banker recebe o pacote

O banker recebe no painel: (1) contexto completo do Sr. Monteiro, atualizado com a mensagem de hoje; (2) análise de performance do fundo com contexto de mercado; (3) o compromisso de março que não foi cumprido — o banker deveria ter ligado quando a volatilidade ultrapassou 2%; (4) rascunho de resposta para WhatsApp, aguardando aprovação; (5) sugestão de agendar ligação para os próximos 30 minutos.

O banker aprova a mensagem com um clique, ajusta dois termos, e a resposta é enviada. A interação é registrada no grafo. O compromisso de março é atualizado como "pendente — resolvido com ligação agendada". Tudo isso entre 14:23 e 14:24.

Segurança, isolamento e deploy — para o comprador técnico

As perguntas que todo CIO e CTO de banco ou gestora faz neste ponto são previsíveis — e legítimas. Respondemos diretamente:

Isolamento multi-tenant

Cada tenant (cada banco, cada área, cada segmento) opera com grafo completamente isolado. Não há compartilhamento de dados entre tenants. Um banco com private banking e asset management na mesma instituição pode configurar tenants separados com políticas de compliance distintas, sem cruzamento de dados entre as áreas.

Deploy on-premise

A plataforma roda no VPS ou data center da instituição. Coolify, Kubernetes, ou VM tradicional — a escolha é da instituição. Os dados dos clientes nunca saem para servidores de terceiros. O LLM que os agentes usam pode ser self-hosted (modelos open-source) ou via API com contratos enterprise que garantem que dados não são usados para treinamento. A instituição escolhe — e mantém auditabilidade total sobre onde os dados estão.

Audit trail

Toda ação de agente é registrada: qual agente executou, com quais inputs, com qual output, em qual timestamp, com qual resultado. Para fins de CVM, Anbima e supervisão interna de compliance, o audit trail é completo e imutável. Decisões de agentes que geram comunicações com clientes ficam registradas com o contexto completo que levou àquela decisão.

LLM-agnóstico

Nenhum agente está acoplado a um provedor específico de modelo de linguagem. A instituição pode usar Anthropic Claude para o orquestrador e um modelo open-source self-hosted para o compliance agent — ou qualquer outra combinação. Isso é especialmente relevante para instituições que têm restrições regulatórias sobre o uso de provedores cloud específicos ou que têm roadmap de soberania de dados no médio prazo.

"Não é mágica. É arquitetura. E a arquitetura roda no seu VPS, com seus dados, sob suas políticas."

Para a instituição que está avaliando uma plataforma agêntica, a conversa técnica começa aqui — não no pitch.

Fazemos sessões de avaliação técnica com CIOs, CTOs e equipes de arquitetura de tecnologia — com acesso ao diagrama completo de componentes, mapeamento de integrações com sistemas existentes e análise de fit com a infraestrutura da instituição. Modelo comercial sob consulta.

info@praetor-ai.tech

Solicitar sessão técnica

§ LEIA TAMBÉM