Como funciona uma plataforma agêntica em wealth: A Mente, Os Agentes, O Fluxo

"Plataforma agêntica" é um termo que aparece com frequência crescente em apresentações de tecnologia para o setor financeiro. Como todo termo que ganha velocidade de adoção, corre o risco de perder precisão no caminho. Este ensaio é o oposto de um pitch — é uma descrição técnica e funcional de como uma plataforma agêntica para wealth management funciona, escrita para quem vai avaliar a arquitetura, não para quem precisa ser convencido de que a categoria existe.

A estrutura tem 3 camadas: A Mente (grafo de memória persistente), Os Agentes (força de trabalho autônoma coordenada) e O Fluxo (ciclo comercial de ponta a ponta). Ao final, percorremos um exemplo real — uma mensagem de WhatsApp que chega às 14:23 e o que acontece nos próximos 60 segundos.

A Mente — grafo de memória persistente

O ponto de partida de qualquer plataforma agêntica eficaz para wealth management é a resolução de um problema fundamental: os agentes precisam de contexto para agir bem. Sem contexto, um agente é tão útil quanto um modelo genérico — e modelos genéricos não sabem quem é seu cliente.

A Mente é um grafo de conhecimento persistente — uma representação estruturada de entidades (clientes, familiares, holdings, ativos, bankers responsáveis, eventos) e das relações entre elas. Não é um banco de dados relacional flat. É uma rede semântica que pode ser atravessada: do cliente ao portfólio, do portfólio aos ativos, dos ativos aos eventos de mercado que os afetam, dos eventos às interações registradas, das interações ao contexto emocional e estratégico capturado.

O que o grafo contém

01 Perfil do cliente — dados cadastrais, suitability classificado com granularidade (não apenas "conservador" mas o que isso significa para esse cliente: quais ativos aceita, quais rejeita, qual o horizonte, qual o contexto emocional de risco).
02 Holdings e posições — estrutura patrimonial completa: ativos sob custódia, participações societárias, holdings, offshore, imóveis se relevantes, com atualização via feeds de custódia.
03 Histórico de interações — não apenas "ligação — OK" mas o conteúdo estruturado de cada conversa relevante: temas discutidos, preocupações expressadas, compromissos assumidos, tom e contexto emocional.
04 Rede familiar e patrimonial — cônjuge, filhos, herdeiros, sócios, relações que têm implicações para a gestão do patrimônio e para decisões de suitability e compliance.
05 Eventos de mercado conectados — news e eventos mapeados às posições afetadas, com relevância calculada por cliente. Não as 500 notícias do dia — as 3 que importam para este cliente específico.

O grafo é alimentado por múltiplas fontes: feeds de custódia, transcrições de WhatsApp processadas, anotações de reunião dos bankers, feeds de notícias filtrados, e enriquecimento agendado por agentes especializados. Cada dado novo é inserido com timestamp, fonte e contexto — criando uma linha do tempo auditável de tudo que o sistema sabe sobre cada cliente.

"A Mente não é um banco de dados com busca. É o que um banker com 15 anos de casa sabe — mas disponível a qualquer agente, instantaneamente, sem degradação por turnover."

Os Agentes — força de trabalho coordenada

O segundo pilar é a força de trabalho agêntica — um conjunto de agentes especializados que operam sobre o grafo de memória, coordenados por um orquestrador central. Cada agente tem um escopo de responsabilidade bem definido, permissões delimitadas e um modo de operação específico (ativo ou reativo, agendado ou event-driven).

Concierge — o ponto de entrada

O Concierge é o agente de intake — o ponto de contato entre o mundo externo e o sistema. Toda mensagem inbound passa pelo Concierge: WhatsApp de cliente, email, solicitação de banker. O Concierge identifica a intenção, classifica a urgência, resolve o que pode resolver dentro de suas permissões e encaminha para os agentes especializados o que requer processamento adicional.

Oghma — o orquestrador

Oghma é o orquestrador central — o agente que recebe tarefas complexas e as decompõe em subtarefas distribuídas entre os agentes especializados. Quando uma reunião está agendada, Oghma não gera o briefing sozinho — ele instrui o agente de portfolio a atualizar posições, o agente de suitability a verificar o perfil, o agente de news a filtrar eventos relevantes, o agente de compliance a checar pendências. Recebe os resultados e sintetiza o briefing final.

Oghma mantém o estado de cada tarefa em andamento, gerencia dependências entre subtarefas, e garante que falhas em agentes individuais não bloqueiem o resultado final. É LLM-agnóstico — pode orquestrar agentes que rodam sobre Anthropic Claude, OpenAI GPT, modelos open-source, ou uma combinação.

Agentes especializados

Investments Agent — acessa posições do grafo, calcula exposição, identifica concentração, compara com benchmark e política de investimentos do cliente. Gera análise de portfólio estruturada, não narrativa genérica.
Suitability Agent — verifica se uma comunicação proposta, uma alocação sugerida ou uma oferta está dentro do perfil suitability classificado para aquele cliente específico. Sinaliza divergências antes que cheguem ao banker.
Compliance Agent — aplica regras configuradas por compliance officers da instituição sobre todas as comunicações de saída. Verifica restrições Anbima, CVM, e políticas internas. Gera audit trail de cada decisão.
Briefing Agent — sintetiza todos os inputs dos outros agentes em um documento estruturado, legível em menos de 60 segundos, no formato que o banker reconhece e usa.
News Agent — processa feeds de notícias e filtra por relevância para o portfólio de cada cliente. Não envia o que é "notícia importante" — envia o que é importante para este cliente, com base nos ativos que ele tem.
WhatsApp Analyst — processa mensagens inbound de WhatsApp: transcreve áudios, identifica intenção, extrai compromissos assumidos, atualiza o grafo com o conteúdo da interação, propõe resposta para revisão do banker.

"Cada agente tem permissões delimitadas. Nenhum agente toma decisões fora do seu escopo. O banker permanece na linha de aprovação para todas as ações que têm consequências externas."

O Fluxo — um exemplo real

Teoria é necessária mas insuficiente. Percorremos um exemplo concreto: uma mensagem de WhatsApp que chega às 14:23. O cliente é o Sr. Monteiro, patriarca de uma família com patrimônio sob gestão em um banco com private banking. A mensagem diz: "Preciso falar sobre o que está acontecendo com o fundo. Estou preocupado."

14:23:01 — Mensagem recebida

A mensagem entra pelo canal de integração do WhatsApp Business API. O Concierge a recebe, identifica o remetente como Sr. Monteiro (via número mapeado no grafo), classifica a intenção como "preocupação com performance — requer briefing urgente" e aciona Oghma com prioridade alta.

14:23:04 — Oghma decompõe a tarefa

Oghma lê o contexto do Sr. Monteiro no grafo: perfil suitability moderado-conservador, 42% da carteira em fundos multimercado, a última interação registrada foi há 12 dias. Decompõe em subtarefas paralelas: (1) Investments Agent: performance dos fundos na carteira nos últimos 30 dias; (2) News Agent: eventos de mercado relevantes para a carteira do Sr. Monteiro; (3) WhatsApp Analyst: histórico de interações anteriores sobre o tema de performance.

14:23:08 — Agentes em paralelo

Investments Agent puxa as posições do grafo e calcula: o fundo de referência na carteira do Sr. Monteiro caiu 3,2% no mês, contra benchmark de −1,8%. News Agent identifica que há dois artigos relevantes publicados nos últimos 48 horas sobre o setor de exposição do fundo. WhatsApp Analyst encontra no histórico que em março o Sr. Monteiro expressou desconforto com volatilidade acima de 2% mensal e que o banker atual comprometeu-se a ligar caso o fundo ultrapassasse esse nível.

14:23:19 — Síntese e proposta de resposta

Oghma recebe os resultados dos 3 agentes, aciona o Suitability Agent para confirmar que uma resposta de "contexto + sugestão de ligação" está dentro do escopo, e o Compliance Agent para verificar que nenhuma informação na resposta proposta viola as políticas de comunicação. Com aprovação de ambos, o Briefing Agent sintetiza uma mensagem de resposta para o Sr. Monteiro e um memo interno para o banker responsável.

14:23:41 — Banker recebe o pacote

O banker recebe no painel: (1) contexto completo do Sr. Monteiro, atualizado com a mensagem de hoje; (2) análise de performance do fundo com contexto de mercado; (3) o compromisso de março que não foi cumprido — o banker deveria ter ligado quando a volatilidade ultrapassou 2%; (4) rascunho de resposta para WhatsApp, aguardando aprovação; (5) sugestão de agendar ligação para os próximos 30 minutos.

O banker aprova a mensagem com um clique, ajusta dois termos, e a resposta é enviada. A interação é registrada no grafo. O compromisso de março é atualizado como "pendente — resolvido com ligação agendada". Tudo isso entre 14:23 e 14:24.

Segurança, isolamento e deploy — para o comprador técnico

As perguntas que todo CIO e CTO de banco ou gestora faz neste ponto são previsíveis — e legítimas. Respondemos diretamente:

Isolamento multi-tenant

Cada tenant (cada banco, cada área, cada segmento) opera com grafo completamente isolado. Não há compartilhamento de dados entre tenants. Um banco com private banking e asset management na mesma instituição pode configurar tenants separados com políticas de compliance distintas, sem cruzamento de dados entre as áreas.

Deploy on-premise

A plataforma roda no VPS ou data center da instituição. Coolify, Kubernetes, ou VM tradicional — a escolha é da instituição. Os dados dos clientes nunca saem para servidores de terceiros. O LLM que os agentes usam pode ser self-hosted (modelos open-source) ou via API com contratos enterprise que garantem que dados não são usados para treinamento. A instituição escolhe — e mantém auditabilidade total sobre onde os dados estão.

Audit trail

Toda ação de agente é registrada: qual agente executou, com quais inputs, com qual output, em qual timestamp, com qual resultado. Para fins de CVM, Anbima e supervisão interna de compliance, o audit trail é completo e imutável. Decisões de agentes que geram comunicações com clientes ficam registradas com o contexto completo que levou àquela decisão.

LLM-agnóstico

Nenhum agente está acoplado a um provedor específico de modelo de linguagem. A instituição pode usar Anthropic Claude para o orquestrador e um modelo open-source self-hosted para o compliance agent — ou qualquer outra combinação. Isso é especialmente relevante para instituições que têm restrições regulatórias sobre o uso de provedores cloud específicos ou que têm roadmap de soberania de dados no médio prazo.

"Não é mágica. É arquitetura. E a arquitetura roda no seu VPS, com seus dados, sob suas políticas."

Para a instituição que está avaliando uma plataforma agêntica, a conversa técnica começa aqui — não no pitch.

Fazemos sessões de avaliação técnica com CIOs, CTOs e equipes de arquitetura de tecnologia — com acesso ao diagrama completo de componentes, mapeamento de integrações com sistemas existentes e análise de fit com a infraestrutura da instituição. Modelo comercial sob consulta.

info@praetor-ai.tech

Solicitar sessão técnica