"Plataforma agêntica" é um termo que aparece com frequência crescente em apresentações de tecnologia para o setor financeiro. Como todo termo que ganha velocidade de adoção, corre o risco de perder precisão no caminho. Este ensaio é o oposto de um pitch — é uma descrição técnica e funcional de como uma plataforma agêntica para wealth management funciona, escrita para quem vai avaliar a arquitetura, não para quem precisa ser convencido de que a categoria existe.
A estrutura tem 3 camadas: A Mente (grafo de memória persistente), Os Agentes (força de trabalho autônoma coordenada) e O Fluxo (ciclo comercial de ponta a ponta). Ao final, percorremos um exemplo real — uma mensagem de WhatsApp que chega às 14:23 e o que acontece nos próximos 60 segundos.
A Mente — grafo de memória persistente
O ponto de partida de qualquer plataforma agêntica eficaz para wealth management é a resolução de um problema fundamental: os agentes precisam de contexto para agir bem. Sem contexto, um agente é tão útil quanto um modelo genérico — e modelos genéricos não sabem quem é seu cliente.
A Mente é um grafo de conhecimento persistente — uma representação estruturada de entidades (clientes, familiares, holdings, ativos, bankers responsáveis, eventos) e das relações entre elas. Não é um banco de dados relacional flat. É uma rede semântica que pode ser atravessada: do cliente ao portfólio, do portfólio aos ativos, dos ativos aos eventos de mercado que os afetam, dos eventos às interações registradas, das interações ao contexto emocional e estratégico capturado.
O que o grafo contém
- 01 Perfil do cliente — dados cadastrais, suitability classificado com granularidade (não apenas "conservador" mas o que isso significa para esse cliente: quais ativos aceita, quais rejeita, qual o horizonte, qual o contexto emocional de risco).
- 02 Holdings e posições — estrutura patrimonial completa: ativos sob custódia, participações societárias, holdings, offshore, imóveis se relevantes, com atualização via feeds de custódia.
- 03 Histórico de interações — não apenas "ligação — OK" mas o conteúdo estruturado de cada conversa relevante: temas discutidos, preocupações expressadas, compromissos assumidos, tom e contexto emocional.
- 04 Rede familiar e patrimonial — cônjuge, filhos, herdeiros, sócios, relações que têm implicações para a gestão do patrimônio e para decisões de suitability e compliance.
- 05 Eventos de mercado conectados — news e eventos mapeados às posições afetadas, com relevância calculada por cliente. Não as 500 notícias do dia — as 3 que importam para este cliente específico.
O grafo é alimentado por múltiplas fontes: feeds de custódia, transcrições de WhatsApp processadas, anotações de reunião dos bankers, feeds de notícias filtrados, e enriquecimento agendado por agentes especializados. Cada dado novo é inserido com timestamp, fonte e contexto — criando uma linha do tempo auditável de tudo que o sistema sabe sobre cada cliente.
"A Mente não é um banco de dados com busca. É o que um banker com 15 anos de casa sabe — mas disponível a qualquer agente, instantaneamente, sem degradação por turnover."
Os Agentes — força de trabalho coordenada
O segundo pilar é a força de trabalho agêntica — um conjunto de agentes especializados que operam sobre o grafo de memória, coordenados por um orquestrador central. Cada agente tem um escopo de responsabilidade bem definido, permissões delimitadas e um modo de operação específico (ativo ou reativo, agendado ou event-driven).
Concierge — o ponto de entrada
O Concierge é o agente de intake — o ponto de contato entre o mundo externo e o sistema. Toda mensagem inbound passa pelo Concierge: WhatsApp de cliente, email, solicitação de banker. O Concierge identifica a intenção, classifica a urgência, resolve o que pode resolver dentro de suas permissões e encaminha para os agentes especializados o que requer processamento adicional.
Oghma — o orquestrador
Oghma é o orquestrador central — o agente que recebe tarefas complexas e as decompõe em subtarefas distribuídas entre os agentes especializados. Quando uma reunião está agendada, Oghma não gera o briefing sozinho — ele instrui o agente de portfolio a atualizar posições, o agente de suitability a verificar o perfil, o agente de news a filtrar eventos relevantes, o agente de compliance a checar pendências. Recebe os resultados e sintetiza o briefing final.
Oghma mantém o estado de cada tarefa em andamento, gerencia dependências entre subtarefas, e garante que falhas em agentes individuais não bloqueiem o resultado final. É LLM-agnóstico — pode orquestrar agentes que rodam sobre Anthropic Claude, OpenAI GPT, modelos open-source, ou uma combinação.
Agentes especializados
- Investments Agent — acessa posições do grafo, calcula exposição, identifica concentração, compara com benchmark e política de investimentos do cliente. Gera análise de portfólio estruturada, não narrativa genérica.
- Suitability Agent — verifica se uma comunicação proposta, uma alocação sugerida ou uma oferta está dentro do perfil suitability classificado para aquele cliente específico. Sinaliza divergências antes que cheguem ao banker.
- Compliance Agent — aplica regras configuradas por compliance officers da instituição sobre todas as comunicações de saída. Verifica restrições Anbima, CVM, e políticas internas. Gera audit trail de cada decisão.
- Briefing Agent — sintetiza todos os inputs dos outros agentes em um documento estruturado, legível em menos de 60 segundos, no formato que o banker reconhece e usa.
- News Agent — processa feeds de notícias e filtra por relevância para o portfólio de cada cliente. Não envia o que é "notícia importante" — envia o que é importante para este cliente, com base nos ativos que ele tem.
- WhatsApp Analyst — processa mensagens inbound de WhatsApp: transcreve áudios, identifica intenção, extrai compromissos assumidos, atualiza o grafo com o conteúdo da interação, propõe resposta para revisão do banker.
"Cada agente tem permissões delimitadas. Nenhum agente toma decisões fora do seu escopo. O banker permanece na linha de aprovação para todas as ações que têm consequências externas."
O Fluxo — um exemplo real
Teoria é necessária mas insuficiente. Percorremos um exemplo concreto: uma mensagem de WhatsApp que chega às 14:23. O cliente é o Sr. Monteiro, patriarca de uma família com patrimônio sob gestão em um banco com private banking. A mensagem diz: "Preciso falar sobre o que está acontecendo com o fundo. Estou preocupado."
14:23:01 — Mensagem recebida
A mensagem entra pelo canal de integração do WhatsApp Business API. O Concierge a recebe, identifica o remetente como Sr. Monteiro (via número mapeado no grafo), classifica a intenção como "preocupação com performance — requer briefing urgente" e aciona Oghma com prioridade alta.
14:23:04 — Oghma decompõe a tarefa
Oghma lê o contexto do Sr. Monteiro no grafo: perfil suitability moderado-conservador, 42% da carteira em fundos multimercado, a última interação registrada foi há 12 dias. Decompõe em subtarefas paralelas: (1) Investments Agent: performance dos fundos na carteira nos últimos 30 dias; (2) News Agent: eventos de mercado relevantes para a carteira do Sr. Monteiro; (3) WhatsApp Analyst: histórico de interações anteriores sobre o tema de performance.
14:23:08 — Agentes em paralelo
Investments Agent puxa as posições do grafo e calcula: o fundo de referência na carteira do Sr. Monteiro caiu 3,2% no mês, contra benchmark de −1,8%. News Agent identifica que há dois artigos relevantes publicados nos últimos 48 horas sobre o setor de exposição do fundo. WhatsApp Analyst encontra no histórico que em março o Sr. Monteiro expressou desconforto com volatilidade acima de 2% mensal e que o banker atual comprometeu-se a ligar caso o fundo ultrapassasse esse nível.
14:23:19 — Síntese e proposta de resposta
Oghma recebe os resultados dos 3 agentes, aciona o Suitability Agent para confirmar que uma resposta de "contexto + sugestão de ligação" está dentro do escopo, e o Compliance Agent para verificar que nenhuma informação na resposta proposta viola as políticas de comunicação. Com aprovação de ambos, o Briefing Agent sintetiza uma mensagem de resposta para o Sr. Monteiro e um memo interno para o banker responsável.
14:23:41 — Banker recebe o pacote
O banker recebe no painel: (1) contexto completo do Sr. Monteiro, atualizado com a mensagem de hoje; (2) análise de performance do fundo com contexto de mercado; (3) o compromisso de março que não foi cumprido — o banker deveria ter ligado quando a volatilidade ultrapassou 2%; (4) rascunho de resposta para WhatsApp, aguardando aprovação; (5) sugestão de agendar ligação para os próximos 30 minutos.
O banker aprova a mensagem com um clique, ajusta dois termos, e a resposta é enviada. A interação é registrada no grafo. O compromisso de março é atualizado como "pendente — resolvido com ligação agendada". Tudo isso entre 14:23 e 14:24.
Segurança, isolamento e deploy — para o comprador técnico
As perguntas que todo CIO e CTO de banco ou gestora faz neste ponto são previsíveis — e legítimas. Respondemos diretamente:
Isolamento multi-tenant
Cada tenant (cada banco, cada área, cada segmento) opera com grafo completamente isolado. Não há compartilhamento de dados entre tenants. Um banco com private banking e asset management na mesma instituição pode configurar tenants separados com políticas de compliance distintas, sem cruzamento de dados entre as áreas.
Deploy on-premise
A plataforma roda no VPS ou data center da instituição. Coolify, Kubernetes, ou VM tradicional — a escolha é da instituição. Os dados dos clientes nunca saem para servidores de terceiros. O LLM que os agentes usam pode ser self-hosted (modelos open-source) ou via API com contratos enterprise que garantem que dados não são usados para treinamento. A instituição escolhe — e mantém auditabilidade total sobre onde os dados estão.
Audit trail
Toda ação de agente é registrada: qual agente executou, com quais inputs, com qual output, em qual timestamp, com qual resultado. Para fins de CVM, Anbima e supervisão interna de compliance, o audit trail é completo e imutável. Decisões de agentes que geram comunicações com clientes ficam registradas com o contexto completo que levou àquela decisão.
LLM-agnóstico
Nenhum agente está acoplado a um provedor específico de modelo de linguagem. A instituição pode usar Anthropic Claude para o orquestrador e um modelo open-source self-hosted para o compliance agent — ou qualquer outra combinação. Isso é especialmente relevante para instituições que têm restrições regulatórias sobre o uso de provedores cloud específicos ou que têm roadmap de soberania de dados no médio prazo.
"Não é mágica. É arquitetura. E a arquitetura roda no seu VPS, com seus dados, sob suas políticas."
Para a instituição que está avaliando uma plataforma agêntica, a conversa técnica começa aqui — não no pitch.
Fazemos sessões de avaliação técnica com CIOs, CTOs e equipes de arquitetura de tecnologia — com acesso ao diagrama completo de componentes, mapeamento de integrações com sistemas existentes e análise de fit com a infraestrutura da instituição. Modelo comercial sob consulta.
Solicitar sessão técnica